INTRODUÇÃO
O Google entrou oficialmente no mercado de aplicativos de ditado com IA para dispositivos móveis. A empresa lançou discretamente nesta segunda-feira o Google AI Edge Eloquent, um app gratuito para iOS que funciona prioritariamente offline. A iniciativa coloca a gigante da tecnologia em competição direta com soluções estabelecidas como Wispr Flow, SuperWhisper e Willow, oferecendo uma abordagem focada em privacidade e processamento local.
DESENVOLVIMENTO
O aplicativo se baseia em modelos de reconhecimento automático de fala (ASR) construídos sobre o Gemma, framework de IA da Google. Após o download inicial dos modelos, o usuário pode começar a ditar imediatamente no celular, sem necessidade de conexão constante. A interface mostra a transcrição em tempo real e, ao pausar, o app filtra automaticamente palavras de preenchimento como "hum" e "ah", além de polir o texto.
Abaixo da transcrição, opções como "Pontos-chave", "Formal", "Curto" e "Longo" permitem transformar o conteúdo ditado. Um diferencial importante é o modo somente local, que desativa completamente o processamento na nuvem. Quando ativado, o modo nuvem utiliza os modelos Gemini do Google para a limpeza do texto.
O app também oferece personalização, podendo importar palavras-chave, nomes e jargões da conta do Gmail do usuário, além de permitir a adição de termos customizados. Ele mantém um histórico completo das sessões, com capacidade de busca, e exibe métricas como palavras ditadas na última sessão, velocidade em palavras por minuto e total de palavras faladas.
CONCLUSÃO
O Google AI Edge Eloquent representa um avanço significativo em acessibilidade e privacidade para ferramentas de ditado. Ao priorizar o processamento local e a edição automática de imperfeições da fala, ele entrega texto pronto para uso de forma eficiente. Embora disponível apenas para iOS no lançamento, a descrição na App Store já menciona uma versão Android, indicando a ambição da Google em dominar este segmento. A chegada da gigante deve aquecer a competição e acelerar inovações no mercado de transcrição por voz.

