A OpenAI anunciou novos recursos de voz em sua API, incluindo o GPT-Realtime-2, que traz raciocínio baseado no GPT-5 para conversas mais complexas. A empresa também lançou o GPT-Realtime-Translate, com suporte a mais de 70 idiomas de entrada e 13 de saída, e o GPT-Realtime-Whisper, para transcrição ao vivo.
As atualizações permitem que desenvolvedores criem aplicações com capacidade de ouvir, raciocinar, traduzir e agir durante conversas. A OpenAI destaca benefícios para setores como educação, mídia, eventos e plataformas de criadores, além de serviços ao cliente.
Para evitar abusos, a empresa implementou barreiras de segurança que interrompem conversas que violam diretrizes de conteúdo prejudicial. A iniciativa busca evoluir a interação por voz de simples comandos para assistentes que realizam tarefas complexas em tempo real.

