INTRODUÇÃO
A era dos chatbots e agentes de IA puramente textuais está prestes a ganhar uma dimensão visual. A startup Lemon Slice acaba de lançar o modelo Lemon Slice-2, uma tecnologia de difusão que promete transformar interações digitais ao gerar avatares em vídeo a partir de uma única imagem. A proposta é adicionar uma camada de interatividade visual a assistentes virtuais, que hoje dominam o suporte ao cliente, educação e até saúde mental, mas permanecem restritos ao texto.
DESENVOLVIMENTO
O Lemon Slice-2 é um modelo de difusão com 20 bilhões de parâmetros, capaz de criar um avatar digital personalizado que pode ser integrado sobre uma base de conhecimento para desempenhar diversos papéis. Como explicou a cofundadora Lina Colucci, a motivação surgiu da percepção de que o vídeo, assim como ferramentes textuais como o ChatGPT, precisa ser interativo. A tecnologia permite a transmissão ao vivo a 20 quadros por segundo utilizando uma única GPU, oferecida via API ou widget incorporável com uma linha de código.
Após a criação, os avatares são altamente customizáveis: é possível alterar plano de fundo, estilo e aparência a qualquer momento. Além de figuras humanas, a empresa foca em personagens não humanos para atender necessidades variadas, utilizando a tecnologia da ElevenLabs para gerar as vozes. Fundada em 2024, a Lemon Slice aposta que seu modelo de difusão de propósito geral, que gera dados a partir de ruído, a diferenciará da concorrência.
CONCLUSÃO
A inovação da Lemon Slice representa um passo significativo para tornar as interações com IA mais naturais e envolventes. Ao combinar avatares em vídeo gerados dinamicamente com capacidades de conversação, a empresa não apenas amplia o potencial dos chatbots existentes, mas também abre novas frentes para aplicações em educação, saúde e atendimento ao cliente. A adoção dessa tecnologia pode redefinir o padrão de experiência do usuário em plataformas digitais, tornando a comunicação com máquinas visualmente rica e personalizável.

