INTRODUÇÃO
O laboratório indiano de inteligência artificial Sarvam anunciou nesta terça-feira uma nova geração de modelos de linguagem de grande porte (LLMs), posicionando-se como uma alternativa de código aberto e mais eficiente aos sistemas caros oferecidos por rivais norte-americanos e chineses. O lançamento, feito durante o India AI Impact Summit em Nova Delhi, reflete uma estratégia nacional de reduzir a dependência de plataformas estrangeiras e desenvolver soluções adaptadas a idiomas e casos de uso locais.
DESENVOLVIMENTO
A nova linha inclui modelos com 30 bilhões e 105 bilhões de parâmetros, além de sistemas de texto-para-voz, voz-para-texto e um modelo de visão para análise de documentos. Essa é uma evolução significativa em relação ao modelo Sarvam 1, de 2 bilhões de parâmetros, lançado em outubro de 2024. Os modelos maiores utilizam uma arquitetura "mixture-of-experts", que ativa apenas uma fração dos parâmetros totais por vez, reduzindo drasticamente os custos computacionais. O modelo de 30B suporta uma janela de contexto de 32.000 tokens para uso conversacional em tempo real, enquanto o de 105B oferece 128.000 tokens para tarefas de raciocínio mais complexas.
CONCLUSÃO
A Sarvam treinou os modelos do zero, sem ajuste fino em sistemas de código aberto existentes, usando recursos computacionais da iniciativa governamental IndiaAI Mission. Com foco em aplicações práticas, como assistentes baseados em voz e chats em idiomas indianos, a startup planeja uma expansão medida, priorizando a implementação no mundo real em vez do tamanho bruto dos modelos. Essa abordagem pode ajudar a Índia a conquistar espaço no mercado global de IA.

