INTRODUÇÃO

"Dê-me tokens. Apenas dê-me tokens. Eu os quero rápidos. Eu os quero baratos. Eu os quero agora." Este é o mantra dos desenvolvedores que constroem software em modelos de IA generativa, segundo Mike Henry, CEO da Parasail. A startup, que saiu do modo stealth há um ano, acaba de levantar US$ 32 milhões em uma Série A para escalar seu serviço de computação em nuvem especializado em inferência de IA, processando impressionantes 500 bilhões de tokens por dia.

DESENVOLVIMENTO

Publicidade
Publicidade

Com experiência em design físico de chips e uma passagem pela Groq, Henry percebeu cedo a necessidade dos desenvolvedores por processamento em nuvem otimizado para IA. A Parasail adota uma abordagem híbrida: enquanto possui alguns de seus próprios GPUs, a empresa aluga principalmente tempo de processamento em 40 data centers em 15 países e compra mais em mercados de liquidez, orquestrando tudo nos bastidores para reduzir custos. A estratégia é alocar cargas de trabalho de forma inteligente e evitar picos de demanda, competindo com empresas que possuem seu próprio silício, mas podem estar limitadas por compromissos existentes.

CONCLUSÃO

O potencial da Parasail depende da proliferação contínua de modelos de código aberto e agentes fora dos laboratórios de ponta. Executivos e investidores argumentam que o custo crescente e o atrito no uso de ofertas de empresas como Anthropic e OpenAI estão impulsionando essa tendência. Como Andreas Stuhlmüller, CEO da Elicit, observa, uma arquitetura híbrida está emergindo, sinalizando uma mudança no ecossistema de IA em direção a soluções mais acessíveis e flexíveis.