INTRODUÇÃO
"Dê-me tokens. Apenas dê-me tokens. Eu os quero rápidos. Eu os quero baratos. Eu os quero agora." Este é o mantra dos desenvolvedores que constroem software em modelos de IA generativa, segundo Mike Henry, CEO da Parasail. A startup, que saiu do modo stealth há um ano, acaba de levantar US$ 32 milhões em uma Série A para escalar seu serviço de computação em nuvem especializado em inferência de IA, processando impressionantes 500 bilhões de tokens por dia.
DESENVOLVIMENTO
Com experiência em design físico de chips e uma passagem pela Groq, Henry percebeu cedo a necessidade dos desenvolvedores por processamento em nuvem otimizado para IA. A Parasail adota uma abordagem híbrida: enquanto possui alguns de seus próprios GPUs, a empresa aluga principalmente tempo de processamento em 40 data centers em 15 países e compra mais em mercados de liquidez, orquestrando tudo nos bastidores para reduzir custos. A estratégia é alocar cargas de trabalho de forma inteligente e evitar picos de demanda, competindo com empresas que possuem seu próprio silício, mas podem estar limitadas por compromissos existentes.
CONCLUSÃO
O potencial da Parasail depende da proliferação contínua de modelos de código aberto e agentes fora dos laboratórios de ponta. Executivos e investidores argumentam que o custo crescente e o atrito no uso de ofertas de empresas como Anthropic e OpenAI estão impulsionando essa tendência. Como Andreas Stuhlmüller, CEO da Elicit, observa, uma arquitetura híbrida está emergindo, sinalizando uma mudança no ecossistema de IA em direção a soluções mais acessíveis e flexíveis.

