Um novo estudo publicado na revista Science revelou que modelos de linguagem de grande porte, como os da OpenAI, podem superar médicos humanos em diagnósticos de emergência. Liderada por pesquisadores da Harvard Medical School e do Beth Israel Deaconess Medical Center, a pesquisa testou o desempenho dos modelos o1 e 4o em 76 casos reais de pronto-socorro.

Os diagnósticos gerados pela IA foram comparados aos de dois médicos especialistas, sem que os avaliadores soubessem a origem. "Em cada ponto de contato diagnóstico, o1 teve desempenho nominalmente superior ou equivalente aos dois médicos", afirmou o estudo. A diferença foi mais significativa no primeiro atendimento, quando há menos informações e maior urgência.

Os pesquisadores destacaram que não pré-processaram os dados: "apresentamos à IA exatamente as mesmas informações disponíveis nos prontuários". O modelo o1 acertou o diagnóstico exato ou muito próximo em 67% dos casos de triagem, contra 55% e 50% dos médicos. O estudo sugere que a IA pode ser uma ferramenta poderosa para apoiar decisões clínicas, especialmente em cenários de alta pressão.

Publicidade
Publicidade