O estudo americano testou a racionalização de 21 modelos de LLM (Large Language Model) diferentes — incluindo ChatGPT, Deep Seek, Gemini e Claude, os quatro mais conhecidos — em 29 casos clínicos usados para treinamento de médicos, com sintomas, resultados de exames e histórico médico.



