生成式AI在医疗诊断中表现相当于非专家医生，未来或助力医学教育

时间：2025-05-12 18:15

小编：星品数码网

近期，大阪都会大学医学研究生院的Hirotaka Takita博士和Daiju Ueda副教授带领的研究小组发布了针对生成式人工智能（AI）在医疗诊断表现的系统性回顾和荟萃分析。这项研究的核心在于探讨生成式AI在不同医疗条件下的诊断准确率，并将其与非专家医生进行比较。通过对18371项相关研究的筛选与分析，最终确定83项进行深入探讨，其中涉及多种生成式AI模型，如GPT-4、Llama3 70B、Gemini 1.5 Pro和Claude 3 Sonnet。这些研究覆盖了各种医疗领域，为我们理解生成式AI在医学中的应用提供了重要数据。

研究结果显示，生成式AI在多种医疗诊断中的准确率与非专家医生相当，具体结果为47%至57%之间，准确率差异仅为0.6%，这在统计上没有显著意义（p=0.93）。在某些特定条件下，AI的表现显示出一定的差距，准确率差距最高可达到15.8%（95%置信区间：4.4% 27.1%，p=0.007）。这表明，尽管目前生成式AI的性能相当于非专家医生，但随着技术的不断进步，这一差距有望进一步缩小。

研究还表明，生成式AI在不同医学专科的表现差异相对较小，仅在皮肤科和泌尿科这两个领域表现出显著的不同。在皮肤科领域，由于疾病的诊断往往依赖于模式识别，这正是AI的强项，因此AI在该领域表现优秀。皮肤科诊断也需要复杂的推理能力，AI的优势并不代表其能够完美应对临床实际的复杂性。相反，在泌尿科的研究结果主要基于单一大规模研究，因此其的普适性受到质疑。

从临床角度来看，该研究的结果为生成式AI在医疗实践中的应用提供了现实意义。Takita博士指出，生成式AI不仅可以帮助非专家医生在资源有限的地区提供支持，还可以辅助医生进行诊断。未来的研究需要在复杂的临床环境中进行深入评估，使用真实病例来提高AI的决策透明度，确保其在不同患者群体中的有效性。

更加令人关注的是，研究还探讨了生成式AI在医学教育中的潜力。由于生成式AI在非专家环境下展现出的与医生相近的表现，这为在医学中整合人工智能提供了新的可能性。AI可以被用来模拟真实病例，为医学生和受训者提供宝贵的学习与评估机会，进而提升他们的临床技能。

尽管生成式AI展示出了令人鼓舞的潜力，研究者们也对其透明度和潜在偏见表示了担忧。很多AI系统并未公开其训练数据的详细信息，这引发了对于结果是否适用于不同人群的质疑。研究者强调，确保模型的透明度对于理解其知识、背景及局限性至关重要，并呼吁开发符合伦理、经过充分验证的AI应用。

当前，虽然生成式AI在医疗诊断上展现出巨大的前景，但在涉及详细患者信息的复杂情况下，依然存在诸多挑战。在未来的医疗环境中，医生是否会因此担忧失去工作尚无定论，但不可否认的是，AI与医生之间的分工和合作将是必然的趋势。AI的应用不仅能够提升诊断的效率，还可能重新定义医务工作者的角色。

来看，生成式AI在医疗诊断中的表现与非专家医生相当，为该领域带来了新的机遇。同时，其在医学教育中的应用前景也为未来的医务工作培养奠定了基础。伴随这些前景的，还有对AI透明度、偏见等问题的深刻反思。因此，未来的发展不仅需要关注技术的进步，更需加强伦理和规范的建设，以确保生成式AI能够在医疗领域真正发挥其积极作用。

生成式AI在医疗诊断中表现相当于非专家医生，未来或助力医学教育

精品推荐

相关文章