医疗人工智能最受“吹捧”的承诺之一,就是它们能够帮助人类临床医生更精确地解读X光和CT扫描等图像,从而作出更准确的诊断报告,增强影像科医生的表现。
但实际情况确实如此吗?
美国哈佛大学医学院、麻省理工学院和斯坦福大学的合作研究表明,使用AI工具进行图像解读的效果,似乎因临床医生而异。
换句话说,有益还是无用,现阶段还是人类说了算。因为研究结果表明,个体临床医生的差异,会以AI专家们尚未完全理解的关键方式影响着人与机器之间的互动。该分析近日发表在《自然·医学》杂志上。
考虑医生个人因素
研究表明,在某些情况下,AI的使用可能会干扰放射科医生的表现,并影响他们解释的准确性。
虽然之前的研究表明,AI助手确实可以提高医生的诊断表现,但这些研究将医生视为一个整体,而没有考虑不同医生之间的差异。在临床上,每一位医生的判断,对患者来说都是100%的。
相比之下,这项新研究着眼于临床医生的个人因素——专业领域、实践年限、之前使用AI工具的经验,并分析这些因素如何在人机协作中发挥作用。
研究人员分析了AI如何影响140名放射科医生在15项X射线诊断任务中的表现,即医生需要可靠地发现图像上的明显特征并作出准确诊断。该分析涉及324名罹患15种病症的患者病例。
为了确定AI如何影响医生发现和正确识别问题的能力,研究人员使用先进的计算方法来获取使用AI和不使用AI时的表现变化。
结果显示,AI辅助的效果在放射科医生之间不一致且各不相同,一些放射科医生的表现因AI而提高,而另一些医生的表现则“恶化”。
英国皇家医学院布拉瓦尼克研究所生物医学信息学助理教授帕兰纳福·拉普科尔确认了研究团队这一发现,并表示“我们不应该将医生视为一个统一的群体,只考虑AI对其表现的‘平均’影响”。
不过,这一发现并不意味着应该阻止医生和诊所采用AI。相反,结果表明需要更好地了解人类和AI如何互动,并设计精心校准的方法来提高而不是损害人类的表现。
AI“助手”尚难预测
鉴于影像科被认为是能得到AI最大助力的临床医学领域,本次研究结果颇具代表意义。
此次发现中值得注意的是,在放射科,AI以令人惊讶的方式产生着影响人类医生的表现。
例如,与研究人员预期相反,放射科医生有多少年的经验、他们是否专门从事胸部放射科,以及他们之前是否使用过AI设备等因素,并不能可靠地预测AI工具对他们工作表现的影响。
另一项挑战普遍观点的发现是:基线表现不佳的临床医生,并不能持续稳定地从AI中得到帮助。总体而言,无论有或没有AI,基线表现较低的放射科医生的表现还是较低。对于基线表现较好的放射科医生来说也是如此——无论有没有AI,他们的总体表现始终良好。
但可以肯定的是,更准确的AI提高了放射科医生的表现,而水平一般的AI则会降低人类临床医生的诊断准确性。
这一发现的重要意义也在于:在临床部署之前,必须测试和验证AI工具的性能,以确保劣质AI不会干扰人类临床医生的判断,从而延误患者病情。
影响临床医学未来
临床医生拥有不同水平的专业知识、经验和决策风格,因此确保AI能反映这种多样性,对于有针对性地实施治疗至关重要。个体因素及变化,应成为确保AI进步的关键,而不是干扰并最终影响诊断的因素。
有意思的是,这一发现并没有解释AI为何会对人类临床医生的表现产生不同的影响,但随着AI对临床医学的影响越来越深远,理解其中原因就显得至关重要。关于这一点,AI专家依然在努力。
研究团队补充说,下一步,放射科医生与AI的交互,应该在模拟现实场景的实验环境中展开测试,测试结果需要反映实际患者群体的情况。而除了提高AI工具的准确性之外,培训放射科医生去及时检测不准确的AI、审查并质疑AI工具的诊断,也很重要。
换言之,在AI帮你之前,你需要先提高自身。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。