Nature:人工智能再次战胜人类! 心功能评估超过超声医师
时间:2023-05-14 18:45:19 热度:37.1℃ 作者:网络
心脏疾病是全球最常见的死因之一,而左室射血分数(LVEF)是评估心脏功能的重要指标之一。然而,传统的LVEF评估方法往往依赖于主观的人工追踪,因此存在异质性和差异性。同时,由于临床限制,人工重复多次测量LVEF的做法也很少被采用。
近年来,人工智能技术的迅猛发展为解决这一问题提供了新的思路。人工智能算法可以自动评估LVEF,从而提高其精度和一致性。然而目前为止,采用盲法和随机对照试验,来验证其在医学应用上的安全性和有效性的人工智能技术仍然很少。
为了填补这一空白,洛杉矶西达赛奈医疗中心David Ouyang/Susan Cheng和斯坦福大学James Y. Zou 研究团队,设计了一个盲法、随机的非劣效性临床试验,探索由人工智能和超声医师进行的LVEF初始评估对最终心脏科医师评估结果的影响,研究结果表明,AI的初步评估与超声医师的评估相比,具有相同的非劣效性和更高的优越性,且心脏科专家无法区分AI和超声技师的初步评估。相关成果以“Blinded, randomized trial of sonographer versus AI cardiac function assessment”发表于最新一期Nature。
该研究纳入了共3769例胸部超声心动图,并由平均从业年限超过10年的25名超声医生和10名心脏科医生参与对比分析。将符合条件的图像按1:1的比例随机分给AI组和超声医师组进行评估,心脏病专家收到带有初始注释的完整超声心动图研究后,对LVEF进行最终的盲法评估。
主要安全性结果显示,AI组中有292个检查(16.8%)与初步评估结果存在显著差异,而在超声医师组中有478个检查(27.2%)存在显著差异。AI组的LVEF初始评估结果与最终评估结果的平均绝对差为2.79%,而在超声医师组中为3.77%。人工智能初步评估超声心动图的准确度和可靠性优于经验丰富的超声医师。
筛选、随机化以及随访
次要安全性结果表明,AI组和最终心脏病专家评估之间的平均绝对差异为6.29%,而超声技师组为7.23%,表明人工智能更为准确。此外,AI组在评估速度上也比超声医师组更快,AI组初始评估平均用时54秒,而超声医师组为64秒。
除了评估人工智能在临床试验中的影响,研究团队还进行了迄今为止对临床医生评估LVEF的差异性进行的最大的测试-复测评估。在我们的研究中,重复的LVEF评估中,医师之间差异程度与以前的研究一致,而人工智能的引入减少了独立临床医生评估之间的差异。
AI与超声医师对比
“该试验成果令人兴奋。这意味着在未来,如果以正确的方式开发和整合AI算法,不仅可以非常有效地提高输出的质量,还可以通过简化原本繁琐但重要的任务,节省时间和精力,提高超声医师和心脏病专家的效率。”David Ouyang总结说,”将人工智能嵌入临床工作流程,有可能提供更精确和一致的评估,从而能够更早发现病情并及时治疗。”
【小结】
本研究设计了一个盲法、随机的非劣性临床试验,评估了由人工智能和超声医师进行的LVEF初始评估,研究结果表明,使用人工智能进行初始评估与超声医师相比,其结果的准确性不逊于后者,同时还可节省医生和超声医师的时间。本研究的发现有助于促进心脏疾病的早期诊断和治疗,提高LVEF评估的精度和一致性,让人工智能更好地服务医疗健康行业。
原文链接:
https://www.nature.com/articles/s41586-023-05947-3