医疗人工智能以更快的速度和更高的准确率,战胜多位神经疾病专家组成的“人类战队”。
看片子,人脑电脑谁更强?日前,神经影像领域一场“人机大战”在北京落幕。医疗人工智能以更快的速度和更高的准确率,战胜多位神经疾病专家组成的“人类战队”。专家表示,人工智能有望将医生从繁重的读片诊断中解放出来,有更多时间做研究、给病人以温暖,节省患者看病成本。同时,专家也提醒,影像判读不是单纯看片子,对患者的病史也要有了解。不同疾病有时会有相同表现,需要医生通过多年的积累综合判断。
备受关注的神经影像领域“人机大战”,日前在北京落下帷幕。大赛由国家神经系统疾病临床医学研究中心、首都医科大学人脑保护高精尖创新中心和中国卒中学会联合主办。人工智能(AI)选手“BioMindTM天医智”以高出20%的正确率,战胜了来自全球神经系统疾病诊断的25名医界“最强大脑”。医疗AI将给脑科医学带来哪些改变?
比拼速度 电脑更快
当场内大屏幕上的倒计时还有14分钟30秒的时候,答题完毕的提示音响了。现场数百名观众不禁发出唏嘘声。原来,需要独立完成225道题目的“BioMind天医智”提前了将近15分钟“交卷”,这时的“人类战队”仍在紧张作答。
正式比赛分为AB两组。A组的一方是15名“人类战队”医生成员,由全国线上预赛产生的优胜者6名、国内神经疾病排名前列的专家7名及国外知名医院专家2名组成。每位医生需要在30分钟内对15张颅内肿瘤的CT、MRI影像进行判读及血肿预测。另一方人工智能BioMind同样需要在30分钟内完成15名医生的工作,即完成总计225道题的判读。B组共有10名医生,全部是副主任级别以上,他们进行的是脑血管疾病CT、MRI影像判读,B组每名医生需要在30分钟内判读3张片子,允许医生们进行判读结果讨论,而BioMind需要在30分钟内判读30张片子。
“人类战队”选手面前都是一台显示题目的电脑、一张纸质版的答题卡以及一支笔,答题时选手们紧紧盯着屏幕,拨动鼠标查看影像图,不时托着下巴思考。另一侧,“BioMind天医智”的屏幕上,飞快地扫过一张张片子,并快速显示出在它看来每组片子反映的脑部肿瘤疾病。
参赛的人工智能机器,由北京天坛医院与北京安德医智科技有限公司合作研发。拜师北京天坛医院神经影像学中心主任高培毅教授后,“BioMind天医智”已成为天坛医院神经影像团队最“年轻”的入室弟子。
北京天坛医院放射科副主任荆利娜是14号选手。她答题与平时看片子状态一样。15道题目里有一两道拿不准,平时如果遇上这种情况,她会写出两个答案,然后向高年资的专家请教,或者大家一起讨论一下。比赛的时候只能写一个答案,当时想了比较久。
大量样本 瞬时掌握
到底是“最强大脑”胜出,还是这个刚刚问世不久的医疗AI胜出?
此次比赛中,A组试题为高培毅从天坛医院脑肿瘤病例库中随机挑选,B组为北京天坛医院常务副院长王拥军教授从国家神经系统疾病临床医学研究中心脑出血病例库随机挑选,两组试题均非AI训练试题,为保证试题的保密性,来自北京市长安公证处的公证人员为试题挑选、封存进行了公证。
最终现场比赛结果是: A组的225例判读,AI用时15分钟准确率87%、15位医生用时30分钟准确率66%;B组:AI用时15分钟准确率83%,10位医生用时30分钟准确率63%,无论时间还是准确率,AI完胜。
荆利娜对它的速度是有心理准备的,天坛医院多年的病例汇总分析都录入了它的系统里,样本量超级大,而且是瞬时掌握,速度方面肯定比不过它。但真的没想到在准确率方面会输。
面对“BioMind天医智”两轮胜出的成绩,它的老师高培毅说,通过对北京天坛医院近十年来接诊的数万神经系统相关疾病病例影像的系统学习,“BioMind天医智”在脑膜瘤、胶质瘤等常见病领域的磁共振影像诊断能力相当于一个高级职称医师级别的水平,实力不容小觑。每种肿瘤背后,它都学习了1000个病例,目前基本上已经掌握了50种颅脑肿瘤,这是任何一名医生都难以实现的。
“对它的比赛成绩不够满意,我认为它的准确率应该在90%以上。”高培毅说,接下来他们将对AI的“丢分”原因进行研究分析。“机器训练时间不够,如果能够再多给AI一些学习时间,它将会表现更好。”王拥军说,如果AI对于血肿预测的准确率能够超过85%,国家神经系统疾病临床医学研究中心就计划启动临床验证研究。
人工智能 前景如何
速度快、准确率高,医疗AI表现令人赞叹的同时,更多人关心的是它未来将给神经医学带来哪些改变,人脑疾病可以实现电脑诊断吗?
高培毅介绍,天坛医院一个影像大夫每天读片诊断的时间达到18个小时。按照“BioMind天医智”目前的速度,一个大夫一天的工作量,它只需要400—500秒,也就是不到10分钟的时间。现在患者到医院做核磁,结果都要等第二天以后才能拿到。如果让AI来做,那么核磁结果基本上立等可取,几分钟就行。
“医生工作强度非常大,希望未来AI能把医生解放出来,让医生有更多时间做研究、给病人温暖,也让患者节省看病成本。”高培毅说。
对于“BioMind天医智”在神经影像辅助诊断领域取得的飞速发展和惊人成绩,王拥军说,它在短短几个月的时间内,不断提升疾病诊断效率和准确率;可以学到很多医院多年都见不到的罕见、疑难病例,在神经领域的研究开发和学习深度上,拥有先天优势和大数据基础。目前已经向国家药监局提交申请,希望在临床中应用这款AI产品,提高基层医院影像诊断准确率,同时也提高影像判读速度,为患者节约时间。
本次决赛的评委之一、重庆医科大学神经科学中心主任谢鹏教授表示:“对已有知识的诊断来说,从大数据深度学习的角度上看,AI获胜的几率要大得多,它应该是了然于胸的。但在一些新的、特定的、目前医学界也还没有太多共识的疾病领域,AI可能还‘搞’不过人类。”
“我觉得将来它赢不了我。”荆利娜说,它不了解医学的复杂性,影像判读不是单纯看片子,对患者的病史也要有了解,包括实验室检查等。不同疾病也会有相同表现,需要医生通过多年的积累综合判断倾向于哪一个,而不是单纯通过核磁片子、通过某个征象来判断。“我个人并不是很在意这场比赛谁输谁赢。”王拥军表示,本次神经影像人工智能人机大赛并非意在挑起人类医生和AI之间的战火,希望能够通过这个比赛,能让医生们体验到人工智能的魅力,特别是让部分抱有怀疑态度的医生,进一步对人工智能进行了解。
“大量病例的标准化标注既是AI发展的机遇,又是制约发展的瓶颈。真正的AI技术是一个不断学习的过程,永远不会完美。”王拥军表示,具备“天坛标准”的AI技术渐趋成熟后,将成为辅助基层医生,特别是偏远地区基层医生如何阅读、诊断、预测片子的学习和培训工具,方便脑病患者在“家门口”就能获得高品质、个性化的诊疗方案。此外,它能够帮助医生完成初筛和评定,最终由医生进行印证判断,提高工作效率,节省重复机械工作,特别是在判断结果不一致时,可提醒医生避免漏诊误诊。