Watson 近几年进展缓慢、难堪大用,究其原因,是有许多医疗行业客观存在的桎梏因素,比喻数据匮乏、昂贵。而我们当年对 Watson 以及它所代表的人工智能技术期望过高,甚至脱离实际,也是造成如今失望的原因之一。
Chamath Palihapitiya
论战的导火索
今年五月,在 CNBC 的金融市场观察栏目“Closing Bell ”上,风险投资人 Chamath Palihapitiya 语出惊人:
“实话实说,Watson 就是个笑话。我认为,IBM 非常擅长利用销售和营销手段,来诱导信息不对称的人掏腰包。”
当时,IBM 迅速做出了回应:“Watson 不是一个消费产品,而是面向企业级业务的 AI 平台。在美国以及其它五个国家,Watson 已在临床使用。它在六种肿瘤上做训练,今年的计划是再增加八种。在肿瘤科之外,世界顶级的 25 家生命科学公司、物联网设备制造商、零售与金融服务公司中,接近一半都在用 Watson。GM、H&R Block、Salesforce 都是合作伙伴。难道有人把拯救生命、改进客户服务、驱动商业创新当做是一个笑话?”
第二天,Chamath Palihapitiya 在对 CNBC 的回复中,态度明显放软了些,但并没有改变立场:
“我应该说话谨慎些。但有很多人在开发极有意义的东西,却一定程度上在(IBM 的)营销上吃亏。”
其中,“很多人”包含他投资的公司。很显然,对于 IBM 来说,Watson 的市场开拓是一件不容置喙的事实。而考虑到 Palihapitiya 在投资 Watson 的竞争产品,不排除他故意贬低竞争对手。但是,IBM 把整个集团的未来赌在 Watson 上并不是什么秘密。今年股价下跌,许多投资者并不看好,也是众人皆知的事。
而Chamath Palihapitiya的话,直接引发了一轮欧美互联网上对于曾经的人工智能老大哥Watson 的热议。
各方舆论观点
一大批博主、专家加入了论战。企业搜索专家 Stephen E Arnold 写道:
“我很喜欢 Palihapitiya 的这一句‘信息不对称’。它说明,那些公关公司和拿了好处的咨询师对‘认知’概念的炒作,以及一轮轮的大会演讲其实是烟幕弹。IBM 近五年营收下滑,则是最好的注解——牛皮吹大了。IBM 费了太多力气把 Watson 推广到从菜谱到医疗的各个领域。会计报表告诉我,这么干并没有奏效。”
当然,并不是所有博主都站在 Palihapitiya 这边。Opentopic(IBM 合作商)的联合创始人 André M. Knig 为论战加入了他的五美分:
“我承认 IBM 是一个相当厉害的营销机器,但它的战略勇气和技术创新更胜一筹。如果你把 Watson 说成是笑话,围绕着它的数百家公司难道都是笑话?”
论战的另外一个切入角度,是投资者的视角。IBM 继续它蓝色芯片巨人的历史,面临着重重压力。在 Watson 的赌注又太大,股票长期走势受到影响。
Seeking Alpha 的 Nicholas Ward 认为:“蓝色巨人在 Watson 上投入了这么多年,投资者一直寄希望于这能推动业务增长,代替传统业务萎缩的销售额。时间会证明一切,但现在的增长率很不乐观。“
医疗媒体 Global HealthCare Insights 的执行编辑 David H. Freedman 写道:
“最近,大多数对 Watson 的媒体报道都十分负面。IBM 收入下滑,股价下挫,分析师们在质问 Watson 何时才能创造市场价值。”
MD 安德森事件余波
回到开头提到的 IBM 与 MD 安德森癌症中心的合作。今年 2 月,MD 安德森取消了与 IBM 的 Watson 合约。对此,David Freedman 评论道:
“与 MD 安德森分手使得 IBM 的处境十分尴尬——显得在 Watson 这个问题上,他们像是在自嗨。该合作项目原本的预算是 240 万美元。当德克萨斯大学,即 MD 安德森的管理方,宣布项目终止时,MD 安德森需付给 IBM 的款项共 3900 万美元。“
雷锋网认为,有句话 Freedman 并没有说出来,那就是对于一家全球顶尖的癌症医院,有更多方式能更有价值地利用这 3900 万美元。
但是,对于 MD 安德森事件,根本问题在哪儿并不明了:
”大多数对 Watson 的批评,即便是来自 MD 安德森,并不认为 Watson 的技术本身存有缺陷。批评的焦点集中于 IBM 对 Watson 的进展过于乐观的估计和宣传:四年过去,IBM 并没能拿出哪怕一样能在患者身上临床使用的工具,现有的全在初步测试阶段。“
医学界对 MD 安德森事件反映出的 Watson 项目的问题,有美国癌症研究所编辑(JNCI) Charlie Schmidt 写道:
“德州大学事后对该项目的审计暴露出许多采购问题、成本超支以及延期。虽然这次审计并不涉及 Watson 的技术基础和功能,但它描述了一些把 Watson 纳入医院系统遇到的挑战。熟悉 Watson 肿瘤科室应用的专家,指出该系统在‘吸收’手写的病例报告、医生笔记或者其它涉及大量文字的医疗信息上存在诸多问题。”
2011 年 Watson 参加 Jeopardy!
Watson 的弱点
在 2011 年的美国答题秀节目 Jeopardy! 上,Watson 击败两位前答题冠军,使得“IBM Watson”的大名变得家喻户晓(至少在美国)。去年的 AlphaGo 大战李世石与之仿佛。然而,在接下的几年,IBM 并没有发布该平台的新版本,比如一个大幅升级的‘Watson 2.0’,而是选择了渐进式的微幅技术提升。
相比之下,谷歌、微软、Facebook、亚马逊等其它 AI 领域巨头们产品革新的速度就显得太快了。
沉寂了这么多年后,大众对 Watson 的信心在一点一点动摇。嗅觉敏锐的风险投资人也在不停嗅着 Watson 的弱点。
Watson 的确有弱点:
它需要多个月极费人力的训练,需要专家把海量整理好的数据喂给平台,让它能够从中得出有价值的结论。另外,它仅能根据训练过的数据得出结论。
其中,Watson 对“整理好的”数据这项要求,格外难办。Watson 客户不得不雇佣整队专家咨询师准备数据集,费时费力不说,最受不了的是费钱。
Watson 还无法在多个数据体(corpora)之间建立连接。因此,即便是最基本的规律,只要不在单个数据体以内,也无法收集到。举个例子,在肿瘤学上训练 Watson,它不会懂得任何与心脏病有关的东西。这极大限制了 Watson 在临床环境的应用。
一组 Booz Allen Hamiltonnull 专家,以及MD 健康事务博客对该挑战进行了解释:
“在医护工作日常涉及的复杂决策中,人类智能比机器学习应用的效果好得多。原因很简单:机器尚无成熟的感知、推理、解释能力。另外,虽然近几年 AI 取得了非常大的进步,即便是最顶尖的机器学习算法,也无法达到临床决策所需要的敏感度、特异性和精确度(即正预测值)。
只凭单个 EHR(电子病历) 供应商的分析解决方案,以及在自身停留在大数据时代前陈旧的分析基础设置,医疗组织能实现的进展恐怕有限。”
他们并没有指明说的是 Watson,然而明眼人都看得出来。同时他们认为,Watson (或类似平台)尚有许多值得挖掘的应用场景:
“虽然许多机器学习解决方案尚不成熟,其先进程度也不足以支持复杂的临床决策。在今天,机器学习仍可以高效地部署在减少日常的费时且浪费资源的琐碎工作,把更多医护工作者的时间解放出来去做更高级的工作。”
最后,他们解释了最有可能产生有价值 AI 医疗创新的路径——开源。而 Watson 显然不属于这类:
“现在的前沿机器学习解决方案,不管是通用型还是医疗专用型的,都在飞速进化。它们可能出自于初创公司、技术巨头,也可能来自创新的医疗体系。许多这些方案是开源的,任何人都可以用。”
今天的 Watson,本该是什么样子?
从 MD 安德森事件可看出,IBM 在 Watson 上犯了一个在互联网圈颇常见的错误:说得多,做得少。David Freedman 注意到,IBM 在 2013 年就宣称“一个新的计算时代已经来临”,并且给了福布斯“Watson 解决了临床测试难题”的印象,让人以为在几个月的时间里 Watson 就能进入临床治疗,为现代医疗带来革新。
至于关键的问题——Watson 到底能不能用于临床治疗,Bessemer Venture Partners 成员 Stephen Kraus 认为“很难”:
“不可能在现在发生,五年内可能也不行,而且它也不会取代医生。”
事实上,考虑到技术创新的指数级步伐,在 2011 年赢得 Jeopardy! 大奖的 Watson,现在应该已经出现在我们的 PC 甚至是智能手机里。那年 Watson 获胜后,“奇点教主” Ray Kurzweil 评论道:
“1997 年的专用超级计算机深蓝,和 2002 年的 Deep Fritz 之间也只有五年。而 Deep Fritz 只靠八台 PC 就实现了深蓝的性能。”
把 Ray Kurzweil 的评论放到今天的背景来看,不仅我们的手机并没有玩 Jeopardy的性能,当前版本的 Watson 似乎也并没有比 2011 年强出几个数量级。
失望。
似乎,IBM 正在把这波 AI 浪潮的领导地位,拱手让给新生代具备更强创新能力的初创企业,以及愿意革新自己的科技巨头。你可以说“ Watson 就是个笑话”是句玩笑,但技术的无情革新并不会跟你开玩笑。