萨曼莎·V·沃森:IBM的迈克尔·D·罗丁在哈佛法学院颠覆性创新会议上探讨认知技术

Decorative image

在最近一次跨大西洋航班上,我偶然点播了电影《她》——这部科幻片讲述了主角西奥多与操作系统相恋的故事(类似苹果Siri的超级进阶版)。 但真正引人入胜的是,这个自称萨曼莎的操作系统竟反过来爱上了西奥多——那种疯狂、痴迷、占有欲极强、彻夜难眠的痴情。

起初,我以为这个操作系统只是让西奥多相信它真的对他有感情。然而影片进行到一半时,当萨曼莎被迫承认自己同时爱着好几个人时,我才终于明白:这个操作系统如此先进,不仅能像人类一样学习,甚至能像人类一样发展出情感。

电影结束时,我摘下耳机,问同场观影的公司首席技术官——那位名为洛厄尔·斯图尔特的科技先驱:这类技术要多久才能实现?洛厄尔毕竟深谙敏捷开发、Scrum、编码冲刺、缺陷报告等现实世界。因此我不再赘述他的回答。毋庸置疑,我隐约感到这可能还需要相当长的时间。

“我要选‘前后对比’这道题, 50,亚历克斯。”

若有人能洞悉未来,那很可能是掌管IBM尖端沃森团队的迈克·罗丁。在哈佛法学院近期举办的颠覆性创新会议上,罗丁阐述了计算领域即将发生的重大范式转变——从确定性编程模型(我们编写代码以确定结果)转向概率模型,通过对海量数据集进行统计分析,使计算机能力远超关系数据的处理范畴。

罗丁及其团队正在研发认知软件——这种真正的人工智能能够分析词语在句法关系中的作用并推导出语义。正是沃森团队打造了那台超级计算机,它在电视问答节目《危险边缘》中击败了哈佛大学和麻省理工学院的学生选手。

乍看之下,计算机掌握的琐碎知识比人类更丰富似乎并不令人惊叹,但《危险边缘》的胜利远非简单复述所能企及。 类别名称(如上文标题所示)本身往往是精妙的双关语,它们作为线索引导选手构思答案——这答案需融合历史知识、流行文化乃至更广阔领域的认知,所有信息通过复杂关联紧密相连,这种关联性在过去需要人类大脑(且必须是极具智慧的大脑)才能破解。

一句箴言与前路漫漫

罗丁迅速指出,《危险边缘》的题目——尽管充满陷阱——都是单句形式,因此在当时的沃森计算机能力范围内完全可以应对。但他同时也指出,沃森确实答错了一些题目。 罗丁接着探讨了更长、更复杂的语言片段带来的难题——这类分析需要更高级的能力:能够构建针对语言的提问,而这些问题唯有通过语言本身才能解答。要实现这种分析,计算机必须具备类人思维与学习能力,而这正是沃森团队正在追求的功能。

回到萨曼莎与法律服务的颠覆

如果罗丁认为像萨曼莎这样的系统在未来两三代人内可能实现,他在哈佛演讲中显然并未暗示这一点。事实上,罗丁甚至表示像沃森这样的技术不会取代律师,反而会增强律师即时整合海量数据的能力,从而帮助他们得出更优的结论。

罗丁所指的,当然是那些过于复杂而无法编码到任何系统中的情境性事务——无论是确定性、概率性或其他类型。当然,其他类型的法律事务则非常适合流程自动化(例如文件组装),而现今已有成熟可靠的技术,能够将资深律师的专业知识编码到系统中供他人使用。

引人深思的问题……

令我深感困惑的问题是:如果认知系统在可预见的未来能够像人类那样解构文本,那么它是否可能从零开始起草法律文件?虽然我并非专家,但这种功能听起来几乎像萨曼莎(智能助手)那般神奇。所以,我只能说——我对此并不抱太大希望。


编者按 本文最初发表于 HotDocs.com.2024 年 6 月,Mitratech 收购了高级文档自动化平台 HotDocs。此后,我们对内容进行了更新,以纳入与我们的产品、法规变化和合规性相一致的信息。