ChatGPT与医学:好处、坏处、怪异之处

发布日期:2023年7月18日

作者:Rob Levy

人工智能聊天机器人ChatGPT自问世以来,就以高度模拟人类语言和反应的能力著称,但这让很多人感到担忧。正如此前的每一种科技创新一样(如:电话、制冷、塑料),ChatGPT也一定会在医学领域里找到用武之地。人们在ChatGPT上搜索关于健康问题的信息。医生也在研究ChatGPT帮助自己和保险公司起草文书或者回答患者问题的可能性。ChatGPT给出的结果有时令人印象深刻,偶尔令人费解,也有时让人发笑。

为探寻ChatGPT在医学领域中的一些潜在益处和短板,我们采访了丹娜—法伯癌症研究所两位专攻胃肠道癌症的医师:Benjamin Schlechter博士Benjamin Schlechter, MD)和Douglas Rubinson博士Douglas Rubinson, MD, PhD)。两位专家也对ChatGPT进行过实验,以衡量它的优缺点。

问:我们先从积极的方面切入。在医学领域,ChatGPT如何帮助医生、患者和公众?

Rubinson博士:有时,ChatGPT在医生纠结的问题上发挥很好的作用,比如:用患者易理解的语言解释复杂的医学问题。在回答患者问题方面,我可以让ChatGPT根据不同的理解程度作出回答,包括:5年级水平、高中一年级水平、大学生水平、生物化学博士水平之间。在与患者交流方面,我并不认为ChatGPT已经成熟到我们可以直接用它给出的答案,但是它可以提供一个初稿文本,供医师编辑、校正后,再发给患者。

Schlechter博士:ChatGPT可以帮我们提供写作的框架。 如果我让ChatGPT就某个话题写作,或者写一个段落,它生成的文字大概有50%的准确性,但是它很有逻辑性。我发现,在某种程度上,ChatGPT最有用的地方体现在它交流的节奏上,非常清楚、准确、有条理,以线性的方式表达内容。这或许并不是人类思考的方式,但却是学习的方式。当我让ChatGPT写东西时,它的条理性往往给我留下深刻印象,而并不一定是它提供的数据。此外,ChatGPT还有助于开启写作的过程。比如,当我写东西遇到瓶颈时,也许会让ChatGPT帮我写一段开头。它写的内容也许不能完全准确,但是我可以编辑、校对,所以它为我写作提供了一个方向。

问:能否举例说明:在什么情况下,ChatGPT能帮助患者了解一个复杂的医学问题?

Rubinson博士:对于接受基因检测的患者而言,很重要的一点是要区分生殖系检测(germline testing)和体细胞检测(somatic testing);生殖系检测是寻找肯可能传给子女的遗传性基因异常,而体细胞检测则是在肿瘤组织中识别出特异性遗传异常。在这方面,ChatGPT做得非常好,它为患者提供简单、易懂的解释,从而与家人分享。

问:作为医生,您能知道ChatGPT提供信息的准确性。针对患者用ChatGPT了解癌症研究成果,您有哪些建议?

Schlechter博士:ChatGPT最大的问题之一在于它的回复很大程度上是基于回顾性数据的。也就是说,ChatGPT偏向于用很多年前发表过的数据信息,而较少用新数据提供信息。ChatGPT并不一定能提供最准确的信息,它为用户提供的是互联网上最流行或者最普遍的信息。网络上,关于旧研究的信息往往会比新研究多。因此,ChatGPT的回复也会体现这一趋势,从而导致它提供的信息也有可能是过时的。例如,在英国女王伊丽莎白二世过世后的几个星期里,如果我们在ChatGPT上询问关于她的信息,ChatGPT会告诉我们:她还在世。

ChatGPT也不太善于处理细微的差别。如果,一些新的研究发现让我们对某种疾病及其治疗产生了细微的认知改变,那么 ChatGPT 可能会忽略这种变化。

Rubinson博士:我们跟患者强调,在了解治疗自己所患癌症方面,一定要审慎利用网络上的相关信息。我们已经实现了医疗信息的民主化——免费、自由获取,患者带着与治疗和临床试验相关的尖锐问题就诊,这真是太好了。与此同时,癌症的医护也有很大的特殊性,它需要我们对诊断有极为深入和细致的了解:患者癌症到了几期?有什么亚型?癌症浸润性多高?癌症有哪些基因组特征?患者此前接受过哪些治疗? 除癌症外,患者还有哪些健康问题?在临床决策中,ChatGPT很难回答其中的多项问题。

问:我们经常听闻ChatGPT可能给出错误、甚至是虚构的信息,您有同感吗?

Schlechter博士: 在有些案例中,是这样的。有一次,我让ChatGPT寻找某个癌症的数据,它竟然凭空捏造了一个等式,甚至还给它命名。尽管这是一个无用的等式,但它看起来非常具有说服力。从某种程度上看,这就像是跟小孩子讲话一样:小孩子擅长编故事,你越问,他们就越能往下编。在这种情况下,正因为我让ChatGPT去阐释,它就不断地添油加醋,编造细节,但没有一个是真的。对于一台计算机而言,ChatGPT非常自信。

问:所以,ChatGPT并不能作为患者和医师交流的替代品

Rubinson博士:没错。在照顾患者方面,我们有着跨学科肿瘤委员会,这包括:肿瘤内科学家、肿瘤外科学家、放射肿瘤学家、病理学家和放射专家,我们会进行会诊,讨论患者的治疗方案。这种高度集中的讨论、咨询、合作模式,以及在做出临床决策时所需的细致入微的理解,是不能被ChatGPT这样非智能文本预测模型所复制的。

Schlechter博士:在我们将ChatGPT投入患者医护前,我们应该对它展开临床试验,就像我们临床中使用的任何东西一样。无论是新型的心脏监测器、新药或者外科技术,我们都要对它的好处和风险展开正式的评估。这也适用于ChatGPT。

转载须知

阁下若有媒体联络需求,敬请致电617-632-4090,请阁下指明与媒体团队洽谈;或请发邮件至media@dfci.harvard.edu。阁下如欲转载本文,请发邮件至kun_ma@dfci.harvard.edu,未经授权禁止转载,感谢合作。