ChatGPT现在将为您提供服务：医生使用人工智能回答患者问题 - 华尔街日报

Nidhi Subbaraman

2023-04-28

在每位医生的医疗建议背后都有丰富的知识，但很快，全国范围内的患者可能会从另一个来源获得建议：人工智能。

在加利福尼亚和威斯康星**，**OpenAI的“GPT”生成式人工智能正在阅读患者的消息并起草医生的回复。该操作是三个卫生系统的试点项目的一部分，旨在测试人工智能是否能缩短医务人员回复患者在线咨询的时间。

UC圣地亚哥卫生和UW卫生在四月份开始测试这个工具。斯坦福卫生保健计划在下周早些时候加入这一推出。总共，大约有二十几名医护人员正在试用这个工具。

UC圣地亚哥卫生的初级保健医生Marlene Millen正在帮助领导人工智能测试，她已经在收件箱中测试GPT大约一周了。她说，早期由人工智能生成的回复需要大量编辑，她的团队一直在努力改进回复。他们还在添加一种类似于医生的问诊方式：如果患者提到从旅行回来，草稿中可能包含一句询问他们旅行是否顺利的话。“它给予了我们会给予的人性化关怀，”Millen博士说。

有初步数据表明人工智能可能会增加价值。ChatGPT在回复患者在网上发布的查询方面比真正的医生表现更好，根据周五发表的一项研究在JAMA内科医学杂志上，一组医生对帖子进行了盲评估。

斯坦福医疗保健计划很快加入AI计划的推出。照片：伊恩·贝茨（Ian Bates）为《华尔街日报》拍摄随着许多行业测试ChatGPT作为商业工具，医院管理人员和医生希望AI辅助能够缓解员工的倦怠感，这是在大流行期间激增的一个问题。根据美国医学协会的说法，信息量大和健康记录管理是一个因素，还有行政任务。

总部位于威斯康星州维罗纳的公司Epic通过“MyChart”工具为患者提供了与医疗保健提供者交流的途径，从2020年第一季度的1.06亿次登录增加到2023年第一季度的2.6亿次。 Epic的软件使医院能够电子存储患者记录。

本月早些时候，Epic和微软宣布，医疗系统将可以通过Epic的软件和微软的Azure云服务访问OpenAI的GPT。微软已投资于OpenAI，并将人工智能工具整合到其产品中。医院正在试点GPT-3，这是ChatGPT的基础大型语言模型的一个版本。

ChatGPT已经让计算机科学家们感到困惑，因为它擅长回答医疗问题—尽管众所周知它会编造事实—包括它通过美国医师执照考试的能力。根据微软公司AI平台企业副总裁埃里克·博伊德（Eric Boyd）的说法，OpenAI的语言模型并没有专门在医疗数据集上进行训练，尽管医学研究和医学信息包含在教它识别模式的庞大数据集中。

“与ChatGPT合作的医生可能是最好的信使，”加利福尼亚大学圣地亚哥分校的计算流行病学家约翰·艾尔斯（John Ayers）说，他也是《美国医学会杂志》研究的作者之一。

AI试点项目让一些医疗工作人员感到兴奋，米伦博士说。“医生们如此疲惫不堪，以至于他们寻找任何一丝希望。”那家医院系统在疫情爆发前每月接收的患者留言从5万条增加到疫情后的每月8万条，有些疫情月份甚至超过14万条，米伦博士说。

医生及其团队正努力应对额外的工作量，她说。“我没有时间安排。我的员工也非常忙。”

现在，当米伦博士点击患者的留言时，AI会立即显示一份草稿回复。Epic公司的研发高级副总裁塞斯·海恩（Seth Hain）表示，AI在这样做时会参考患者的留言信息以及他们电子病历的简略版本。他补充说，医疗数据受到联邦法律的保护，要求保护患者隐私。

加州大学圣地亚哥健康中心于四月开始测试一款人工智能工具。照片：mike blake/路透社有一个选项可以从草稿开始——编辑或发送原样的消息，如果正确的话——或者从空白回复开始。当AI起草回复时，会参考患者的病历，例如提到他们现有的药物或上次就诊医生的时间。“它帮助我们启动了这个过程，”她说，节省了几秒钟的时间，原本要花在查看患者病历上。

目前，圣地亚哥团队已经停止让AI回答任何寻求医疗建议的查询。同样地，在威斯康星州，UW Health的10名医生已经启用了AI回复一系列有限的患者问题，包括处方请求以及要求文件或文书的问题，根据UW Health的首席信息官Chero Goswami说。

管理人员和医生表示，这个工具可能会带来变革，但前提是它必须有效。如果起草需要太多的事实核查或修改，或者需要太多时间，那么医生们就会失去对它的信任，斯坦福卫生保健的胃肠病学家Patricia Garcia说，她是试验GPT用于消息的团队的一员，计划下周开始试验。“只有在它让他们的生活更轻松时，他们才会使用它。”

根据一组医生的说法，该研究中使用的ChatGPT版本在回答网上发布的医疗问题方面明显优于医生。在新的《JAMA内科医学》研究中，研究作者搜查了Reddit论坛r/askDocs，在那里人们发布有关健康和疾病的问题。经Reddit版主验证的医疗提供者发布回复。

为了这项研究，作者们从医生们在十月份发布在这个论坛上的195个问题和回答中提取了数据。然后他们向ChatGPT提出了这些医学问题，并记录了AI的回答。

一组由五名医疗专业人士组成的团队对AI的回答进行了质量和同理心评分，与Reddit上医生撰写的回答进行了对比。在不知道是谁写的情况下，评估者们给予ChatGPT的回答四倍于医生帖子的“好”或“非常好”评分。此外，仅有4.6%的医生帖子被评为“富有同理心”或“非常富有同理心”，而ChatGPT帖子却有45%—是医生帖子的10倍。

克里斯托弗·朗赫斯特（Christopher Longhurst）是加州大学圣地亚哥分校卫生部门的首席数字官和首席医疗官，也是这项研究的作者之一。他表示，研究中的数据说服了他尝试使用AI模型。“现在有研究表明这将会有所帮助—嗯，让我们看看我们是否能将这转化为实践，”他说。

请写信给Nidhi Subbaraman，邮箱为[email protected]

更正与扩展ChatGPT的早期版本比医生更擅长回答在线发布的医学问题。本文的早期版本错误地称最新版本的ChatGPT更好。（于4月28日更正）

刊登于2023年4月29日的印刷版上，标题为’ChatGPT医生现在会见您’。