ChatGPT现在将为您提供服务:医生使用人工智能回答患者问题 - 华尔街日报
Nidhi Subbaraman
在每位医生的医疗建议背后都有丰富的知识,但很快,全国范围内的患者可能会从另一个来源获得建议:人工智能。
在加利福尼亚和威斯康星**,**OpenAI的“GPT”生成式人工智能正在阅读患者的消息并起草医生的回复。该操作是三个卫生系统的试点项目的一部分,旨在测试人工智能是否能缩短医务人员回复患者在线咨询的时间。
UC圣地亚哥卫生和UW卫生在四月份开始测试这个工具。斯坦福卫生保健计划在下周早些时候加入这一推出。总共,大约有二十几名医护人员正在试用这个工具。
UC圣地亚哥卫生的初级保健医生Marlene Millen正在帮助领导人工智能测试,她已经在收件箱中测试GPT大约一周了。她说,早期由人工智能生成的回复需要大量编辑,她的团队一直在努力改进回复。他们还在添加一种类似于医生的问诊方式:如果患者提到从旅行回来,草稿中可能包含一句询问他们旅行是否顺利的话。“它给予了我们会给予的人性化关怀,”Millen博士说。
有初步数据表明人工智能可能会增加价值。ChatGPT在回复患者在网上发布的查询方面比真正的医生表现更好,根据周五发表的一项研究在JAMA内科医学杂志上,一组医生对帖子进行了盲评估。
斯坦福医疗保健计划很快加入AI计划的推出。 照片: 伊恩·贝茨(Ian Bates)为《华尔街日报》拍摄随着许多行业测试ChatGPT作为商业工具,医院管理人员和医生希望AI辅助能够缓解员工的倦怠感,这是在大流行期间激增的一个 问题。根据美国医学协会的说法,信息量大和健康记录管理 是一个因素,还有行政任务。
总部位于威斯康星州维罗纳的公司Epic通过“MyChart”工具为患者提供了与医疗保健提供者交流的途径,从2020年第一季度的1.06亿次登录增加到2023年第一季度的2.6亿次。 Epic的软件使医院 能够电子存储患者记录。
本月早些时候,Epic和 微软 宣布,医疗系统将可以通过Epic的软件和微软的Azure云服务访问OpenAI的GPT。 微软已投资于OpenAI,并将 人工智能工具整合到其产品中。医院正在试点GPT-3,这是ChatGPT的基础大型语言模型的一个版本。
ChatGPT已经让计算机科学家们感到困惑,因为它擅长回答医疗问题—尽管众所周知它会编造事实—包括它通过美国医师执照考试的能力。根据微软公司AI平台企业副总裁埃里克·博伊德(Eric Boyd)的说法,OpenAI的语言模型并没有专门在医疗数据集上进行训练,尽管医学研究和医学信息包含在教它识别模式的庞大数据集中。
“与ChatGPT合作的医生可能是最好的信使,”加利福尼亚大学圣地亚哥分校的计算流行病学家约翰·艾尔斯(John Ayers)说,他也是《美国医学会杂志》研究的作者之一。
AI试点项目让一些医疗工作人员感到兴奋,米伦博士说。“医生们如此疲惫不堪,以至于他们寻找任何一丝希望。”那家医院系统在疫情爆发前每月接收的患者留言从5万条增加到疫情后的每月8万条,有些疫情月份甚至超过14万条,米伦博士说。
医生及其团队正努力应对额外的工作量,她说。“我没有时间安排。我的员工也非常忙。”
现在,当米伦博士点击患者的留言时,AI会立即显示一份草稿回复。Epic公司的研发高级副总裁塞斯·海恩(Seth Hain)表示,AI在这样做时会参考患者的留言信息以及他们电子病历的简略版本。他补充说,医疗数据受到联邦法律的保护,要求保护患者隐私。
加州大学圣地亚哥健康中心于四月开始测试一款人工智能工具。照片:mike blake/路透社有一个选项可以从草稿开始——编辑或发送原样的消息,如果正确的话——或者从空白回复开始。当AI起草回复时,会参考患者的病历,例如提到他们现有的药物或上次就诊医生的时间。“它帮助我们启动了这个过程,”她说,节省了几秒钟的时间,原本要花在查看患者病历上。
目前,圣地亚哥团队已经停止让AI回答任何寻求医疗建议的查询。同样地,在威斯康星州,UW Health的10名医生已经启用了AI回复一系列有限的患者问题,包括处方请求以及要求文件或文书的问题,根据UW Health的首席信息官Chero Goswami说。
管理人员和医生表示,这个工具可能会带来变革,但前提是它必须有效。如果起草需要太多的事实核查或修改,或者需要太多时间,那么医生们就会失去对它的信任,斯坦福卫生保健的胃肠病学家Patricia Garcia说,她是试验GPT用于消息的团队的一员,计划下周开始试验。“只有在它让他们的生活更轻松时,他们才会使用它。”
根据一组医生的说法,该研究中使用的ChatGPT版本在回答网上发布的医疗问题方面明显优于医生。在新的《JAMA内科医学》研究中,研究作者搜查了Reddit论坛r/askDocs,在那里人们发布有关健康和疾病的问题。经Reddit版主验证的医疗提供者发布回复。
为了这项研究,作者们从医生们在十月份发布在这个论坛上的195个问题和回答中提取了数据。然后他们向ChatGPT提出了这些医学问题,并记录了AI的回答。
一组由五名医疗专业人士组成的团队对AI的回答进行了质量和同理心评分,与Reddit上医生撰写的回答进行了对比。在不知道是谁写的情况下,评估者们给予ChatGPT的回答四倍于医生帖子的“好”或“非常好”评分。此外,仅有4.6%的医生帖子被评为“富有同理心”或“非常富有同理心”,而ChatGPT帖子却有45%—是医生帖子的10倍。
克里斯托弗·朗赫斯特(Christopher Longhurst)是加州大学圣地亚哥分校卫生部门的首席数字官和首席医疗官,也是这项研究的作者之一。他表示,研究中的数据说服了他尝试使用AI模型。“现在有研究表明这将会有所帮助—嗯,让我们看看我们是否能将这转化为实践,”他说。
请写信给Nidhi Subbaraman,邮箱为[email protected]
更正与扩展ChatGPT的早期版本比医生更擅长回答在线发布的医学问题。本文的早期版本错误地称最新版本的ChatGPT更好。(于4月28日更正)
刊登于2023年4月29日的印刷版上,标题为’ChatGPT医生现在会见您’。