一家初创公司声称其人工智能撰写医疗记录,但实际上大部分工作由人类完成 - 华尔街日报
Joseph Walker
美国各地数百名医生已经把他们与患者的私人交谈录音交给了一家初创公司,该公司承诺将这些对话转化为可用的医疗记录,通过人工智能。
据现任和前任员工称,该技术在生成报告时会出现多个错误,比如未能使用正确的医学术语,以及添加患者没有服用的药物。
为了纠正这些错误,健康科技初创公司DeepScribe依靠200名人工承包商来听取医疗对话并修改记录,该公司的创始人表示。这些工作人员还使用谷歌搜索来查找计费代码。
在所有的行政任务、数据录入和文书工作中,医疗保健是人工智能的一个成熟目标。DeepScribe对其人工智能的能力做出了广泛的宣称,但其承包商所做的关键工作表明,这项技术仍然无法在医学的一些基本工作中独立完成,需要大量人工辅助。
DeepScribe的软件据创始人称,能够撰写每份记录的80%,但该公司雇佣了200人来“发现可能是人工智能等新兴技术产生的错误,并让医疗服务提供者放心,知道他们的笔记已经由我们团队的培训成员审核过了。”
让人类审查AI的工作并识别其错误有助于训练算法并提高其准确性,Ko和Bapu说。DeepScribe在其网站和销售演示中披露了质量保证工作,他们说。
医生有责任确保他们添加到患者病历的报告的准确性。现任和前任DeepScribe员工表示,他们不知道医生未能发现通过人工审查的任何错误。
以下关于DeepScribe、其技术和人工工作者使用的描述基于对现任和前任员工的采访,以及对DeepScribe员工和其他公司材料之间的通信的审查。
该公司在医疗保健的一个繁琐但至关重要的领域中工作:记录保存。
DeepScribe在其网站上描述了如何利用人工智能填写电子健康记录。医生将他们的谈话记录输入患者的病历。医生和其他护理人员可以随后查看摘要,快速了解患者的病史,并帮助确定治疗方案。健康保险公司使用这些记录来确定向医生支付多少报酬。
但将谈话记录写成连贯的笔记是一项耗时的工作。为节省时间,许多医生只是简单地复制并粘贴他们在患者上次就诊时输入的笔记,并根据需要进行微调。一些医生会使用语音识别软件口述患者报告,或者让工作人员陪同他们进行患者就诊并做笔录。
DeepScribe对其技术自动化记录的能力做出了大胆的承诺,称其将“改写医学文档的方式”。
该公司表示,它不仅仅是转录医生对患者就诊的笔记。其人工智能会逐字记录每次对话,这可能总共有数千字,并将其转换为可以合并到患者电子病历中的标准化报告。
DeepScribe提供了其销售演示和网站FAQ部分的图片,其中包括一个质量保证团队会审查AI生成的报告以确保准确性。
员工们使用DeepScribe的Slack频道寻求关于问题的建议,比如AI在笔记中添加额外的药物名称。然而,网站上大部分强调了其“AI驱动”技术的好处。公司在网站上表示,该软件比老式服务“更准确”和“更少手动”。网站上说:“人工智能正在彻底改变几乎每个行业。现在轮到医疗保健了。”
医疗保健支出占美国国内生产总值的近五分之一,使其成为最热门和最有潜力的市场之一,尤其是对于人工智能**。**根据数据分析提供商PitchBook的数据,风险投资家从2018年到2022年在以医疗保健为重点的人工智能公司上投资了173亿美元。
然而,哈佛医学院生物医学信息学教授兼主任Isaac Kohane博士表示,对于许多医疗科技初创公司来说,他们对技术的承诺与他们实际提供的现实之间存在着很大的差距。
“泡沫太大,导致太多资金追逐太少的优质公司,”他说。
总部位于旧金山的DeepScribe成立于2017年,已经在风险投资融资中筹集了3730万美元,并在2021年12月的最后一轮融资后估值达到1.8亿美元,据PitchBook称。
公司有大约1000名医生和其他医疗提供者使用其服务,Ko和Bapu说。他们表示,该公司预计今年的收入将大大超过650万美元。
创始人表示,该公司收费为其他AI医生笔记竞争对手每月向医疗机构收取的2000至3000美元的六分之一至八分之一。
使用DeepScribe的产品,医生使用该公司开发的智能手机应用记录每次患者就诊,然后将录音上传到DeepScribe的数据库。
DeepScribe使用其他公司的软件来生成音频的文字记录,Ko和Bapu说。然后DeepScribe的人工智能开始总结文字记录,以便放置在患者的病历中。
人工智能分析文字记录,并突出显示医学相关信息,例如患者的病史和当前症状,以及医生的后续计划。人工智能用完整的句子写出突出显示的信息。
DeepScribe的内部称为文书的人工工作者审查音频记录,并将其与文字记录和人工智能生成的句子进行比较。
目前和以前的工作人员表示,问题始于文字记录。通常它们包含不连贯、毫无意义的句子。
DeepScribe表示,其软件还建议将关键数据包括在患者的病历中,包括用于医疗保险计费的代码。
工作人员表示,有时转录和人工智能生成的摘要会错误地拼写药物名称。例如,有一份转录将患者称为正在服用治疗偏头痛的药物为“Shelby”,而患者实际上使用的是品牌名Ubrelvy。
DeepScribe软件有时会建议更改在转录中正确拼写的药物名称。例如,它建议将抗抑郁药Remeron的名称更改为Remora,一种鱼类,或者建议用西班牙语单词Toreador替代止痛药Toradol。
“还有其他人注意到人工智能有时会添加额外的药物吗?”一名审查人工智能工作的工作人员在2022年11月在Slack消息中写道。《华尔街日报》对此进行了审查。“我已经多次看到它在不同的药物上出现,所以只是好奇。”
现任和前任工作人员表示,他们经常不得不对人工智能留下的错误进行更正和填补其他空白。他们说,他们经常撰写大部分的每份医疗报告。
《华尔街日报》对文书员使用的Slack频道上的消息进行了审查,发现他们在寻求各种问题的答案。讨论的话题包括是否要将一位未命名的患者,向医生抱怨睡眠不好,描述为患有鼻窦充血还是失眠。
DeepScribe Slack频道上的员工众包了关于在笔记中包含哪些医疗计费代码的建议。为了进行编码工作,许多大型医疗机构和医院雇佣了完成了医学编码培训的专业人员,这些人通过证书或副学士学位项目完成了培训。DeepScribe对文书的培训很少,其中包括指定要使用的常见代码以及如何在互联网上搜索其他代码,一位工作人员说。管理人员指示文书使用Google查找诊断或ICD-10代码,这些人说。
今年初,一位文书在Slack上询问应该使用哪个ICD-10代码来表示膝关节关节炎,但并不知道是哪种关节炎或者是哪只膝盖。一位经理回复了一个截图,显示了一个Google搜索结果页面,搜索词为“关节炎 未指定膝盖 icd 10”。
DeepScribe表示他们为文书提供了ICD-10培训,并且他们只向医生推荐代码,由医生负责确认其准确性。
一些医生和患者似乎不知道有人在听录音,目前和以前的员工说。在一些录音中,医生告诉患者他们的就诊被录音了,但会完全由人工智能分析,没有人会听录音,工作人员说。
在交谈中,患者向他们的医生分享了私人细节,包括药物滥用和家庭问题,DeepScribe的工作人员说。这些文字记录通常包括患者的全名和医生诊所名称的缩写,这些人说。
根据联邦《健康保险可移植性和责任法案》(Health Insurance Portability and Accountability Act,简称HIPAA),DeepScribe及其员工被允许查阅患者的医疗信息,但他们必须保障数据的机密性,法律专家表示。
现任和前任员工表示,他们接受了有关联邦HIPAA法律和健康隐私的最低限度培训。
法律专家表示,HIPAA并不要求医生告知患者其他人可能会查阅他们的数据,包括他们就诊的录音。
然而,即使在法律上允许,出于道德原因,医生应告知患者他们的对话正在被录音并与第三方公司及其员工共享,健康隐私顾问乔伊·普里茨表示。
普里茨说:“他们对患者的行为进行了误导,以一种让患者感到更舒适、更自由地说话的方式。”
DeepScribe表示,所有员工都要完成包括HIPAA合规性在内的17步培训计划。
请写信给Joseph Walker,邮箱地址为[email protected]
刊登于2023年7月24日的印刷版上,标题为“医疗记录初创公司使用人工智能和人力”。