专家论坛
医工结合,助力人工智能医疗器械研发

腾讯医疗健康事业部 钱天翼;中国医学科学院北京协和医院放射科 孙昊
 
 
  研发人工智能类的医疗器械产品,与其他医疗器械产品一样,其目的在于通过技术手段,安全、有效解决临床诊疗过程中所面临的实际问题。
  医疗机构、医生所采用的临床诊疗流程,是经过长期实践经验积累和科学研究论证后所形成的。其中,人工智能医疗器械的开发,尤其是以深度学习为代表的新一代人工智能技术的开发,在技术和研究过程中经常是以“数据驱动”形式开展的。网上公开的竞赛数据集则成为很多研发团队从计算机技术领域切入医疗人工智能医疗器械研发的第一个数据集。
  这种“竞赛数据驱动”的研发方式,可以让研究团队在最短的时间内获得一定数量和部分维度的临床数据资料,迅速开展算法模型的技术研发。此外,通过竞赛成绩的公开较量,团队的技术实力可以通过最终的名次被行业认可,获得更多的关注。但如果仅基于竞赛数据集和竞赛成绩来评价一款人工智能医疗器械产品的研发能力,则会带来诸多问题与风险。
 
  产品研发不能只凭竞赛数据
  首先,竞赛数据集本身的质量是否达到了临床实际所需要的数据质量、维度和要求。以今年新冠肺炎疫情所引发的CT影像人工智能分析产品的研发为例,网上公开的有竞赛数据,也有科研成果发表后公开的原始数据。在新冠肺炎救治的临床实际场景中,CT扫描设备通过对被检查者施行胸部扫描,得到薄层的CT原始图像,并通过肺窗、纵隔窗等图像窗宽窗位的调节,由放射科医生进行阅片。而国外机构在网上公开的新冠肺炎患者CT数据(https://github.com/UCSD-AI4H/COVID-CT),在数据集介绍中显示有200余例,实际数据集中每一例患者只有横轴位的CT图像一层或几层,没有完整的胸部扫描影像数据,与实际临床场景相差巨大。在国家生物信息中心公布的一批用于科研的新冠肺炎患者的CT影像数据中(http://ncov-ai.big.ac.cn/download?lang=en),大部分CT影像已经转换成了图片的格式,而非医学影像标准的DICOM数据。在转换成图片的过程中,原始DICOM图像的灰度值、显示的窗宽窗位、空间分辨率、CT扫描机型等信息都没有被保留下来。这就使得构建人工智能算法模型的时候,对于不同分辨率、不同显示模式、不同厂家设备采集之间的差别,无法进行统计和分析。实际临床应用中,在处理DICOM数据时,很可能由于分辨率不同,CT设备扫描参数不同,造成图像特征的改变,导致模型输出结果的错判。
  其次,竞赛数据的任务有时并不能很好的代表现实医疗场景的需求。在疾病诊断过程中,需要临床科室、放射科、核医学科、检验科、超声科、病理科等多个科室的信息进行综合判断,才能进行疾病最终诊断结论的确认。临床医生在实际诊疗过程中,是通过不同的影像、检验、检查手段,对症状所对应可能的疾病进行诊断和鉴别诊断。对患者单纯凭借一个影像扫描检查,大部分情况下是无法给出确切诊断的。以糖尿病视网膜病变的判别为例,在眼科的眼底检查中,面对的可能是患各种眼科疾病的患者。在这种场景下,不仅需要判定是否是糖尿病视网膜病变,还需要判断是否同时存在其他眼科疾病,只告诉患者“没有患糖尿病视网膜病变,不排除其他眼部疾病可能”是不够的。而对于内分泌科的医生,在面对已经确诊为糖尿病的患者,希望通过眼底检查来判断糖尿病对身体其他器官造成的损伤程度时,可以只给出糖尿病视网膜病的严重程度的判断。因此,竞赛数据的任务可能仅适用于简单的单病种临床场景,而这类临床场景在真正的临床诊疗过程中只占一部分比例。
  第三,竞赛数据中的任务可能并不是单纯的计算机算法技术问题,其中有可能还有很多需要解决的科学问题。尤其是当某些任务改变了实际临床诊疗流程和金标准判断程序时,则需要大量临床验证工作对这种改变进行验证。以肺结节竞赛为例,肺部CT影像数据可以用于检出肺结节,并进行相应的定量测量等。而良恶性的判别,临床则依靠对可疑结节影像学征象的判读、结节随访和取病理活检等方式,进行良恶性的确认。医学影像中,常提到“同影异病,同病异影”,正是说很多疾病是不能够仅凭影像学的表现就直接进行临床诊断的。“磨玻璃”的影像表现在肺结节和肺炎的病灶上都可能出现。同样,新冠肺炎患者所具有的CT影像学特征,也与其他病毒性肺炎,例如甲流等,因此仅仅凭借CT影像就诊断患者是“新冠肺炎”是不符合临床诊断标准和流程的,需要进一步的配合核酸和病原学检测。很多肺结节CT影像的研究和竞赛中,都会针对结节良恶性进行鉴别诊断和分类建模,并且在很多研究中,都取得了不错的结果。但由于这种直接通过CT影像对肺结节良恶性进行直接判别,与目前临床常规操作不符,因此先要通过大量试验验证这一做法的科学性,这就需要大量的临床试验的反复论证,而不能采取与其他行业软件产品的“先落地应用,再快速迭代改进”的方式进行产品研发。
 
  医工结合创造优质产品
  医疗领域中,由于医生的每一个操作,每一个决定都可能直接关乎到患者的安危,因此对于新提出的诊疗方案和流程,需要经过充分的论证才能在临床中真正开展使用,这一周期往往需要经历数年时间。这对于很多从计算机软件领域进入到医疗AI软件开发领域的公司来说,是一个巨大的挑战。尤其对于初创公司,很难能够有足够的资金支撑自己去验证一个新医疗流程建立的科学性。
  医疗器械研发团队,都面临着如何做一个好的产品定义的挑战。尤其是在尝试开拓没有同类产品的新领域时,一个符合临床需求、能够解决临床实际问题,又在技术上可实现的产品功能定义对每个医疗器械公司都十分重要。只有符合临床实际需求、解决真正临床问题的产品,才能够真正为医疗器械公司带来丰厚的收入回报。而技术上是否可以实现,则决定了产品最终能否在临床试验中达到预期的目标效果,获得药监部门的批准。
  由于医疗的专业属性极强,使得产品设计者无法从“消费者”的角度来思考自己需要什么样的医疗器械为自己治病。医疗器械的实际“消费者”,应该是使用这些医疗器械的专业医生,而不是患者。这就对研发产品经理提出了极高的要求,要求研发产品经理对医生的工作,对医疗过程的整个流程和每一个环节都有充分的理解,同时还要能够掌握相关的技术知识,能够分辨什么是技术问题、什么是科学问题。由于医学和理工科专业培养方向上的不同,很难有人真正做到掌握两个学科的知识。因此对于以技术为主导的团队来说,与临床医生紧密合作,共同开展产品定义和技术研发工作是比较容易实现且成本更低的方式。“医工交叉”“产医研结合”的模式,也是国家近些年来各类研发重大专项所着重提倡的模式,目的就是希望在医学和工程专业交叉的领域,各自领域的专家能够贡献自己的专业知识,通过碰撞产生创新的火花,共同创造优质的医疗器械产品。
  在整个医疗器械研发过程中,临床专家都扮演着十分重要的角色。产品的定义要通过临床专家根据临床实践中遇到的问题与困难中抽象出解决方案。产品的研发需要临床的紧密配合,尤其是人工智能类产品,需要从临床实际使用的场景出发,收集训练数据,并在临床专家的指导、帮助下完成数据的标注。在完成产品研发之后,需要进行临床试验对其效果进行验证,产品在实际临床中使用的效果,更是需要医生通过反复的实用操作,发现可能潜在的风险,进行及时的改进。产品上市后,依然需要医生对使用过程中产生的问题进行反馈,以对医疗器械上市后的使用情况进行真正的监管。
  无论是成为一名医学还是一名理工科的专家,都要经过5-10年的专业知识学习,再加上5-10年的工作经验积累,因此很难做到真正精通两个领域。医疗器械的研发是一个多学科交叉的领域,做好医工交叉,才能更好的推动医疗器械新产品的研发。行业中,也需要更多的交叉学科人才,能够做好交叉专业之间的“翻译”“黏合剂”,帮助各方更加顺畅的沟通,实现专业知识的无缝衔接。目前,这方面的人才还比较缺乏,企业和高校都需要加大力度培养交叉型人才,更好地为医疗器械创新做贡献。
 
(摘自中国食品药品网)
 
 
<关闭窗口>