医疗数据非结构化广泛存在医疗AI落地仍需时间解决,非结构化,医疗数据,AI,健康

医疗数据非结构化广泛存在医疗AI落地待解

“2020年，中国的数据量将占全球的20%，成为世界第一数据资源大国。”飞利浦大中华区CEO何国伟日前对记者表示，但健康医疗数据大多为非结构化，为AI发展带来挑战。

中国不缺乏医疗健康数据，但各种原因造成数据“误入误出”，80%以上为非结构化的(全球为75%)，不能直接使用。比如，各医院都有自己的IT系统，把不同的平台集成起来是极大的挑战。

得益于存储技术进步、芯片承载能力及医疗资源压力增大等，AI在医疗领域的应用成为资本追逐的热点。

AI与医疗影像结合最先获得突破，2017年浩悦资本医疗行业报告称，2017年，国内AI影像领域的交易约30笔(2016年为8笔)，总交易额超过27亿元，且多数集中在天使轮、A轮。

此外，AI在患者数据、药物研发中也崭露头角，国外一批利用AI及机器学习的药物研发公司的产品，被大型公司采用，如AI辅助筛查早期癌症。2018年也被认为是AI在医疗领域更多成果落地应用的一年。

数据难题

医疗数据量巨大，数据类型复杂，到2020年，医疗数据将增至35ZB，相当于2009年数据量的44倍。

患者数据包含病历报告，诊断和治疗过程中的生化、影像、病理等生物学信息。医疗数据的增长速度和多元化程度远超目前对数据的分析能力。但庞大的数据本身没有意义，将“大数据”转化为“大见解”，才对医疗系统有价值。

由于庞大的患者数据和市场规模，中国将成为AI医疗应用的中心之一。

何国伟认为，与AI将取代人工这种预测正好相反，AI对中国医疗健康行业就业的影响微乎其微，却能促进政府为民众提供平等医疗服务。

AI健康医疗产业的市场也被看好，据何国伟出示的数据显示，中国医疗AI市场规模2016年达到96.61亿元，估计2017年超130亿元，并有望在2018年市场规模达到200亿元。

但数据也是中国市场面临的第一大挑战。中国医疗健康数据80%以上是非结构化数据。但深度学习需要结合先验知识对模型进行训练。例如“AI+影像”的训练主要依赖高水平医生对影像数据的精标，从而让机器学习对病灶的识别。只有与临床经验丰富的医生合作，才能训练出“聪明的人工智能”。

医学是一门注重实践、依赖循证、关系生命质量的严肃科学。AI医疗从数据的来源、建模、训练到结果的评判都需要科学评估标准和体系。目前，很多AI医疗公司处于与医院“科研合作”免费试用的方式获取有限数据阶段，开始规模性临床试验的并不多，有些甚至还没有找到验证的技术和方法。

落地待解

如何获取数据、避免交互污染直到转化成有效的应用，是目前各家AI医疗需要攻克的难题之一。

IBM持续开发WatsonHealth，并先后收购Explorys、Truven等公司持续布局;Google收购DeepMind成立DeepMindhealth，与英国NHS、皇家自由意愿合作开发辅助决策、视觉疾病机器学习;微软发布医健计划Hanvoer，辅助精准用药、精准治疗;阿里发布ET医疗大脑;腾讯投资碳云智能、思派网络等医疗人工智能公司;百度宣布要做医疗大脑等。

除了互联网巨头们入局，传统医疗行业也纷纷入场。

飞利浦在苏州“全球人工智能产品应用博览会”上首次面向行业发布了AI技术在现有产品和解决方案中的应用成果。2015年，飞利浦将照明业务拆分出来独立上市，并通过10多笔收购，加速完成在“健康科技”领域的布局。

“数据处理是我们作为传统医疗设备供应商的巨大优势。以申康机构为例，过去16年，38家上海顶级医院的数据基本上由申康管理，但发现无效数据非常多。”飞利浦大中华区整体解决方案中心临床科学高级总监周振宇对21世纪经济报道表示，比如图像采集、图像人工处理到图像问题发生，都存在不同品牌的数据整合，例如GE、西门子、飞利浦的数据。我们是最有可能在整个流程上对数据进行整合和规范化的公司，国家后续也会在这方面给出更好的指南，对不同品牌的数据统一化提供指导。飞利浦现在要实施AI在医学影像数据以及医疗数据方面的整合，必须从数据采集到数据清洗、模式更新和临床应用着手。”

在与人工智能的结合中，医学比其他领域更为复杂，仅医学影像就可分为2000多个病种。何国伟指出，AI在健康医疗领域将数据转化为洞察的流程，是从数据获取、数据结构化、建模、到反复应用验证、比对结果、不断改进。

由于医疗数据中有90%来自医学影像，AI医疗影像成为人工智能医疗最热门的分支。在中国医学影像的数据正以30%的年增长率逐年增长，给医生带来巨大挑战的同时，计算机视觉的深度学习方法日渐成熟，为实现医学影像的自动分析及辅助诊断提供了新契机。

目前，深度学习方法的研究集中在肺癌、肝癌、乳腺癌、阿尔茨海默症等。

“影像科室更多地依赖技术创新，越来越多的技术可以对人体的信息进行定量描述，通过不同的测度来对疾病进行定量刻划。无论哪个临床科室，基于影像作为诊断和治疗的依据是非常重要的，再延伸至病理、血液等其他体征数据来做判断。”飞利浦大中华区整体解决方案中心总经理陈胜裕对21世纪经济报道表示，AI应用在成像信息中可以更加科学地从定量和定性两方面体现出病灶情况。“但从影像数据来源看，我国仍处于从传统胶片向电子数据过渡的阶段，大量影像资料尚未数字化，且医院之间的数据共享和互通程度较低，获取大规模数据是一大瓶颈。”

落地的另一难题来自监管制度的配套和创新，越来越多的政府监管正走向开放。今年4月，美国FDA批准了首款使用人工智能检测糖尿病患者视网膜病变的医疗设备IDx-DR。FDA局长ScottGottlieb近日在华盛顿举行的2018HealthDatapalooza大会上也表示在保护患者的前提下，FDA正在扩大数字医疗工具的机会，并积极开发新的监管框架，用新的方法来审查人工智能。

FDA预计未来几年将会有越来越多基于AI工具提交审核申请，首当其冲的是医疗成像设备。FDA对AI的态度也将着重关注其处理现实世界数据的方法，包括来自病理幻灯片、电子病历、可穿戴设备和保险索赔数据的结构化和非结构化数据。