医学人工智能研究的发展和智能医疗模式的兴起,有望改善目前医疗供需不平衡的现状,提高优质医疗资源的覆盖率和可及性,为建立更全面、高效、精准的医疗服务模式和医疗改革提供可能。医疗大数据是医学人工智能研究发展最重要的土壤,而数据的收集、存储和管理一直是各研究项目的重中之重[1]。随着数据体量不断增加,数据的模态与属性变得更为多样、复杂,加上开展多中心研究的迫切需求,建立标准化数据中心对积累高质量的数据资源和推动医学人工智能的发展极为重要[2]。
人工智能技术可对人类长期医疗实践中产生的大量数据资料进行更大规模和更深入的分析,使珍贵的医疗信息资源得到更充分合理的利用,并可根据数据的类型和训练任务,建立不同应用场景的人工智能医疗系统[3]。目前,医学人工智能的研究发展迅速,针对不同疾病、不同任务的医学人工智能系统层出不穷,实际使用方式和访问途径也缺乏相关的应用规范和统一管理。整合不同应用场景的医学人工智能系统,搭建可满足多种疾病诊疗需求的智能医疗云服务平台,为患者提供智能医疗服务的统一访问端口,无论是对增强智能医疗服务的可及性和安全性,还是提高智能医疗模式的管理效率,都具有重要意义[4]。
眼科作为医疗人工智能发展的领先学科,在人工智能数据中心的整合与标准化、人工智能系统的研发与智能服务云平台的搭建等方面积累了丰富的实践经验和工作基础[5-6]。本文以眼科为研究基础,对眼科数据中心和智能服务云平台的建设经验进行总结分析,为眼科及其他医学专科开展人工智能研究,建立数据中心和搭建智能服务云平台提供参考。
1 眼科数据中心的建设
眼科数据中心的建设内容,包括数据收集、录入、整理、标注、扩展、备份、恢复以及分类数据中心的构建、数据中心的管理与维护等方面的内容,具体工作和管理流程如下。
1.1 数据收集
明确数据中心的数据类型与不同类型数据的采集标准。眼科数据类型可分文字、图像、视频和其他4大类,所有数据应包括性别、年龄、检查时间等基本信息,并与住院号或门诊号相关联。
第一,文字数据主要包括门诊和住院病历,健康体检记录等。第二,图像数据主要包括裂隙灯显微镜、眼底相机、光学相关断层扫描仪等眼科检查设备产生的二维图像和由计算机断层扫描、磁共振设备等检查设备生成的三维图像,由不同仪器生成的图像数据都应该分别以统一的格式和属性(包括并不限于分辨率、对比度)存储在数据中心。目前多数图像数据为DICOM格式,DICOM不仅是图像的存储格式,还是不同成像设备产生的不同格式数据之间相互转换的中间形式。第三,视频数据主要为患者检查过程录像,可以由avi,rmvb等格式存储,最好使用统一的格式编码、视频分辨率、视频码率和视频帧率,同时在数据中心记录其相应的保存路径。第四,其他数据包括音频,四维影像等医学数据。所有数据类型应分别以统一的格式储存,以便后期的整合与分析。
1.2 数据录入
数据录入包括纸档记录转为电子记录和直接电子记录两类。纸档记录转为电子记录需要逐样本、逐项发现可能存在的记录错误,在转录入时应避免出现误差。直接电子记录在检查无误后可将各数据结果直接转入数据中心。
数据录入需遵守以下原则:第一,搭建数据中心分类录入平台,实现数据按疾病、按诊疗项目、按数据类型分类录入;第二,所有录入的数据应该保持准确,由专人对录入数据进行核实,如发现错误,应重新录入并再次检查;第三,录入数据的过程应安全、保密,只能数据录入者才有数据查看权限,特定的管理人员才可拥有数据修改权限;第四,对数据结果编码可方便数据录入、识别和分析。
1.3 数据整理
数据整理包括数据清洗及缺失数据的处理。数据清洗是数据质量控制的起点,其本质是一个发现问题、解决问题的过程。清洗过程主要关注数据质量问题,包括相似重复记录、不完整记录、逻辑错误、异常数据等,并确定数据质量问题的性质及位置,对数据进行修正,并对数据修正过程归档保存。缺失数据的处理方法有删除法、加权调整法、单一填补法、多重填补法,根据缺失数据的比例、类型和重要程度选择相应的处理方法。
1.4 数据标注
数据标注的目的是人工提取数据中所包含的信息,为后期数据分析,机器学习模型的构建打下基础。数据标注流程及规范包括:第一,根据所需标注的数据类型确定标注方式,如图像数据包括图像分类、目标检测、图像分割,从而明确标注所需的软件工具;第二,确定标注层级关系,在标注之前根据眼科学知识体系,确定不同标注标签的层级关系,以网状图或者树状图的形式表示;第三,确定标注标签的统一标准,制定不同眼科疾病和不同病灶的标注模板,保证对同一眼科疾病、病灶、部位的相同标注。
1.5 分类数据中心的构建原则
在构建分类数据中心时需遵循以下原则:第一,所保存的数据需包含完整的样本信息和标签信息,且样本和标签信息一一对应;第二,所保存的数据按照疾病分类保存在相应的目录下,并且为方便使用,每个目录以及目录下的每个样本数据都应按照特定的方式统一命名,即通过当前目录名字或者样本名字,可以知道目录或样本的详细分类情况;第三,所保存的每个分类需要有相应的说明内容,包括数据类型、数据数量、数据标签获得方式等。
1.6 数据扩展
数据扩展可分为存储数据的扩展和数据中心的扩展。存储数据的扩展较为简单,只需将符合要求的数据添加到数据中心。当数据量增加到一定程度时,现有的计算机资源可能不足以保存和处理现有数据,从而需要对数据中心进行扩展。数据中心的扩展分为横向扩展和纵向扩展,可分别通过增加服务器或升级现有服务器的配置实现。
1.7 数据中心的管理与维护
建立一套科学高效的安全管理制度可提高数据利用效率、保障数据中心的安全。数据中心安全管理制度的内容应详细规范各级操作流程、明确管理责任以及责任追究机制,防止出现由于工作态度、作风等因素引发数据中心安全事故。所以,安全管理制度应包含以下方面的内容:第一,明确数据平台运行和安全管理的具体措施,如数据备份、数据加密、数据权限管理、数据传输安全、数据检查等;第二,明确平台管理责任,落实各级平台运行维护管理人员的责任,建立追责和处罚制度;第三,建立安全应急预案,应对各类突发的数据平台安全事故。
1.8 数据备份和恢复
数据备份与数据恢复是数据中心信息安全的一个重要保障。为应对不同类型的数据丢失,多种数据备份策略极为重要。备份方式分为完全备份、增量备份、差分备份、按需备份等,可根据数据中心的数据情况和备份内容,按需采取多种策略搭配的备份方式。
2 智能服务云平台的建设
基于眼科数据中心积累的数据资源,可以研发一系列眼科人工智能预测、筛查、诊断、治疗、随访系统并进行临床应用。将系统部署到服务云平台,开放给患者、医生和医疗单位,通过互联网进行访问的端口,提供相应的医疗服务。对提高眼科人工智能系统的服务效率、可及性、推广眼科人工智能产品都具有重要意义[4,7]。
智能服务云平台的建设包括一般智能服务云平台的建设和基于互联网医院的智能服务云平台的建设。一般智能服务云平台的建设不需要依赖于实体医疗机构及互联网医院平台,是比较常见的智能云服务形式。智能服务云平台的系统架构可如图1所示。1)用户层:用户包含但不限于社区服务中心等医疗单位医务人员、幼儿园和中小学等学校单位医务人员、后台管理人员、大众用户(家长/学生)。2)展现层:根据不同的使用场景及用户需求,可分为手机APP、平板APP、电脑PC、微信公众号不同的应用形式。3)应用层:各系统功能模块,包括诊疗系统、健康管理与服务系统、数据分析管理系统、后台管理系统。可实现档案管理、在线门诊、远程问诊、一键转诊、健康教育、健康计划、数据分析等功能。4)应用支撑层是基于分布式多层构架和组件技术构建,具有跨领域和通用性的特质。兼顾稳定性、伸缩性、安全性以及效率等方面的要求,保证系统完整性。做到统一标准、统一交换、统一管理、统一认证、互联互通和资源共享。应用支撑层所提供的服务包括注册服务、病历调阅服务、影像查看服务等。5)数据资源层主要是实现各系统的数据存储,需要解决数据存储的结构、模型、内容、数据库管理软件的选型等。包括管理数据、业务数据、多媒体数据等。6)物理层主要指与系统对接的检验检测设备,通过与系统间的对接,实现数据的实时传输。
眼科智能服务云平台的部署可分为3级:家庭,学校和社区,基层和三甲医院等医疗单位(图2)。通过接口对接、网络传输等方式,实现各系统之间的数据互通,从而实现“就诊者-基层医疗机构-上级专家医院”之间的业务协作和资源共享。并通过“诊疗设备-软件系统-数据中心”之间的互联互通,实现数据的管理和分析等需求。
2.1 智能服务云平台的家庭、学校、社区等场景建设
该级智能服务云平台的建设一方面要满足家庭、学校、社区等场景下患者使用眼科智能诊疗系统的医疗需求,另一方面要满足医生可对智能诊疗系统的诊疗结果进行复核的工作需求。患者端的智能服务云平台的建设形式包括实现基于移动终端浏览器、小程序、终端软件等智能诊疗系统的访问和应用[8]。患者在手机、平板等移动终端连接到智能服务云平台,输入年龄、性别等就诊信息,对平台上不同诊疗系统的功能进行选择和使用。患者可以根据个人就诊需求,选择相应的功能并在智能系统的指导下输入文字信息并上传相应图片信息,即可获得相应的诊断结果和医疗建议。医生工作端可以24 h对人工智能诊疗系统的诊断结果和诊疗建议进行复核,保证云平台服务的质量和效率。
2.2 智能服务云平台的基层和社区医院场景建设
该级智能服务云平台的建设主要满足社区和基层医院为患者提供眼科相关智能诊疗服务的需求。部分基层和社区医院缺乏相应的眼科检查设备和眼科医生,智能服务云平台可以将眼科医疗资源下沉到基层医院,建立适用于社区和基层医院的眼科智能服务模式[9]。基层和社区医院的患者和医生可以将患者信息、检查图片、报告等上传到智能服务云平台,获得相应的诊疗结果和医疗建议,辅助基层和社区医院医生开展诊疗活动,将优质眼科医疗资源赋能到基层和社区医院。综合医院及专科医院的医生专家可对基层和社区医院的智能诊疗过程进一步复核与确认,保证其决策的准确性和安全性(图3)。
2.3 智能服务云平台的综合医院和专科医院场景建设
该级智能服务云平台的建设主要解决综合医院和专科医院眼科患者众多,眼科医生的工作效率与患者医疗需求差距较大的问题[10]。将智能服务云平台上相关的眼病诊疗系统与相关眼科图像采集设备和成像系统相连接,患者在接受相应的眼科检查后,可即刻在移动终端查询诊断结果和治疗建议,打通了部分检查环节和诊疗咨询环节之间存在的空间和时间壁垒,减少了医生的工作负担,提高了患者的就医效率和就诊体验[11]。此外,基于实体综合医院和专科医院的部署互联网医院智能服务云平台,诊疗流程符合互联网医院的管理规范,以进一步提高智能服务云平台的安全性和准确性。
3 讨论
现阶段眼科数据中心和智能服务云平台的建设存在两大难点:1)各大医院眼科数据中心建设关于数据整理及标注缺乏统一标准,各个眼科数据中心无法实现数据互通和资源共享,导致医院间的“信息孤岛”;2)优化智能服务云平台建设框架,整合多维度眼科数据集,搭建多种眼病通用诊断的智能服务云平台。
眼科数据中心和智能服务云平台的建设有助于实现医疗数据资源的充分利用,开发出高准确性和普适性的医学人工智能系统,并对智能系统进行统一整合、管理与推广,保证智能平台提供的医疗服务的准确性和安全性[12]。该模式可以在眼科专科以外的其他医疗专科进行推广和应用,对于促进医学人工智能系统的研发与普及,推动医疗模式的智能化改革,具有重要意义[13]。