作者:暂无
来源:《计算机世界》 2013年第15期
医疗行业在诊疗时会产生海量医疗健康数据的处理需求,使其成为了应用大数据的先锋。
本报记者 汤铭
一张CT 扫描图像,含有约150MB 的数据; 一个基因组序列文件大小约为750MB;标准的病理图的数据量则大得多,要接近5GB。如果将这些数据量乘以人口数量和平均寿命的话,仅一个社区医院所累积的数据量,就可达数TB 甚至数PB 之多,而且其中还富含图像、视频等非结构化数据,更别说规模更大的医疗机构,甚至是地区医疗主管部门汇集的数据集了。
可见,就数据集的规模、多样化程度和增长速度而言,医疗行业确实面临着艰巨的大数据应用挑战。
医疗行业的大数据集量大且繁杂,其中蕴含的信息价值也多样且丰富,如果能够对其进行有效的存储、处理、查询和分析,那么就可对于小到辅助某个临床医生做出更为科学和准确的诊断和用药决策,或帮助某个医院根据患者潜在需求开发全新个性化服务及自动服务,大到帮助相关研究机构突破医疗方法和药物革新,或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置,提供前所未有的强力支持。
相关业内专家表示,当前医疗机构在建设的电子病历和大数据有着紧密的关系,电子病历发展到高级阶段或者成熟阶段必会带来大数据的问题。因为前者会把所有的医疗过程、质量、精细化管理数据都采集下来,这些数据不但数据量特别大,而且种类也特别复杂,所以需要用大数据的技术帮助医疗机构和医务人员来更好地利用这些数据。
天坛医院信息中心主任王韬向记者表示,天坛医院已经开始了大数据方面的尝试。“我们处理的信息量的绝对值不是特别大,但是处理的信息种类是很繁杂的。在大数据应用方面,主要是为科研以及绩效考核服务。”
10 年前,“非典”肆虐。王韬认为,如果当时能有大数据的应用,有了非常好的分析手段,对于非典的研究绝对是有帮助的。
在公共卫生领域,如果大数据以区域卫生主管部门,甚至是国家卫生管理部门的规模使用的话,可能在预防、预警非典这样原本不为人了解的陌生疾病方面起到相当大的作用。
然而,如何将海量、复杂的数据的存储、处理和保护成本降至最低,同时还能对此进行实时或准实时的处理、秒级的查询需求响应以及智能、深入的分析,却面临着重重挑战,其中“入门”第一关,就是大数据集的存储、处理和查询难题。
目前,来自英特尔的开放架构大数据平台也渐渐为越来越多的行业用户所熟悉。在硬件方面,该平台基于支持横向可扩展存储方案开发的双路至强处理器,软件方面由专门为大数据存储、管理、处理和查询需求开发的,并已经对至强平台进行了充分优化的英特尔Apache Hadoop 发行版软件所组成。
正是这一硬一软的搭配,为行业用户解决大数据应用的入门难题带来了突破——它可以凭借出色的成本优势,支持TB/PB 级大数据集的分布式存储、实时处理和查询应用,并支持在其上开发部署丰富的大数据分析应用。
据悉,已经有长三角地区的区域医疗卫生信息平台采购了英特尔的大数据技术,来进行个人健康档案的管理分析。
链接
英特尔携手伙伴推进医疗大数据应用
3 月29 日, 英特尔公司与嘉和美康信息技术有限公司达成合作,欲致力于携手本地合作伙伴,共同帮助中国医疗行业用户更为广泛且充分地利用大数据技术。
这标志着英特尔的大数据技术将在医疗行业落地,英特尔在大数据方面的软硬件技术将与嘉和美康既有的医疗信息化应用及方案结合,为医疗行业用户大数据的多维度、多层次应用提供强有力的技术平台支撑。
因篇幅问题不能全部显示,请点此查看更多更全内容