大数据研究中心设有多个创新研究平台,建立了七个实验室。
健康大数据实验室:专注于心电与手术重症预警检测、脑电与精神健康数据分析、医学图像处理、老年(乐龄)健康数据分析、儿童健康数据分析、中医药多元关系发现、中药元素成分研究和环保方面的火电厂脱硫系统出口SO2浓度检测分析预警。
以校附属医院健康医疗数据、校公共体育部运动康复数据、冀南环境数据和校计算机学科资源及云平台为基础支撑,构建创新、开放、国际化的智慧健康大数据研究中心,为健康、环境和信息交叉融合研究提供大数据平台,促进区域大数据产业发展。
水利大数据实验室:计算水力学、港口航道与海岸工程、洪水灾害模拟、预报及风险管理、流体与结构物相互作用。
全面整合分散的各类水利信息资源,实现信息共享,并对数据进行深度挖掘,以满足水利业务和事务发展需要。其中解决的主要问题包括:分布各处的水利数据到水利数据中心的实时汇集,海量水利数据的集中存储,结构化数据和非结构化数据的统一管理,以及有效的数据分析和挖掘等。加强水利大数据建设,加快水利大数据共享开放,提高水利大数据应用和服务能力,必将为协调解决水资源、水环境、水生态和水灾害等问题,促进水利改革发展,实现水利现代化提供更加强有力的支撑。
环保大数据实验室:环境大数据检测与分析;
本实验室采用区域空气质量模拟和监测的分析手段相结合的方法,基于大数据分析,对河北地区尤其是河北南部的大气污染的成因、来源和控制开展研究。2011年搭建了高性能计算工作站,并在2015年进行扩容升级,目前计算核心达到144个,存储容量为70T,采用国际最先进的三维空气质量模型WRF-Chem进行区域空气质量模拟;2011年在邯郸市河北工程大学站点建立了河北省高校中第一个达到国际先进水平的、可为科学研究服务的空气质量综合监测、采样平台,可同时在线监测PM2.5、PM10、SO2、NOX、CO、O3等大气污染物;2014年底增加氨气(NH3)在线监测仪;2015年在在邯郸市5个代表站点(分别位于环保局、东污水厂、丛台公园、河北工程大学、邯郸钢铁公司)建立了PM2.5、PM10采样平台,开展多站同时采样;2017年增加挥发性有机物(VOC)在线监测仪,可同时在线监测56种物质。
安全大数据实验室:医疗大数据安全生态;
相对于其他领域的数据安全,医疗大数据安全要求更高,特别是用户医疗健康数据具有高度隐私性,一旦泄露会造成严重后果。本方向一方面关注基于据发布匿名保护技术实现用户医疗数据的隐私保护;另一方面研究基于用户行为的大数据认证技术,进一步保证用户数据的安全访问控制。
遥感大数据实验室:基于遥感、摄影测量及传统测绘方法及技术开展国情监测、农业监测、变形监测及环境评价等方面的研究工作。主要研究方向有:(1)遥感与摄影测量(2)工程测量(3)GIS应用及软件开发。
大数据挖掘与推理实验室:水资源与水环境智能管理理论与方法;
遥感、地理信息系统、传感网和射频技术等现代信息技术的发展与应用,全面拓展了水利数据的时空尺度和要素类型,水利数据的种类和数量急剧膨胀,呈现出多源、多维、大量和多态的大数据特征。然而,水利大数据中包含的不一致、缺失,以及随机、模糊和灰色等不确定性严重制约了数据的可用性,给大数据环境下的水资源优化带来了严重挑战。本方向主要针对大数据环境下的水资源与水环境管理问题中的不确定性,以随机、模糊、灰色等不确定性的数学理论为基础,结合支持向量机、神经网络、遗传算法等智能算法,建立大数据环境下的水资源与水环境智能管理理论与方法,为实际中的水资源与水环境预测、决策、优化、评价等问题提供借鉴。
数据清洗与可视化实验室:医疗大数据清洗与可视化.
医疗数据来源众多,如临床诊断、临床试验、电子病历、门诊病例、体检等。医疗数据同时呈现结构化、非结构化、半结构化等异构特性,这些都为为数据处理带来巨大挑战。本方向关注医疗大数据生态系统中的清洗和可视化研究。
(1)数据清洗:在多数情况下,原始医疗数据不可避免的存在数据缺失、噪声、不一致等问题。本方向重点研究数据的清洗和整理,通过数据清理、变换和集成,将原始数据转换成适合计算机识别和处理的数据形式;
(2)数据可视化:医疗数据可视化为数据价值挖掘、疾病预测、辅助诊断决策起到关键作用。本方向关注两个方面的可视化,一是宏观医疗数据可视化,指群体宏观层面上的可视化,注重从时间和空间(地理位置)两个维度进行群体疾病的可视化,可为疾病传播、流行病预测与趋势发展提供实时可视化依据,从而为疾病防控、舆情监测、决策制定提供客观数据依据;另一方面关注个体健康数据可视化,重点为健康体检、疾病预测、寻医就诊、精准医疗等提供个性化医疗服务。