澳门葡京游戏

[交汇点新闻]大数据时代流行病学研究面临何种挑战?中国工程院院士、南医大校长沈洪兵如是说……

发布者:宣传部发布时间:2020-12-18浏览次数:10

交汇点讯  “大数据时代流行病学研究的机遇是什么?面临何种挑战?”在日前举行的中国医促会公共卫生与预防医学分会成立大会暨首届华夏公共卫生高峰论坛上,中国工程院院士、澳门葡京游戏校长沈洪兵教授所作的学术报告对此进行了解说。

“大数据时代流行病学研究的机遇包括高通量组学技术的发展、人群队列研究数据和样本资源的积累、大数据和互联网技术的发展、人工智能技术及流行病学研究方法的发展等。”沈洪兵解释,以新一代测序技术和质谱技术为代表的高通量组学技术的突破,推动了基因组、表观遗传学、转录组、蛋白质组、代谢组、微生物组等组学数据的指数级增长。许多国家已将构建生物样本库式的超大规模人群队列作为战略布局,《健康中国行动(2019——2030年)》也鼓励和支持科研机构与高新技术企业深度合作,充分运用互联网、物联网、大数据等信息技术手段,开展大型队列研究。

随着互联网、移动智能、可穿戴设备等新技术的快速发展,健康医疗信息化得到广泛应用,在医疗服务、健康保健和卫生管理过程中产生海量数据,这些数据与来自队列研究的多组学数据等共同形成了健康医疗大数据。而将电子病历信息、各类组学信息、其它常规数据如出生登记、死亡登记等相链接而建立大型动态队列,已成为流行病学研究的热点。

以机器学习和深度学习为代表的人工智能技术在大数据分析中的应用正呈现爆发式增长,人工智能技术在疾病监测、病因学研究和风险预测方面具有广阔的应用前景。与此同时,组学数据的分析方法日趋成熟,推动了流行病学研究方法的长足发展,以深度神经网络为代表的人工智能技术在高维数据降维等方面显示出优异的性能。

   大数据时代流行病学研究也面临挑战。我国缺乏医疗健康大数据来源、收集和管理的共享机制,形成数据孤岛。”沈洪兵直言,我国健康医疗大数据由于管理共享机制的缺乏而分散在不同的实验室和机构内部,而来源于各个机构、领域的数据往往使用不同的系统和软件平台,数据收集、存储和管理的标准规范也各不相同,多来源的数据在格式、结构、语义关联质量等方面都存在差异。如何将跨机构、跨领域、跨平台、跨系统的数据库打通共享,是目前大数据使用面临的最大壁垒。

“多组学生物统计和生物信息学分析方法也有待进一步开发和提升。”沈洪兵指出,适用于健康医疗大数据的软硬件平台、大数据存储、传输、高性能计算和云计算等技术尚不成熟,制约着健康医疗大数据的研究。基因、蛋白质和代谢物所构建的调控网络极为复杂,如何整合多组学信息从而形成系统层面的理解,是健康医疗大数据研究面临的重要挑战。
   “健康医疗大数据在存储、共享、分析、挖掘等过程中存在个人信息权、隐私权可能受侵害的风险和数据安全隐患,如何对健康医疗大数据进行法律和伦理上的规制,已成为亟待解决的问题。”沈洪兵表示,应尽快推动建立个人健康信息隐私保护相关法律法规。   

交汇点记者 蒋廷玉

编辑: 叶真