文件大小:0.8M
摘要:[目的] 面向国家人口健康科学数据中心数据集中存储、数据安全风险、计算资源有限、用户分析利用需求迫切等特点,研究适合国家人口健康科学数据中心数据飞地的建设思路,为用户提供更高效、安全和灵活的数据处理与分析环境。[方法] 归纳数据飞地的类型、特点、实现机制和不同场景的适用性,结合国家人口健康科学数据中心数据应用特点,基于融合安全增强、微隔离和人工智能等技术的虚拟数据飞地方式,构建国家人口健康科学数据中心大数据分析平台。[结果] 构建的大数据分析平台支持国家人口健康科学数据中心数据审核、数据加工、数据分析挖掘、用户发表论文关联数据同行评议等服务,累计完成2800余个项目3.2万个数据集的审核任务、1万余项数据分析任务和5000余项数据加工任务,数据泄露事件发生率为0,资源利用率达80%。[局限] 无法实现跨机构分散存储的数据共享,还需结合数据中心发展探索基于多方安全计算和联邦学习等隐私保护技术的数据飞地研究。[结论] 有效解决人口健康数据集中方式的安全共享与协作分析需求,对国家人口健康科学数据的安全保障和共享利用具有重要意义。
文章目录
1 引言
2 数据飞地概述
2.1 概念分类
2.2 关键技术
2.3 应用实践
3 数据飞地技术在人口健康数据共享中的应用探索
3.1 框架设计
3.2 技术方案
3.3 应用效果
4 结语