真实世界研究的基石——国内外真实世界数据库纵览

随着大数据技术在医疗行业的深度融合,合理的数据治理与应用将给医疗体系搭建、医疗机构运作、临床研发、诊断治疗等多方面带来变革性的改善[1]。

医疗大数据现状概览:

数据内容——各类人群的基线信息、营养状况、疾病、用药、实验室检查及医疗保险索赔数据[2];

应用场景——临床决策支持、健康及慢病管理、支付和定价等;

服务对象——居民、医疗服务机构、科研机构、医疗保险机构、公共健康管理部门等[3]。

本文就国内外有代表性的医疗大数据库进行简介。

2

国外医疗大数据库[4,5]

支付方数据库

国外的支付方数据库主要分为三类:商业保险为主导的数据库、国家医疗保险为主导的数据库以及混合型数据库。

美国是典型的以商保为主导的国家,政府支持的医保项目主要是Medicare(老年人)和Medicaid(贫困、儿童、特殊残障人士等)。商保数据由各个商保公司管理。如美国最大的健康保险公司UnitedHealthcare,和美国最大的医疗集团KaiserPermanente。以Kaiser医疗集团为例,其数据量覆盖了超过1200万会员的医疗和支付数据。美国最大的非盈利保险组织BCBS(BlueCrossBlueShield)覆盖了长达10年超过2亿条的医疗记录。通过BCBS的数据库已经产出了近4000篇论文。

英国和日本是典型的以国家医疗保险为主导的国家,医保的支付方数据均采取统一收集的方式。日本全国医保数据库NDB(NationalInsuranceClaimsDatabase)是基于医疗保险理赔和特定健康检查和指导建立的理赔数据库,截止2018年累计登记的医疗保险索赔数量为153亿。英国的NHS(NationalHealthService)是全国性的卫生服务数据库,主要包括社区用药数据、健康咨询数据、医院内用药数据、疾病注册数据、实验室检查数据、癌症数据及医院疾病编码数据等。英国政府也有意向在未来将这些数据公开给社会使用。

德国是典型的混合型医疗保险的国家,有多个法定的医疗保险和不同的商业健康险,但是由于支付方数据比较分散,通常难以得到大样本群体的信息。

临床数据库

美国的eMRGE(ElectronicMedicalRecordsandGenomics),欧洲的EHR4CR(ElectronicHealthRecordsforClinicalResearch),以及英国的CPRD(ClinicalPracticeResearchDatalink)是三个国外较成熟的临床数据库。

eMRGE由美国NIH(NationalInstitutesofHealth)于2007年发起,整合了电子疾病记录(EMR)和基因组学的数据,主要用来支持经济效益和健康效益评估研究。

EHR4CR包含了欧洲35家医疗机构,5个国家,10家企业的EHR数据,其核心功能是患者招募的精准筛选及定位。

从患者基本人口学、临床症状、用药、医疗咨询、转院、疫苗接种、辅助检查、治疗处方和手术等临床维度进行登记,能追踪约三十年的临床数据。

其他数据库

其他数据库主要包括以研究为目的所建立的各种登记注册的队列或研究数据库,例如美国开展较早的NHANES(NationalHealthandNutritionExaminationSurvey)成人和儿童健康营养状态的登记数据库,和SEER(Surveillance,Epidemiology,andEndResults)大型肿瘤登记注册数据库,瑞典2018年建立的包括患者基本信息、用药、死因、癌症、电子疾病记录及百余种疾病的全国质量登记注册数据库。

3

中国医疗大数据库情况

国家人口健康科学数据中心

国家人口健康科学数据中心(NationalPopulationHealthDataCenter)是国家科技部和财政部认定的国家科学数据中心。经过17年的发展,集成了涉及基础医学、临床医学、药学、公共卫生、中医药学、人口与生殖健康等多方面的科学数据资源。2019年12月底,国家人口健康科学数据中心数据仓储(PopulationHealthDataArchive,PHDA)开展国际认证工作,正式被re3data.org和FAIRsharing数据仓储目录认证并收录。

中国慢性病前瞻性研究

中国健康与养老追踪调查

中国健康与养老追踪调查(ChinaHealthandRetirementLongitudinalStudy,CHARLS)由北京大学国家发展研究院牵头,据其官网记载,旨在收集中国45岁及以上中老年人个人和家庭层面的数据,用以分析我国人口老龄化问题。CHARLS全国基线调查于2011年开展,采用多阶段抽样的方法,覆盖了全国150个县级单位和450个村级单位的约1.7万人。每2到3年,研究者会对样本人群进行一次随访调查,并在一年后将数据对学术界公开。

中国老年健康影响因素跟踪调查

随着国家对临床研究的重视,各地医疗机构或医联体都在建立电子化数据平台,并进一步建立疾病数据库。

我国癌症中心建立的国家肿瘤随访登记数据库纳入了全国200多个登记处的肿瘤资料,并且每年向全球肿瘤登记中心提供我国肿瘤的发病情况;汕头大学医学院第一附属医院以近10年来的全量病种数据为基础,根据医院各科室的临床科研需求和行业建设标准,建设了涵盖101个专病病种的科研平台;北京医院经国家卫生计生委批准设立国家老年医学中心,构建覆盖全国的老年病大数据平台,辅助医疗机构和临床医生更好的诊断和治疗,并为重大老年疾病防控决策提供科学依据。

4

我国医疗大数据库建设与应用的挑战

目前我国大数据智能平台面临着多种挑战,从技术角度上存在如数据整合和储存、数据的挖掘利用、信息的合规应用与共享和隐私保护等问题,而在实施过程中的挑战包括标准化难以实施,信息孤岛等问题[6]。基于医疗产业的实际情况,医疗大数据库在我国的建设与应用主要面临三大挑战:

信息不足和孤岛

相比于欧美,我国医疗大数据库在基因、用药模式和医疗保险索赔等方面仍存在数据信息不足的情况。此外,医疗服务机构,政府部门以及医疗公司掌握的医疗数据库往往没有建立数据共享机制,造成了医疗数据信息孤岛现象[7]。

缺乏统一医学术语体系

医疗信息系统的爆炸式增长使得临床术语出现很多变化,给数据交换带来障碍。一些普遍被采纳的国际医学术语体系尚未被统一翻译并纳入到我国临床实际应用中[8];同时,我国大多数医疗机构目前采用不同的技术架构和数据标准,并且不同的医疗机构间没有数据交换的系统性需求。虽然我国已有一些区域医疗数据平台和试点,但仍处于建设和应用的初级阶段,针对数据结构、数据标准和数据传输协议方面的改进仍需要大量工作。

缺乏完善的管理系统和专业人才队伍

在中国,医疗大数据备受医疗卫生和监管决策部门的重视,随着数据质量和数据可及性的不断提高,可应用的场景必将与日俱增。

THE END
1.数据资源写论文不知道在哪找数据?这些专题数据库都给你整理好了!1.CCAD(浙大卡特-企研中国涉农研究数据库) 该专题库涵盖新型农业经营主体、涉农市场主体、数字农业、绿色农业、农业生产、农产品研究、乡村研究、三农研究统计数据等研究主题。 2.TFID(浙商大泰隆-企研中国普惠金融数据库) 该专题库涵盖普惠金融服务、普惠金融机构、普惠民营企业、普惠小微主体等研究主题。 https://blog.csdn.net/weixin_55633225/article/details/139069921
2.高效检索的关键科研数据库在现代研究中的应用与挑战随着科学技术的飞速发展,信息量日益增长,科研人员面临着如何快速、准确地获取所需信息的挑战。科研数据库作为一种重要的信息资源工具,对于促进学术交流和知识传播起到了至关重要的作用。本文将探讨科研数据库在现代研究中的应用以及面临的一些挑战。 首先,科研数据库提供了一个集中存储大量学术文献资料的地方,这些文献涵盖https://www.phiyhnlirw.cn/jin-dai-ming-ren-jun-shi/751560.html
3.科学网—如何选择和使用开放获取数据库如今,开放获取数据库方兴未艾。研究人员可以通过开放获取数据库检索论文、期刊、知识库、政策文件、图书、图像等资源。越来越多高校、科研机构和政府机构也在着手构建开放获取数据库,提供免费在线资源。 但如何根据个人需求寻找最合适的开放获取数据库?检索开放获取数据库有什么注意事项?以下内容或许对你有所帮助。 https://blog.sciencenet.cn/home.php?mod=space&uid=3201402&do=blog&id=1417437
4.科研项目统计数据库有哪些帆软数字化转型知识库科研项目统计数据库是指收集、整理和存储各种科研项目信息的数据库,旨在为科研人员、机构和政府部门提供科研项目管理、评估和决策支持。这些数据库通常包含各种科研项目的基本信息,如项目名称、项目负责人、资助机构、研究领域、资助金额、项目进展等内容。 2. 有哪些知名的科研项目统计数据库? https://www.fanruan.com/blog/article/17455/
5.植物研究相关数据库汇总http://bioinf.scri.sari.ac.uk/cgi-bin/plant_snorna/home 植物snoRNA基因数据库 http://bioinformatics.psb.ugent.be/webtools/plantcare/html/ 植物顺式调控元件、增强子和抑制子数据库 http://metacrop.ipk-gatersleben.de 作物代谢途径数据库 http://podb.nibb.ac.jp/Organellome 植物器官研究数据库 httphttps://www.jianshu.com/p/2c909949a521
6.分享几个数据库吧,别再纠结做不做实验拿数据了猪定胜人 重症医学科医师 mimic 怎么提取数据,有教学吗,不胜感激 2022-12-13来自iOSIP浙江浙江 收藏https://www.dxy.cn/bbs/newweb/pc/post/47321516
7.科学数据库按照《国家中长期科学和技术发展规划纲(2006-2020年)》的总体部署和要求,科技部正式启动了蛋白质、纳米研究、量子调控、发育与生殖等的四项重大科学研究计划,其中“纳米研究”计划的项目依托单位是国家纳米科学中心。为了加强完善纳米研究项目的实施及相关科学数据的共享,纳米研究专业数据库重点围绕已启动实施的四十余项纳米http://www.nano.csdb.cn/
8.上市公司数据行业数据价格数据中商产业研究院数据库宏观数据,产量数据,销量数据,上市公司数据,行业数据,价格数据,中商产业研究院数据库https://s.askci.com/