人类历史上首次看清小鼠基因组DNA全貌澎湃号·湃客澎湃新闻

当读到“产生一条多肽链或功能RNA所需的全部核苷酸序列”的科学定义时,多数人都会露出一头雾水的表情。但当听到“生命之书、生命的密码、生命的钥匙、遗传的蓝图”的比拟时,大家都会下意识报出:这是DNA!

2024年12月5日,西湖大学生命科学学院、西湖实验室俞晓春团队再国际顶尖学术期刊Science上发表了题为:Thecompletetelomere-to-telomeresequenceofamousegenome(完整的端粒到端粒小鼠参考基因组序列)的研究论文,报道了该团队在解析小鼠参考基因组方面取得的重要突破。这意味着人类历史上第一次看清小鼠基因组DNA全貌。

现在,请用上一些想象力,一起走入基因组DNA的殿堂,造访大自然塑造的“生命密码”。

想象你的面前出现了一座汗牛充栋的图书馆,这是隶属于某个人类同胞的一个细胞核。你步入其中,看到了几十排标注着“染色体”的书架。你随机选了一个架子,抽出了几本书,发现书的封面上都写着“DNA”。接着,你翻到其中一本的目录页,上面指示了“本书共含有X个基因”。你随意浏览了不同基因的章节,意识到这些篇章仅由四个字母构成——A、T、C、G——这些叫作“碱基”的字母不断变换顺序、排列组合,最终写完了全书……

很好,现在你已经了解了基因组DNA的基本面貌。

事实上,读取这些碱基字母排序的过程,正是“大名鼎鼎”的基因组DNA测序。

1977年,弗雷德里克·桑格发明了第一代测序技术,特点是只能测试一个基因的某个部分,最多一个基因。本世纪初,第二代测序技术问世,它克服了前一代的缺点,一次能读取成千上万的短DNA片段,因此也被称作高通量测序技术;但它依然存在症结:能读取的DNA片段过短,通常在100-300个碱基对(bp)之间。2010年左右,第三代测序技术诞生,实现了对每一条DNA分子的单独测序;换句话说,现在我们能够读取较长的DNA片段了,可以达到10-50千碱基对(kb,1kb=1000bp)甚至更长。

既然人类的“基因拼图”已完成,想必小鼠的“拼图”也胜利在望了?令他们没想到的是,这一等就是一年。

亲自做基因测序,对俞晓春实验室来说,实属一个“无心插柳柳成荫”的课题:直到2023年4月,他们都在等待两家资金雄厚、早已对外宣布下场的美国与英国科研机构做完并发布小鼠的完整基因组DNA图谱。

为什么他们如此关心小鼠这尚缺的7%-8%序列?这是因为,这些未知的基因组DNA里或许隐藏着一些至今无法解释的遗传性疾病的谜底。

这些“空白”尤其存在于异染色质和核糖体DNA(rDNA)区域。这些区域富含重复的基因序列,即一些反复出现的,看似近乎一模一样、但实则有细微区别的片段——你可以想象为许多块极其相似的拼图。二代基因测序技术仅能测出其中的一段(且由二代技术完成的小鼠基因组图谱中还有错误),对完整的排序序列“束手无策”;而三代技术可以“完全看清”。

时至2023年的春天,迟迟不见欧美的实验室发布“大新闻”,俞晓春实验室最终决定自己动手拼完这幅小鼠基因组“拼图”。“(全球)剩下的人一直在等,但我们不想等了。”俞晓春回忆说。

这个诞生于意外的课题,研究过程相当顺利,历时一年就完成了。

简单来讲,俞晓春团队综合了众多三代基因测序技术,让它们互相补足,开发了一把能够充分挖掘小鼠基因的“金铲子”。他们以最常用的小鼠C57BL/6的单倍体胚胎干细胞(mhaESC)为样本,进行了基因测序和组装,获得了长度为2.77Gbp(表示十亿个碱基对)的完整的高质量小鼠参考基因组序列,其中包含215.23Mbp(表示一百万个碱基对)先前未被鉴定的序列,填补了约7.7%的基因组空白。

mhaESC基因组与先前参考基因组的共线性比对结果

如果你对他们基因组DNA“拼图”的步骤感兴趣,这个流程大致是这样的:第一步,测序技术把所有拼图(即片段)上的图案(即碱基对)读完;接着,计算机对这些信息进行数据处理;最后,复杂算法会完成“拼装”(即基因组组装),形成完整的全貌。这个过程涉及到了PacBioHiFi、OxfordNanopore超长、Illumina短读长、Hi-C和BioNano光学图谱等多项基因测序技术。

那么,这些研究人员具体取得了哪些关于小鼠基因的新发现呢?

首先,发现了新的蛋白质编码基因。顾名思义,这些基因的作用是编码对应的蛋白质。与先前的参考基因组版本相比,该研究额外注释了639个蛋白质编码基因,其中先前未被发现的全新的蛋白质编码基因有140个(这是因为639个基因中部分为已知基因的“重复”拷贝)。这些新的蛋白质编码基因可能参与多种生物学过程,为未来的研究提供了新的方向。

第二,较精确地“看清”核糖体DNA的基因序列。核糖体是细胞内的“蛋白质工厂”,负责合成蛋白质。核糖体DNA是细胞中的一种特殊DNA,它专门负责编码核糖体的RNA(rRNA)——一种核糖体的重要组成部分,帮助核糖体合成蛋白。用简洁的比拟来说,核糖体DNA给出了细胞内rRNA的“蓝图”。这个发现为进一步解析核糖体潜在的蛋白质翻译功能的差异性提供参考。

从科学意义上来说,俞晓春实验室的这项研究,通过综合“长读长”第三代测序技术成功完成了小鼠基因组的端粒到端粒组装,填补了现有参考基因组中的空白区域,揭示了新的基因和结构变异,“拼完”了小鼠基因组图谱的“拼图”。这些发现不仅提高了对小鼠基因组结构和功能的理解,也为基因组学研究提供了重要的技术参考和数据资源。

在这项研究中,两位第一作者,分别发挥了科研所长,刘俊丽助理研究员负责湿实验及论文图片,李麒麟助理研究员负责干实验及文稿;通讯作者俞晓春教授负责“掌舵”课题的大方向以及论文的完善。

“你们在研究过程中遇到最大的难点是什么?”这个问题竟然有朝一日成为了实验室“答不上来”的问题。正如前文所言,这个课题进展势如破竹,投稿过程也十分顺利。

如果说这个课题有一个发起人,那非李麒麟莫属:他是俞晓春团队第一个注意到人类基因组序列完成的人。出于对遗传学和基因组学的兴趣,他从大学本科直至在美国做博后阶段都专注于生物信息学。李麒麟说:“但我发现做纯数据并不能对实际情况有很好的了解,所以最后我选择了俞老师的实验室,这里有湿实验的实时结果给出反馈,这样我再去做数据分析,研究能更好地开展。”

当然,俞晓春实验室剑指的始终并不是小鼠基因组真容本身,而是希望利用这把“基因组之铲”探索遗传性癌症、发育性疾病未解的致病机理。“支线”的故事已完成,接下来,让我们一起静待这个实验室的“主线”诞生更多助力人类攻克顽疾的成果。

课题组简介与招聘信息

西湖实验室助理研究员刘俊丽博士和李麒麟博士为论文共同第一作者,西湖大学生命科学学院科研副院长、西湖实验室科研副主任俞晓春教授为通讯作者。该研究得到国家自然科学基金、浙江省自然科学基金、浙江省“尖兵”&“领雁”项目、杭州市领军型创新创业团队、西湖教育基金会和西湖实验室提供的经费支持,同时感谢西湖大学生物医学实验技术中心、实验动物中心及高性能计算中心等平台的支持。

THE END
1.科学网—关注临床神经医学:精选优质期刊与高被引文献作为全球领先的专业学术出版品牌,Taylor & Francis始终关切医学研究与临床的最新进展,致力于推动人类健康科学的边界,旗下一系列专业医学期刊为临床神经科学相关前沿成果的发表和传播搭建起一个国际化的平台! 本文将为您介绍Taylor & Francis临床神经科学相关的领先期刊和近三年的高被引文章,希望为您的临床工作和学术研究https://blog.sciencenet.cn/blog-3574014-1463069.html
2.循证医学中最好的证据是指().循证医学中最好的证据是指(). A.基础研究 B.大规模的随机对照临床试验 C.经验分析 D.病例报告 E.描述性研究 点击查看答案进入题库练习 查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧 无需下载 立即使用 你可能喜欢 单项选择题 下列哪项不是可及性服务的内涵()。 A.地理上的接近 B.价https://m.ppkao.com/mip/tiku/shiti/3905595.html
3.2020年三级降管理师考试《基础知识》练习题:临床医学基础9.循证医学中最可靠的证据是来自 A.随机对照试验 B.描述性研究 C.队列研究 D.病例对照研究 E. meta分析 10.目前呼吸系统、骨关节系统、消化系统疾病首选的影像学方法是 A. CT B. X线成像 C. MRI D.超声成像 E. DSA 二、多选题 1.介入治疗主要分为 https://www.laixue.com/article/381807
4.国际国内公共卫生情报信息2023年第34期共同第一作者杨鹏飞教授表示,“这强烈提示我们应该从成本效益、患者特点、预期延误等方面予以个体化精准决策。目前,相关亚组研究工作正在紧锣密鼓开展中。” 据悉,荟萃分析是最高级别的循证医学证据,是临床医学循证等级中最可靠的证据之一。这一研究成果中,来自中国三个研究团队的85家中心的研究者们贡https://www.pzhcdc.com/Article/View?id=7554
5.每日热点0828共同第一作者杨鹏飞教授表示,“这强烈提示我们应该从成本效益、患者特点、预期延误等方面予以个体化精准决策。目前,相关亚组研究工作正在紧锣密鼓开展中。” 据悉,荟萃分析是最高级别的循证医学证据,是临床医学循证等级中最可靠的证据之一。这一研究成果中,来自中国三个研究团队的85家中心的研究者们贡https://www.sccdc.cn/Article/View?id=31768
6.循证医学超星尔雅学习通网课答案D、实施循证医学意味着医生要结合当前最好的研究证据.临床经验和病人的意见 E、当高质量的研究证据不存在时,前人或个人的实践经验可能是目前最好的证据5、【判断题】1995年,Sackett在牛津大学成立全球第一个循证医学中心。2.6章节测验1、【单选题】实施循证医学的主要证据来自于 A、医生的临床经验 B、患者的体会http://zunyi.ehqc.cn/ask/80_06.html
7.降管理师复习错题集(单选)D目前最可靠的循证医学证据来自“临床指南” 答案D 循证医学最可靠的证据来自于“随机对照试验” 12、常规检测—般不包括下列哪项 A尿量、比重、酸碱度等 B尿钾,尿纳等微量元素 C尿蛋白、尿糖、尿酣体等 D尿胆原、尿胆红素等 答案B 尿液一般检测包括:①一般性状检测:尿量、气味、外观、比重、酸碱度等;②化https://www.jianshu.com/p/398e292f53d1
8.2.5作业3(题目+答案):证据检索(循证医学)3(多选题)在选择证据资源来检索循证医学证据的时候,可参考证据资源5S金字塔模型。以下关于这个模型的描述,正确的是: A最理想的是计算机辅助决策系统(System),目前还不普及,也在不断完善之中。 B最现实的是诸如中国知网、万方数据知识服务平台、维普网、PubMed、Cochrane Library等数据库,能提供系统评价(Syntheses)和https://www.meipian.cn/4xe7q5gk
9.循证医学循证医学中证据的质量分级 证据是循证医学的基石,遵循证据是循证医学的本质所在。临床研究者和应用者应尽可能提供和应用当前最可靠的临床研究证据是循证医学的关键。循证医学中的证据:主要指临床人体研究的证据,包括病因、诊断、预防、治疗、康复和预后等方面的研究。 https://baike.sogou.com/v401527.htm
10.循证医学基础知识二十一世纪临床医学的新模式(1)临床证据的来源不同 传统模式用以动物实验为主要研究手段的病理生理学成果,解释疾病的发病机制和生化指标等,并用这些指标评价临床疗效。循证医学模式认为,掌握疾病发病机制和观察各种临床指标的变化是必要的,但更强调来自临床随机对照试验及Meta分析的最佳证据。经验医学的证据来源于教科书和零散的临床研究,而循证医https://www.hdph.com/?a=1069
11.循证医学课后体会(精选8篇)在未接触这门课程之前,我对“循证医学”这四个字透着朦胧的迷茫。只有最初的“高端,大气,上档次”。当真正接触它采了解它的含义:它是遵循科学证据的医学,指的是临床医生在获得患者准确的临床依据的前提下,根据自己的临床经验和知识技能,分析并抓住患者的主要临床问题,(诊断,治疗,预后,康复等),应用最佳的和最新https://www.360wenmi.com/f/fileiumdk6wq.html
12.循证医学理念范文11篇(全文)这就要求我们培养的医学生必需具有深厚的人文精神, 必须把握和研究医学的人文内涵, 提高医学生的文化自觉。循证医学的核心理念就是在“获取当前最好的研究证据、结合临床医生的个人专业技能和临床经验、同时考虑患者的价值和愿望”的基础上, 做出临床决策。这不仅体现了一个合格医生对医学科学的求实探索, 更重要的是https://www.99xueshu.com/w/ikeyp9ubmg53.html
13.循证医学证据资源“6S”分类不包括()B. 审核批准民航维修单位的维修许可证并实施监督管理 C. 民航企事业单位的安全监督 D. 组织行业技术资格和相关资质评审、制订 查看完整题目与答案 无需适航部门批准的技术文件包括() A. TC B. PC C. MPD D. MRBR 查看完整题目与答案 为保证航空器支行安全性和可靠性需对维修方案进行优化,优化https://www.shuashuati.com/ti/4f9fcce893614153855c4c1b52f325ee.html
14.2022年循证医学考试复习题库资料(含答案).pdf不正确的是 A、临床研究的可靠证据是循证医学的基石 B、循证医学可以使患者得到最佳临床效果和生活质量 C、循证医学不包括医药师长期实践积累的临床诊治经验 D、循证医学建立在证据、医务人员的实践及患者利益结合之上 E、循证医学结合具体患者采用有效、合理、实用和经济的治疗手段 答案:C 2.()是实践循证医学的https://max.book118.com/html/2022/0526/6154021243004151.shtm
15.Cochrane协作网与循证医学(一)(医学实践)然而,在所有证据中,按照特定疗法收集所有质量可靠的随机对照试验后所作的Cochrane系统评价被认为是循证医学最可靠的证据之一。因为CSR涵盖广泛,并随着新证据的产生、用户的需求、读者的批评和建议而不断得以更新,因而可为临床医生提供更可靠、更有针对性和精确性的研究依据。目前,CSR的结果正成为许多发达国家卫生决策的http://www.100md.com/html/DirDu/2005/05/21/56/42/20.htm
16.卫生技术评估与卫生政策评价实证篇最新章节赵琨著在此基础上,辅以临床路径管理信息系统,为临床医务人员提供更科学、可靠的循证医学证据,辅助临床决策,保证医疗服务行为规范和医疗质量。但同时我们也需要认识到,在当前国内医患关系剑拔弩张的恶劣环境下,规范医疗服务行为,需要政府、医疗保险部门、医疗机构、医务人员和患者长期的共同努力,不可能一蹴而就。 需要强调的https://m.zhangyue.com/readbook/11813832/2?p2=1004155
17.下列循证医学证据中可信度最高的是()循证医学证据的GRADE分级系统,更加周全地考虑了影响证据可信度的因素不包括()。 A、研究设计、偏倚风险 B、精确度、一致性 C、间接性、效应 D、安全性 点击查看答案 第2题 下列哪种研究类型的循证医学证据级别最高() A、随机对照试验 B、系统分析 https://www.youtibao.com/226z2e4x.html