给十万人测基因,得产生多少数据

山东白癜风医院 http://www.yunweituan.com/m/

在12月的第二周,中国大陆接连检出两例新冠病毒奥密克戎变种病例,我们想要锁定这个变种,对病毒进行基因测序,就是那个“金标准”。用测序锁定病毒的故事,可参考我们去年年初的文章《14天锁定新冠肺炎元凶背后,是14年的技术竞赛》。同为冠状病毒的“非典型肺炎”袭击人类时,我们还没有用上今天成熟的基因测序工具;而在新冠病毒来临时,我们得以在短短十几天里锁定病毒,这是生物技术的进步。

过去的两年里,测序工具为我们编织出病毒的变异谱系,也让流行病调研有了更科学的证据。

普通酱丨作者

一萌丨编辑

在上世纪70年代,弗雷德里克·桑格(FrederickSanger)发明了一种基因测序方法,并以自己的名字命名,而这也为他带来了第二块诺贝尔奖牌。简单地理解桑格测序是这样的:DNA由一块块颜色各异的积木(脱氧核糖核酸)组成,每块积木手拉手形成一条长链。桑格则在积木拼接过程中混入只有一只手的积木,长链就会在此中断,从而得知长链中每个位置分别是什么样的积木,也就是DNA的序列。

也许不必知道这么仔细,只需要知道它是一种准确,但低效且昂贵的方法。大名鼎鼎的“人类基因组计划”始于年,便是用桑格测序一点点摸清人的DNA,它最终耗时13年、烧了30亿美元才初步完成人类的全基因测序。

而在人类基因组计划完成的同一年(),“非典”来袭,我们最终确认这个新型病毒,也是靠基因测序——当然,病毒的RNA比起人类的DNA要简单得多。

人类基因组计划测序完成之后,整理数据与公布结果又花去了五年时间。但就在这五年间,另一种基因测序的方法进入了产业,给一个人做基因测序的时间缩短到四个月,它被称作“下一代基因测序”或“第二代基因测序”(Next-GenerationSequencing,NGS)。在NGS发展十几年后,这个数字已经缩短到了1-10天。

当然,高效率不是一蹴而就的,让NGS测序成功落地,还要感谢信息技术的突破。

数据的瓶颈

我们还需要再往回看看——年,NGS诞生不久,早期的NGS测序仪还只能检测大肠杆菌等简单的生物,原因就是人类基因组的数据过于庞大,超越了当时系统的处理能力。

这个问题源于NGS测序的原理。市场上有几家NGS测序仪公司,他们的技术路线略有不同,但大致的原理都是接近的:

一、先把基因组复制一批,然后打成一堆碎片(想象一下,一个分子“搅拌机”),每个碎片可能有几十到几百个碱基序列,这个长度被称作“读长”(bp),然后需要对这些碎片做一些简单的处理,准备送进测序仪检测;

二、把这些碎片分别进行测序,当然,一次可以同时测非常多个序列,看看测序仪巨头illumina


转载请注明:http://www.bainiangudus.com/gswh/26419.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了