基因组识别技术简介
基因是控制生物性状的遗传信息,通常由 DNA(Deoxyribonucleic Acid,脱氧核糖核酸)序列来承载。基因也可视作基本遗传单位,即一段具有功能性的 DNA或RNA(Ribonucleic Acid,核糖核酸)序列。大千世界的万物生长都遵循生命中心法则,受控于生命的遗传密码–基因组,这是生命科学的最基本的法则。基因组从含有30 亿对碱基的受精卵形成开始,决定并影响着人的生老病死。要揭示生命的奥秘,就必须从基因组开始,贯穿生命中心法则,进行动态和系统的研究。
“人类基因组计划“正是人类为了探索自身的奥秘所迈出的重要一步,是继“曼哈顿计划“和“阿波罗登月计划“之后,人类科学史上的又一个伟大工程。它的目的是解码生命、了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机理及长寿与衰老等生命现象,为疾病的诊治提供科学依据。我国承担了“人类基因组计划“项目中1%的任务,即人类3号染色体短臂上约 3000万个碱基对的测序任务。我国是参加这项研究计划的唯一的发展中国家。
近年来,“人类基因组计划“催生的测序仪、质谱仪等生命组学工具日益成熟。结合高分辨率影像系统,人们不仅可以将对生命的解读从微米、纳克的尺度推进到分子和原子级别的生命微观观察尺度,更可以遵从生命中心法则,从基因组到蛋白组再到多组学贯穿,实现从微观到宏观、从生到死的跨尺度、多维度、多模态、全方位、全周期的海量全景式生命大数据解读和研究。
基因组识别是通过基因测序、生物信息学分析等步骤,识别特定的具有生物特征的 DNA片段,从而进行身份识别的一种生物特征识别技术。基因组识别具有唯一性、稳定性和不可复制性等特点,已经被公安和司法等领域高度认可,广泛应用于个体识别和亲权鉴定等场景。近年来,随着测序技术的迅速发展,我国已从第一代测序技术发展到拥有自主知识产权的高通量测序技术。
自从 Sanger 测序方法产生以来,科学界对更高通量以及更快速的测序方法的需求更为迫切。高通量测序技术作为革命性的技术应运而生。与 Sanger方法相比,其能够快速输出准确,低成本的遗传信息,可通过多种方法应用于小目标区域或整个基因组,使研究人员能够研究并更好地了解健康和疾病。高通量测序技术的出现几乎完全改变了生物学、农业和医学的所有领域,广泛应用于遗传变异的分析。随着测序成本的下降、效率的提高以及技术的创新将推动基因测序步入快速发展轨道。
与全基因组测序相比,在测序之前从DNA样品中选择性捕获基因组区域的方法(靶向高通量测序)使得以较低成本获得更高的通量成为可能。在靶向高通量测序中,短串联重复序列(short tandem repeats,STR)和单核苷酸多态性(single nucleotide polymorphism,SNP)位点是主要的目标基因组区域,捕获其常用的方法有 PCR 扩增与杂交。