人体的DNA是由A,T,G和C四种碱基组成的,任意两个人之间大约99%的DNA序列是一样的,要鉴定两个人之间的亲缘关系,就需要在DNA亲子鉴定过程中鉴定两个人那不同的1%的DNA。当然1%的DNA其实已经非常的庞大了,我们不需要看全部不一样的,只要得到一些容易看的,足够区分两个人的DNA就行了。早期有一种叫RFLP(Restriction Fragment Length Polymorphism)的技术,就是用特定的酶去切DNA序列中特定的序列。有些人的DNA中存在这种特定的序列,而有些人则没有,那么这特定的酶可能有的切,也可能没的切,结果用电泳跑胶,看是两个带(切成了)还是一个带(没切成),这样就能区分两个人了。RFLP技术需要用大量的DNA,而且对降解的DNA的分析效果不好,何况只能分析两个等位基因,区分能力有限,所以慢慢被淘汰了,现在已经很少有实验室用RFLP技术来做亲子鉴定、遗传学分析和DNA证据了。取而代之的就是我们要介绍的亲子鉴定中的STR技术。
STR是Short Tandem Repeats的缩写,中文一般翻译成“短重复碱基序列”,不过大部分情况下都不翻译,直接用“STR”,简单明了。人的DNA中大约有15~20%的序列是重复性的碱基序列,顾名思义,STR是重复序列比较短的那种,通常是2~7个碱基,这种STR大概有3万个,也就是平均1万个碱基就能碰上这么个STR序列。从生物技术角度讲,长度为4的重复序列是最适合做位点的STR了。举个例子,比如在TH01这个位点上,一个人的序列可能是-AATG-AATG-AATG-,这儿出现了3个重复的的AATG,可以缩写成(AATG)3,而另外一个人可能是-AATG-AATG-AATG-AATG-,用专门的仪器,我们可以很容易的区分这两个不同的序列。也可能出现比较复杂的情况,比如VWA这个位点是TCTA(TCTG)3-4(TCTA)n。位点上等位基因的命名是根据重复序列出现的次数来确定的,出现了5次这个等位基因就叫“5”。复杂点的情况可能是“9.3”,意思就是9个重复序列加3个碱基,实际情况是(AATG)6ATG(AATG)3。
具体将这些等位基因分析出来还用到了一种叫PCR的技术,简单的理解就是复制,从几份变成成千上万份。实验室最终得到的结果就是下6个常染色体的位点和决定性别的AMEL位点。比如一个男性,AMEL位点是XY,vWA位点是14和17两个等位基因,TPOX位点是两个相同的11。在这些数据的基础上,亲子鉴定也好,指证罪犯也好,都变得很容易了。
STR现在之所以流行是因为仪器容易识别,得到结果相对快速,突变率低,以及很高的区别能力(平均每个STR有将近10个等位基因)等等原因,所以在10来年前被正式采用,成为建立各国罪犯DNA数据库的基础。也有人认为最近几年兴起的SNP技术一定能取代STR,其实到没有那么乐观,10年以内SNP根本无法动摇STR的地位,10年以后的情况要看具体研究的情况,技术的成本,最重要的是各国政府的态度。