在“垃圾”中寻找DNA - 彭博社
bloomberg
科学家们发现了从细菌到老鼠的数千个基因的构成和功能。由于进化倾向于保留有效的特征,因此这些基因中许多都有人类的“表亲”。但识别出人类版本并不容易。基因并不是一段不间断的DNA文本,就像一部电影。它们更像是电视节目,每个信息段都被广告包围——研究人员称之为遗传垃圾。片段的长度(称为外显子)和“垃圾”的数量在不同物种之间可以有很大差异。
现有的软件程序已经通过寻找与动物基因相似的DNA序列来发现人类基因。但包括一位在南加州大学工作的俄罗斯数学家在内的研究人员,设计了一种潜在的更好方法。他们的方法以多种方式划分动物DNA字符串,然后寻找与未知DNA最佳匹配的页面组合和周围的垃圾。在一些测试中,该方法的准确率接近100%。