Опасно другое. Иногда обширные области ДНК проявляют таинственное сходство с последовательностями ДНК отдаленных видов. Никто не сомневается, что птицы ближе к черепахам, ящерицам, змеям и крокодилам, чем к млекопитающим (рандеву № 16). Однако последовательности ДНК птиц и млекопитающих имеют большее сходство, чем можно ожидать. И у тех, и у других в некодирующей ДНК наблюдается избыток пар Г – Ц. Пары Г – Ц химически стабильнее пар A – T. Возможно, теплокровные виды (птицы и млекопитающие) нуждаются в более “крепкой” ДНК. Каково бы ни было объяснение, мы должны быть осторожны и не позволять этому смещению Г – Ц убедить нас в том, что все теплокровные животные – близкие родственники. Хотя специалисты по систематике утверждают, что ДНК – это все, о чем можно мечтать, нельзя забывать: мы по-прежнему многого не понимаем в геноме.
Как использовать информацию, заключенную в ДНК? Литературоведы, изучая происхождение текстов, используют ту же технику, что и эволюционные биологи. И, хотя это звучит неправдоподобно, одним из лучших примеров является проект по изучению “Кентерберийских рассказов”. Участники этого международного проекта использовали инструменты эволюционной биологии, чтобы проследить историю 85 списков “Кентерберийских рассказов”. Эти манускрипты – наша главная надежда на восстановление утраченного оригинала. Как и ДНК, текст Чосера уцелел благодаря многократному копированию. При этом каждый раз при копировании возникали случайные изменения. Тщательно оценив накопленные отличия, исследователи реконструируют историю копирования и строят эволюционное древо – потому что это настоящий эволюционный процесс, при котором с каждым поколением накапливаются ошибки. Способы реконструкции эволюции ДНК и текста настолько похожи, что каждый из них может служить иллюстрацией другого.
Отвлечемся от гиббонов и займемся Чосером, а именно четырьмя из 85 списков “Кентерберийских рассказов”. Эти рукописи называются: “Британская библиотека” (British Library), “Крайст-Черч” (Christ Church), “Эджертон” (Edgerton) и “Хенгурт” (Hengwrt)[14]. Вот две первые строки “Общего пролога”:
Теперь сравним. Список из Британской библиотеки гласит:
“Крайст-Черч”:
“Эджертон”:
“Хенгурт”:
Первое, что нужно сделать с последовательностью ДНК или текстом, – выявить сходства и различия. Для этого нужно их “выровнять” – а это бывает не так-то просто: тексты могут быть фрагментарными и иметь разную длину. Здесь очень помогает компьютер, но чтобы выровнять первые две строки “Общего пролога”, он не понадобится. На рисунке выделены 14 позиций, по которым тексты не совпадают.
Вторая и пятая позиции представлены даже не двумя вариантами, а тремя. В целом это дает 16 “различий”. После того, как мы составили список различий, нужно определить, какое древо лучше всего их объясняет. Есть множество способов это сделать, и все их можно применить и к животным, и к текстам. Самый простой пример – группировка текстов на основе общего сходства. Как правило, при этом используют варианты следующего метода. Сначала мы находим пару наиболее сходных текстов. Затем мы используем эту пару в качестве единого усредненного текста и сравниваем его с оставшимися, чтобы найти следующую пару наиболее сходных текстов. Так мы последовательно формируем новые пары, пока не получится генеалогическая схема. Такой способ построения деревьев используется чаще всего и называется методом поиска ближайшего соседа (