у большинства людей представлен более чем миллионом копий. (С ним мы еще встретимся в “Рассказе Ревуна”.) Даже в случае кодирующих участков ДНК гены в некоторых случаях могут быть представлены десятками идентичных (или почти идентичных) копий. Однако на практике повторный подсчет – не такая уж большая проблема: дублированные последовательности ДНК довольно легко обнаружить.

Опасно другое. Иногда обширные области ДНК проявляют таинственное сходство с последовательностями ДНК отдаленных видов. Никто не сомневается, что птицы ближе к черепахам, ящерицам, змеям и крокодилам, чем к млекопитающим (рандеву № 16). Однако последовательности ДНК птиц и млекопитающих имеют большее сходство, чем можно ожидать. И у тех, и у других в некодирующей ДНК наблюдается избыток пар Г – Ц. Пары Г – Ц химически стабильнее пар A – T. Возможно, теплокровные виды (птицы и млекопитающие) нуждаются в более “крепкой” ДНК. Каково бы ни было объяснение, мы должны быть осторожны и не позволять этому смещению Г – Ц убедить нас в том, что все теплокровные животные – близкие родственники. Хотя специалисты по систематике утверждают, что ДНК – это все, о чем можно мечтать, нельзя забывать: мы по-прежнему многого не понимаем в геноме.

Как использовать информацию, заключенную в ДНК? Литературоведы, изучая происхождение текстов, используют ту же технику, что и эволюционные биологи. И, хотя это звучит неправдоподобно, одним из лучших примеров является проект по изучению “Кентерберийских рассказов”. Участники этого международного проекта использовали инструменты эволюционной биологии, чтобы проследить историю 85 списков “Кентерберийских рассказов”. Эти манускрипты – наша главная надежда на восстановление утраченного оригинала. Как и ДНК, текст Чосера уцелел благодаря многократному копированию. При этом каждый раз при копировании возникали случайные изменения. Тщательно оценив накопленные отличия, исследователи реконструируют историю копирования и строят эволюционное древо – потому что это настоящий эволюционный процесс, при котором с каждым поколением накапливаются ошибки. Способы реконструкции эволюции ДНК и текста настолько похожи, что каждый из них может служить иллюстрацией другого.

Отвлечемся от гиббонов и займемся Чосером, а именно четырьмя из 85 списков “Кентерберийских рассказов”. Эти рукописи называются: “Британская библиотека” (British Library), “Крайст-Черч” (Christ Church), “Эджертон” (Edgerton) и “Хенгурт” (Hengwrt)[14]. Вот две первые строки “Общего пролога”:

Когда Апрель обильными дождями
Разрыхлил землю, взрытую ростками…[15]

Теперь сравним. Список из Британской библиотеки гласит:

Whan that Aprylle / wyth hys showres soote
The drowhte of Marche / hath pcede to the rote

“Крайст-Черч”:

Whan that Auerell wt his shoures soote
The droght of Marche hath pced to the roote

“Эджертон”:

Whan that Aprille with his showres soote
The drowte of marche hath pced to the roote

“Хенгурт”:

Whan that Aueryll wt his shoures soote
The droghte of March / hath pced to the roote

Первое, что нужно сделать с последовательностью ДНК или текстом, – выявить сходства и различия. Для этого нужно их “выровнять” – а это бывает не так-то просто: тексты могут быть фрагментарными и иметь разную длину. Здесь очень помогает компьютер, но чтобы выровнять первые две строки “Общего пролога”, он не понадобится. На рисунке выделены 14 позиций, по которым тексты не совпадают.

Вторая и пятая позиции представлены даже не двумя вариантами, а тремя. В целом это дает 16 “различий”. После того, как мы составили список различий, нужно определить, какое древо лучше всего их объясняет. Есть множество способов это сделать, и все их можно применить и к животным, и к текстам. Самый простой пример – группировка текстов на основе общего сходства. Как правило, при этом используют варианты следующего метода. Сначала мы находим пару наиболее сходных текстов. Затем мы используем эту пару в качестве единого усредненного текста и сравниваем его с оставшимися, чтобы найти следующую пару наиболее сходных текстов. Так мы последовательно формируем новые пары, пока не получится генеалогическая схема. Такой способ построения деревьев используется чаще всего и называется методом поиска ближайшего соседа (