Чтобы избежать этих проблем, ученые из Калифорнийского университета в Беркли в 2009 году разработали программное обеспечение, с помощью которого «окна» скользят вдоль цепочки символов в поисках сходств и образцов. В качестве эксперимента ученые таким образом проанализировали геномы млекопитающих и тексты нескольких десятков книг, таких как «Питер Пэн», «Книга Мормона» и «Государство» Платона. Было обнаружено, что одно и то же программное обеспечение способно, с одной стороны, классифицировать ДНК различных видов млекопитающих, а с другой – классифицировать книги по жанрам с идеальной точностью. Обратившись к спорным текстам, ученые погрузились в изучение постоянно вызывающего споры вопроса о том, получил ли Шекспир достаточно хорошее образование для того, чтобы написать свои пьесы. И программа показала, что классик действительно написал драму «Два знатных родича» – пьесу, авторство которой постоянно подвергалось сомнению, – но не написал «Перикла», другую пьесу спорного авторства. Затем команда из Беркли изучила геномы вирусов и архебактерий, самых старых и в массе своей чужеродных для нас форм жизни. Этот анализ выявил новые связи между этими организмами и другими микробами, в результате были выдвинуты новые предложения по их классификации. Из-за огромного объема данных анализ геномов мог получиться весьма глубоким: в течение года 320 компьютеров занимались только тем, что сканировали микробы и архебактерии. Однако анализ этих геномов позволил ученым выйти за рамки обычного пошагового сравнения генов и понять полную естественную историю этих биологических видов.

* * *

Расшифровка полной геномной истории, однако, требует более сложных навыков, чем работа с другими текстами. Расшифровка ДНК требует чтения и слева направо, и справа налево – так называемый бустрофедон. В противном случае можно пропустить важные палиндромы и морднилапы: соответственно слова, которые одинаково читаются с обеих сторон или же приобретают другой смысл при прочтении с конца.

Один из самых древних известных палиндромов – высеченный на стене в Помпеях (и других городах) магический квадрат, слова в котором читаются сверху вниз, снизу вверх, справа налево и слева направо:

S-A-T-O-R

A-R-E-P-O

T-E-N-E-T

O-P-E-R-A

R-O-T-A-S[22]

Насчитывая примерно две тысячи лет от роду, данная надпись на порядок младше, чем по-настоящему древние палиндромы в ДНК, которая создала целых два вида палиндромов. Во-первых, это фразы традиционного («А роза упала на лапу Азора») типа: например, Г-А-Т-Т-А-Ц-А-Т-Т-А-Г. Однако поскольку АТ и ЦГ – это парные основания, ДНК образовывает и другие, менее явные палиндромы, которые спереди читаются по одной нити, а сзади – по другой. Сравните нить Ц-Т-А-Г-Ц-Т-А-Г, затем представьте основания, которые должны появиться на другой нити: Ц-А-Т-Ц-Г-А-Т-Ц. Это совершенные палиндромы.

Безобидный на вид, этот второй тип палиндрома может нагнать страху на любого микроба. Давным-давно многие микробы выделяли специальные белки (под названием «ферменты рестрикции»), которые могли резать ДНК подобно кусачкам. И по какой-то причине эти ферменты могут разрезать ДНК только в ее симметричных, палиндромных участках. Подобные надрезы служат и полезным целям: к примеру, выбрасывают из спирали основания, пораженные радиацией, или снимают напряжение в сильно запутанной ДНК. Однако непослушные микробы в основном использовали эти белки, чтобы воевать друг с другом и перерабатывать чужой генетический материал. В результате микробы методом проб и ошибок научились избегать даже неочевидных палиндромов.