Таблица 2–2. Измерение отбора путем анализа последовательностей белок-кодирующих генов (Hurst, 2002; Li, 1997)
Белок-кодирующие последовательности состоят из двух видов сайтов:
• синонимичные, в которых замены не влияют на последовательность кодируемых аминокислот;
• несинонимичные, в которых замены ведут к заменам аминокислот.
Отношение Ka/Ks (где Ka – частота несинонимичных замен, Ks – синонимичных; обе вычисляются с коррекцией на множественные замены) является количественной мерой отбора, действующего на уровне белковых последовательностей.
Ka/Ks = 1 – нейтральная эволюция белковой последовательности (кодируемый белок не подвергается отбору).
Для большинства белок-кодирующих генов Ka/Ks ≪ 1 – отсекающий отбор.
Для прокариот типично Ka/Ks < 0,1.
Для эукариот типично Ka/Ks ≈ 0,1–0,2.
• Ka/Ks > 1 – положительный отбор; достаточно редко встречается для белок-кодирующих генов, но для некоторых категорий генов, несомненно, наличествует, например для генов, участвующих в антипаразитической защите или в сперматогенезе, а также в вирусных белках, таких как гемагглютинин вируса гриппа.
• Для измерения Ka/Ks для индивидуальных сайтов используют методы наибольшего правдоподобия; большинство белоккодирующих генов содержат несколько сайтов, подверженных положительному отбору.
• Использование Ka/Ks для измерения уровня отбора предполагает нейтральность синонимичных сайтов.
• Однако Ka и Ks положительно коррелируют между собой – таким образом, отбор затрагивает и синонимичные сайты.
• Некодирующие сайты, такие как интронные последовательности, могут использоваться как фон нейтральной эволюции при измерении отбора на синонимичных сайтах (Ks/Ki, где Ki – частота замен для интронных сайтов).
• Критерий Макдональда – Крейтмана (Aquadro, 1997; McDonald and Kreitman, 1991) широко используется для измерения отбора. Он сравнивает внутривидовые вариации (частота полиморфизма, P) с межвидовыми вариациями (дивергенция, D).
• Dn/Ds = Pn/Ps – нейтральная эволюция белковой последовательности.
• Dn/Ds < Pn/Ps – отсекающий отбор.
• Dn/Ds > Pn/Ps – положительный отбор.
Появление таких количественных подходов к анализу отбора примечательно не только благодаря их технической применимости в изучении эволюции: они также являются признаком фундаментальных изменений в способах осмысления отбора биологами. Дарвиновская качественная идея, которая была выражена в абстрактной математической форме Фишером и впервые измерена с использованием генетических методов Добржанским и его учениками, теперь превратилась в прямо измеряемую статистическую характеристику ансамблей нуклеотидных сайтов. Такая трансформация концепции отбора сродни тому, как классическая термодинамика с ее абстрактными потоками превратилась в статистическую физику Больцмана и Гиббса (см. гл. 4).
Эгоистичные гены, мусорная ДНК и мобильные элементы
Хоть это и редко утверждается без обиняков, классическая генетика предполагает, что почти все части генома (все нуклеотиды, если употреблять более современные, молекулярные термины) имеют определенные функции. Это неявно выраженное утверждение также важно и с точки зрения СТЭ, с ее панадаптационистским подходом. Однако это понимание подверглось сомнению еще в 1960-х и 1970-х годах по мере накопления данных об отсутствии прямой связи между размером генома и фенотипической сложностью организма. Даже с использованием приблизительных методов, доступных в то время, становилось ясно, что организмы с примерно одинаковым уровнем фенотипической сложности зачастую имеют геномы, на порядок различающиеся по размеру (так называемый парадокс гаплоидной величины). Этот парадокс был концептуально разрешен с помощью двух связанных друг с другом фундаментальных идей: эгоистичных генов и мусорной ДНК