Возникновение новых генов - движущая сила эволюционных инноваций во всех организмах. Недавние исследования были сосредоточены на выявлении механизмов, которые генерируют новые гены , и ученые обнаружили, что эти механизмы включают множество молекулярных событий, все из которых должны происходить в зародышевой линии, чтобы быть унаследованной следующим поколением. После мутации зародышевой линии новый ген (например, новый дубликат гена, расположенный на хромосоме 2 человека ) будет полиморфным в популяции ; другими словами, не все вторые хромосомы в популяции будут иметь дупликацию . Впоследствии два наиболее вероятных результата для нового гена - это фиксация (т. Е. Новый ген достигнетчастота 100%) или исчезновение (т. е. новый ген будет утерян).
Текущие знания о происхождении новых генов включают информацию как о генах, кодирующих белки, так и о генах РНК . Все эти гены транскрибируются, но только гены, кодирующие белок, транслируются в белки. Изучение псевдогенов, первоначально определяемых как последовательности, которые напоминают известные гены, но не могут производить функциональный белок, показало не только то, как часто гены дегенерируют, но также и то, что многие последовательности, которые когда-то считались вырождающимися генами, кодирующими белок, на самом деле являются функциональными генами РНК.
За прошедшие годы ученые предложили несколько механизмов, с помощью которых генерируются новые гены. К ним относятся дупликация генов , одомашнивание белков с мобильными элементами , латеральный перенос генов, слияние генов, деление генов и возникновение de novo .
Дупликация генов была первым предложенным механизмом генерации генов (Ohno, 1970), и этот процесс действительно кажется наиболее распространенным способом создания новых генов. Дупликации обычно классифицируются по размеру дублируемой части генома ; таким образом, дупликация может быть описана как затрагивающая весь геном, большие сегменты генома, отдельные гены, отдельные экзоны или даже определенные части экзонов (Betrán & Long, 2002). Механизмы, которые генерируют повторяющиеся гены, разнообразны, и постоянно открываются новые подробности об этих механизмах. Эти механизмы включают дупликации всего генома, происходящие из-за нерасхождения., тандемные дупликации, возникающие в результате неравного кроссовера, ретропозиции, возникающие в результате ретротранскрипции промежуточного соединения РНК, транспозиции с участием мобильных элементов (Jiang et al ., 2004; Morgante et al ., 2005) и дупликации, возникающие после перегруппировок и последующей репарации смещенных разрывов ( Ранц и др ., 2007). В таких дупликациях участвуют не только гены, кодирующие белки, но и гены некодирующих РНК . Напр., Новый класс ретродукатов включает snoRNAs, которые представляют собой класс генов РНК, которые участвуют в процессинге рибосомной РНК (Weber, 2006).
Большая часть нынешнего ажиотажа по поводу дупликации генов проистекает из того факта, что с таким количеством секвенированных геномов, которые сейчас доступны, исследователи имеют более точные оценки того, как часто гены дублируются, и эти показатели чрезвычайно высоки. Например, более 100 генов дублируются в геноме человека за 1 миллион лет (Hahn et al ., 2007a). Это означает, что процентная доля генома, на которую влияют различия в количестве генов (по оценкам, 6%), вносит больший вклад в различия между людьми и шимпанзе, чем однонуклеотидные различия между ортологическими последовательностями (по оценкам, 1,5% [Demuth et al ., 2006 ]). Высокие показатели (17 генов на 1 миллион лет) также были оценены у мух (Hahn et al.., 2007б). Дополнительный интерес вызывает осознание того, что дупликации происходят так часто, что особи одного и того же вида сильно различаются по содержанию ДНК и количеству генов (т. Е. Многие дупликации являются полиморфными и вносят вклад в индивидуальные различия [Sebat et al ., 2004]). Подсчитано, что в среднем два человека будут различаться примерно на 5 мегабаз информации.
Неожиданно в геномах было описано несколько тенденций к дупликации в отношении эволюции половых хромосом . Многие новые мужские гены происходят из Y-хромосом видов. Некоторые из этих мужских генов организованы в семьи, которые претерпевают генную конверсию, чтобы избежать дегенерации Y-хромосомы. Гены мужской зародышевой линии также могут дублироваться из Х-хромосомы посредством ретропозиции (Betrán et al ., 2002; Emerson et al ., 2004; Lahn et al ., 2001; Rozen et al ., 2003). Эти данные показывают, что расположение и организация генома имеют значение для происхождения и функции генов.
Мобильные элементы (TE) - это так называемые «эгоистичные» сегменты ДНК, которые кодируют белки, которые позволяют этим сегментам копировать или перемещаться внутри генома. Есть два типа ТЕ: транспозоны ДНК и ретротранспозоны. Транспозоны ДНК способны вырезать себя из генома и вставлять в другое место, тогда как ретротранспозоны копируют себя через промежуточное звено РНК. Подобно вирусным вставкам в геном, вставки TE вызывают мутации и способствуют увеличению размера генома , но обычно они не кодируют клеточные белки.
Интересно, что один из способов приобретения геномом новых генов - это рекрутирование белков мобильных элементов и их использование в качестве клеточных белков. Такие события называют одомашниванием белков ТЕ. В недавнем обзоре Fechotte и Pritham (2007) собрано много примеров этих событий, и он показал, что некоторые из неожиданных функций, в которых играют роль одомашненные белки TE, включают функционирование иммунной системы позвоночных и светочувствительность у растений. Несколько примеров одомашнивания были также описаны у Drosophila (Casola et al.., 2007). В одном случае наблюдалась кодоместикация двух белков, кодируемых мобильным элементом PIF / Harbinger. В этом увлекательном примере два гена, содержащиеся в исходном TE, были приручены одновременно; один из этих генов кодировал транспозазу, которая связывает и разрезает ДНК, в то время как другой кодировал белок, содержащий домен Myb / SANT, который, как полагают, участвует в транскрипции , ремоделировании хроматина и белок-белковых взаимодействиях. Требуются дополнительные данные, чтобы выяснить, были ли оба этих белка приручены для функционирования в одном и том же биологическом процессе.
Ученые используют термин «горизонтальный перенос гена» для обозначения случая, когда ген не имеет вертикального происхождения (т.е. прямое наследование от родителя к потомству ), а вместо этого происходит из неродственного генома. Хорошо известно, что такого рода передача происходит между бактериями , а также между геномами клеточных органелл ( митохондрии и хлоропласты ) и ядерными геномами (Roger, 1999). Однако более поздние случаи переноса между органеллами и / или эндосимбионтными бактериями продолжают происходить (Bergthorsson et al ., 2003; Hotopp et al.., 2007). Напр., Крупномасштабные усилия по секвенированию показали, что большая часть генома внутриклеточного эндосимбионта Wolbachia pipentis была интегрирована в виды Drosophila (Hotopp et al ., 2007). Однако механизм этих переводов остается в значительной степени неизвестным, и функциональные последствия некоторых из этих переводов еще предстоит изучить.
Существующие гены также могут сливаться (т. Е. Два или более гена могут стать частью одного и того же транскрипта) или подвергаться делению (т. Е. Один транскрипт может разбиваться на два или более отдельных транскрипта), тем самым формируя новые гены. Интересно отметить, что химерные гибридные гены иногда включают две копии одного и того же гена (например, ген алкогольдегидрогеназы у дрозофилы ), и когда это происходит, полученные гены проходят параллельную эволюцию (Jones & Begun, 2005), в которой они отходят от функций своих родительских генов.
Новые гены могут дополнительно возникать de novo из некодирующих участков ДНК. В самом деле, несколько новых генов, происходящих из некодирующей ДНК, недавно были описаны у Drosophila (Begun et al ., 2007; Levine et al ., 2006). Для этих недавно возникших генов дрозофилы с вероятной способностью кодировать белок нет гомологов ни у одного другого вида. Обратите внимание, однако, что гены de novo, описанные до сих пор у различных видов, включают как кодирующие белок, так и некодирующие гены. Эти новые гены иногда происходят из Х-хромосомы и часто выполняют функции мужской зародышевой линии.
Действие всех механизмов, описанных в предыдущих разделах, приводит к перетасовке экзонов (т.е. наблюдению, что многие гены имеют общие экзоны) (Gilbert et al ., 1997; Li et al ., 2001). Кроме того, анализ «молодых» генов (генов, возникших всего несколько миллионов лет назад) позволяет исследователям задокументировать все события, которые привели к возникновению этих генов, потому что время не стерло следы этих событий. Используя этот подход, был сделан вывод, что комбинации нескольких механизмов и нескольких событий часто ответственны за генерацию новых генов (Betrán & Long, 2002). Двумя хорошими примерами этого являются ген jingwei (Long & Langley, 1993) и ген SETMAR (Cordaux et al.., 2006; Рисунок 1).
Все эти новые последовательности увеличивают сложность и разнообразие геномов. Как и в случае любой мутации , когда новые гены закрепляются в геноме, они увеличивают различия между видами и служат сырьем для эволюции (Ohno, 1970). Это легко увидеть в случае дупликации генов. Дублирование гена приводит к образованию двух или более копий гена: одной, которая может поддерживать свою первоначальную функцию в организме , а другой (-ых) можно «поиграть», чтобы взять на себя новые функции. Как следствие, новые дубликаты являются основным источником нововведений в геноме и часто развиваются при положительном отборе , при котором происходят быстрые изменения в белке, кодируемом новым геном, чтобы получить новую функцию (Presgraves, 2005). Этот процесс называетсянеофункционализация нового гена.
Другие возможные исходы после дупликации включают потерю гена или псевдогенизацию; поддержание обоих генов как способ увеличения экспрессии или поддержания множественных вариантов у индивидуумов (по существу «фиксация» гетерозиготности ); или возникновение субфункционализации (то есть возникновение взаимно дополняющих нейтральных выводящих мутаций, так что оба гена необходимо сохранить в геноме [Lynch & Force, 2000]). Субфункционализация - интересное явление, потому что оно начинается с разделения функций, но может заложить основу для специализации (Torgerson & Singh, 2004). Также возможны некоторые смешанные исходы (например, субфункционализация с последующей неофункционализацией и субнеофункционализацией) (He & Zhang, 2005).
Одним из непредвиденных последствий дупликации и потери генов является то, что эти события могут стать причиной несовместимости между видами. Было показано, что дупликации и потери играют роль в распаде гибридов и снижении приспособленности потомков к спариванию между генетически дифференцированными популяциями. Таким образом, эти процессы могут вносить вклад в процесс видообразования (Masly et al ., 2006).
Как упоминалось ранее, псевдогены обычно определяют как последовательности, которые напоминают известные гены, но не могут продуцировать функциональные белки. Псевдогены возникают с помощью тех же механизмов, что и гены, кодирующие белок, с последующим накоплением дезорганизующих мутаций (например, вставок, делеций и / или замен нуклеотидов), которые нарушают рамку считывания или приводят к вставке преждевременного стоп- кодона . Псевдогены можно в общих чертах разделить на две категории: обработанные и необработанные. Необработанные псевдогены обычно содержат интроны, и они часто расположены рядом со своим паралогическим родительским геном. Считается, что обработанные псевдогены возникают в результате ретротранспозиции; соответственно в них отсутствуют интроны и промоторобласти, но они часто содержат сигнал полиаденилирования и фланкируются прямыми повторами. Ошибки в обратной транскрипции и отсутствие подходящей регуляторной среды часто приводят к дегенерации процессированных копий генов (D'Errico et al ., 2004).
Обилие псевдогенов в данном геноме обычно зависит от скорости дупликации и потери генов. Млекопитающие, по-видимому, имеют большое количество обработанных псевдогенов - примерно 8000 (Zhang et al ., 2003; Zhang et al ., 2004). С другой стороны, у большинства других организмов их гораздо меньше; например, у Drosophila можно обнаружить только 20 ретропсевдогенов (Harrison et al ., 2003). Этот паттерн был объяснен смещением делеции, которое существует у Drosophila ; действительно, после изучения распределения размеров делеций у Drosophila и млекопитающих, исследователи пришли к выводу, что делеции у Drosophila намного больше (Petrov & Hartl, 2000).
Самым интересным открытием псевдогенов на сегодняшний день является то, что вырожденные гены, кодирующие белок, как было доказано, «живут» как гены РНК (Sasidharan & Gerstein, 2008). Хотя исследователи ранее доказали, что псевдогены могут транскрибироваться (Harrison et al ., 2005), они только недавно поняли, что эти последовательности могут регулировать родительские гены через siRNA; доказательства этого явления были обнаружены как у мух, так и у млекопитающих (рис. 2; Sasidharan & Gerstein, 2008). Кроме того, некоторые процессированные псевдогены, по-видимому, эволюционировали в гены микроРНК приматов (Devor, 2006).
Конечно, геномы полны сюрпризов. Дополнительная работа будет продолжать раскрывать еще больше о функциональном потенциале многих новых последовательностей ДНК.
Оригинальный текст доступен по ссылке.