Повторяющаяся ДНК - Геном человека

В любом сложном геноме ДНК можно подразделить на два типа: однокопийную ДНК (т. е. последовательности, представленные в гаплоидном геноме единственными экземплярами) и повторяющуюся ДНК (последовательности, представленные в гаплоидном геноме многократно). Примерно 50% генома человека представляют собой повторяющуюся ДНК. Популярный термин для большинства повторяющихся ДНК и для некоторых однокопийных ДНК, которые не являются частью генов, - это "мусорная (junk) ДНК". Да, скорее всего в настоящее время наши геномы содержат некоторое количество ДНК, которые не несут никакой функции и могут вполне законно считаться "мусорными", но чем больше мы узнаем о геномах и о регуляции экспрессии генов, тем больше мы открываем новых функций для ДНК, о которых раньше мы не имели никакого представления. Кроме того, значительная часть ДНК, которая в настоящее время явно не используется, определенно является запасным материалом для эволюции генома. Таким образом, если мыслить о биологических видах как о динамических сущностях, изменяющихся (эволюционирующих) во времени, то вполне возможно, что "мусора" в их геномах не так уж и много.

Различают два класса повторяющейся ДНК: (1) тандемно повторяющиеся последовательности (повторы), которые расположены друг за другом "голова к хвосту", и (2) диспергированные повторы, которые разбросаны по всему геному, причем чаще всего они бывают представлены одной копией в данном месте (сайте).

Тандемно повторяющиеся последовательности

Основным классом тандемно повторяющихся последовательностей является центромерная ДНК. Наиболее распространенный тип цен-тромерной ДНК называется альфоидной (alphoid) ДНК, повторяющиеся единицы которой имеют длину примерно в 170 п. н. Эти единицы образуют ряды, длина которых варьирует от 250 т. п.н. до 5 млн. п. н., и они составляют не менее 3% генома. Внутри одного ряда повторы неидентичны, они немного различаются, и между хромосомами эти различия еще больше. Центромерная ДНК образует центромеры, сложные структуры, которые кроме ДНК содержат белки нескольких типов, к которым присоединяются нити веретена в процессе деления клетки.

Тандемно повторяющиеся последовательности найдены также в теломерах, которые расположены на концах каждой хромосомы. У человека теломерными последовательностями являются GGGTTA; в разных хромосомах они повторяются от 250 до 1500 раз. В последние годы теломерная ДНК стала предметом пристального внимания исследователей из-за того, что была обнаружена связь между укорочением теломер и старением. Я не буду здесь детально обсуждать этот вопрос, скажу только, что основная идея состоит в том, что укорочение теломер является одним из последствий процесса репликации ДНК, который происходит перед каждым актом клеточного деления. Если такое продолжается достаточно долго, то теломерные последовательности элиминируются и станут повреждаться прилежащие к ним гены. В результате клетка может умереть или перестать делиться. Такое происходит в большинстве нормальных соматических клеток, и поэтому в организме или в клеточной культуре они имеют ограниченную способность к размножению. Однако в зародышевых (половых) клетках, стволовых клетках и разнообразных раковых клетках имеется фермент теломераза, способный восстанавливать теломерные последовательности, которые в его отсутствие укорачиваются при каждом акте репликации ДНК. Теломераза является необычным ферментом, у которого имеются два компонента: РНК и белок; при этом РНК служит матрицей для восстановления утраченных теломерных повторов. Рис. 3 в общих чертах показывает, как осуществляется этот процесс.

Некоторые другие классы тандемно повторяющихся последовательностей являются генами для некодирующих РНК. Наиболее известными из них являются гены для рибосомной РНК (рРНК). В геноме человека имеются пять групп таких генов, каждая из которых содержит около 60 копий. Они расположены в коротких плечах акроцентрических хромосом 13, 14, 15, 21 и 22. Эти кластеры для рРНК вместе с некоторыми дополнительными участками ДНК называются ядрышковыми организаторами, потому что ядрышко может быть образовано каждым их них. Ядрышки расположены в клеточном ядре и являются фабриками по сборке рибосом.

поддержание структуры теломераз

Рис. 3. Поддержание структуры теломераз

Существует более 80 типов рибосомных белков. Они синтезируются в цитоплазме и мигрируют в ядро, где они связываются с рРНК, которая синтезируется в ядрышке. В каждом ядрышке накапливается также множество других белков, где они принимают участие в сборке рибосом. Кроме того, в сборке рибосом участвуют небольшие некодируюшие РНК нескольких типов. В хромосоме 1 расположен еще один кластер тандемно повторяющихся генов для 5S-pPHK, которая также является важным компонентом рибосом.

Диспергированные повторяющиеся последовательности

Диспергированные повторяющиеся последовательности чаще всего разбросаны по геному по отдельности, а не кластерами. Согласно размеру их подразделяют на две группы: длинные диспергированные элементы, обозначаемые как LINE (Long INterspersed Elements), и короткие диспергированные элементы, обозначаемые как SINE (Short INterspersed Elements). Оба класса являются подвижными (мобильными) генетическими элементами, которые называются ретротранспозонами. Полностью функционирующий ретротранспозон способен размножать либо сам себя, либо родственные последовательности, как это будет описано в следующем абзаце. Ретротранспозоны могут возникать как ретровирусы.

Одним из важнейших классов диспергированных повторяющихся последовательностей является LINE-] или группа L1, которая представлена в геноме человека в количестве до 500 000 копий и составляет примерно 15% от всего генома. Большинство элементов L1 являются укороченными копиями полноценных единиц, длина которых составляет около 5000 п. н., но несколько тысяч элементов L1 имеют полную длину. Только 40-50 из них функционально активны, т. е. они кодируют несколько белков, которые способны вызывать транспозицию либо самого элемента L1, либо некоторых других мобильных элементов. Элементы L1 несут два гена (называемых открытыми рамками считывания - ORF). ORF1 кодирует белок, связывающийся с нуклеиновыми кислотами (р40), ORF2 кодирует и обратную транскриптазу (фермент, который использует mРНК как матрицу и создает комплементарную ей одноцепочечную ДНК - копию, кДНК) и эндонуклеазу, которая производит надрезы в геномной ДНК, куда может встраиваться новая кДНК.

Когда мРНК из элемента L1 транслируется, то образующиеся белки обычно связываются непосредственно. со своей мРНК. Та кой комплекс белка с РНК перемещается в ядро, где эндонуклеаза разрезает одну из цепей ДНК, и в результате образуется свободный конец. Обратная транскриптаза использует этот свободный конец в качестве затравки и создает ДНК-копию мРНК элемента L1. В конце концов образуется вторая цепь кДНК и двунитевая молекула встраивается в хромосому на место однонитевого разрыва. Мы до сих пор не знаем, почему только часть элемента L1 является наиболее частым продуктом ретротранспозиции.

Считается, что обратная транскриптаза ответственна также за образование процессированных псевдогенов, которые являются ДНК-копиями мРНК и которые встраиваются в места, неродственные (негомологичные) исходному гену, из которого произошла скопированная мРНК. Процессированные псевдогены не содержат интронов и обычно неспособны экспрессироваться в виде полипептидов (хотя иногда и случаются исключения). Происходит это либо из-за того, что они не имеют регуляторных последовательностей, либо потому, что они содержат мутации. Псевдогены (как процессированные, так и обычные) довольно распространены и в геноме человека составляют 0,5-1%. Например, секвенирование хромосомы 22 выявило 134 псевдогена.

Наибольший класс элементов SINE состоит из последовательностей Alu (название происходит от названия фермента рестрикции Alu I - эндонуклеазы, которая расщепляет ДНК в местах нахождения специфичных коротких последовательностей и может использоваться для вырезания последовательностей Alu из геномной ДНК)'. В геноме человека находится примерно миллион последовательностей Alu, которые равняется примерно 10-12% всей ДНК. Длина основной единицы составляет примерно 300 п. н., но в классе Alu существует много различных последовательностей. В основном они находятся между генами и внутри интронов, но изредка они могут быть включены в мРНК. Последовательности Alu не кодируют белков, и поэтому они неспособны сами перемещаться из одного места в другое. Однако многие последовательности Alu транскрибируются, и на их концах существуют некоторые короткие последовательности, подобные РНК у элементов L1. Поэтому распространено мнение, что ферменты, которые производятся элементами L1, участвуют в ретротранспозиции последовательностей Alu, хотя окончательные доказательства этого все еще не получены.

Встраивание (инсерция) нового мобильного элемента в ДНК потенциально способно нарушить функцию гена, и действительно, у человека известно более 30 примеров ретротранспозиции, вызывающих болезни. Более того, присутствие столь большого числа копий родственных последовательностей делает возможным потерять или дуплицировать генетический материал во время мейозаи, в результате могут появляться аномальные фенотипы. Возникает вопрос, почему же наши геномы не избавятся от таких опасных участков ДНК, кажущихся бесполезными? Ответ, возможно, заключается в их необходимости для эволюционной пластичности. Повторяющиеся последовательности в ДНК являются важным источником ремоделирования генома. Это станет яснее, когда мы будем обсуждать механизмы геномных изменений в следующей главе.

Похожие статьи




Повторяющаяся ДНК - Геном человека

Предыдущая | Следующая