Строение гена человека - Геном человека

В каждой диплоидной клетке человека 46 хромосом, содержащих около 6пг ДНК и 3,2 х 109 пар нуклеотидов, длина всех молекул ДНК около 2м. А если учесть, что тело взрослого человека состоит примерно из 5х1013 клеток, то общая длина молекул ДНК в организме достигнет 1х1014 м, что в тысячи раз превышает расстояние от Земли до Солнца.

В начале 80-х годов данного столетия начал осуществляться один из наиболее дерзновенных, дорогостоящих и потенциально важных международных проектов в истории цивилизации - "Геном человека".

В 1996-1998 гг. только в Америке было потрачено на реализацию проекта -200, 225 и 253 млн. долларов. В среднем определение 1п. о. оценивалось в 1$ на начало 90-х годов и в настоящее время цена составляет 0.4$ и продолжает снижаться.

Марк Адамс и Крейг Вентер (Институт Геномных Исследований в шт. Мэриленд) - внесли основной весомый вклад в решение этого проекта и на сегодняшний день являются самыми цитируемыми авторами во всех областях науки.

Целью проекта "Геном человека" было:

Составление генетической карты, на которую наносили гены отстоящие друг от друга на расстоянии 2млн оснований (2Мб)

Составление физической карты каждой хромосомы (разрешение 01.Мб (мегабаза - 1млн оснований наывается 1мегабазой)

Получить карту всего генома в виде в виде охарактеризованных по отдельности клонов 5Кб - в одном клоне)

Выяснение последовательности оснований во всех молекулах ДНК (разрешение 1основание)

Нанести все гены человека на полностью секвенсовую карту человека

Генетические - выявление всех генов, присутствующих в геноме организма и установление между ними хотя бы примерного расстояния.

Физические карты - установление соответствия полос (при дифференциальном окрашивании) и генов. Использование метода FISH окраски позволило достичь разрешения от 2-5 Мб, а потом повысить его до 100Кб (с помощью рестриктаз)

Секвенсовые карты - точная последовательность нуклеотидов - или методов секвенирования. Картирование генов

Выяснение группы сцепления

Поиск ближайших фланкирующих маркеров

Определение физической области (ДНК-последовательности) включающей искомый ген

Клонирование набора фрагментов ДНК, перекрываемую область;

Выделение из этого наборов клона, содержащих транскрибируемые последовательности ДНК соответсвующие гену или его фрагменту;

Анализ специфических м РНК и клонирование кДНК-последовательности;

Секвенирование и идентификация самого гена

Ген определяется как участок ДНК, который транскрибируется в РНК-копию одной из нитей ДНК. Большинство генов являются участками ДНК, которые несут информацию о последовательности аминокислотных остатков в белке, однако некоторые гены кодируют только РНК.

Сведения о функциях генов в организме

Примерное распределение генов человека по их функциям

Производство клеточных материалов

21%

Производство энергии и ее использование

15%

Коммуникации внутри и вне клеток

12,5%

Защита клеток от инфекций и повреждений

12,5%

Клеточные структуры движения

9%

Воспроизводство клеток

5%

Функции не выяснены

25%

Фактически все метаболические функции живых клеток опосредуются белками, но в то же время другие белки образуют множество внутриклеточных и внеклеточных структур. Со всеми генами связаны регуляторные последовательности ДНК, которые являются такими участками, к которым присоединяются белки, определяющие, будет ли ген экспрессирован в данное время и в данном месте. Некоторые генетики называют такие регуляторные последовательности тоже генами.

Транскрибируемые последовательности занимают около 15% всего генома человека (остальное повторяющиеся элементы генома). Кроме того большинство генов представлено прерывистой структурой (экзон-интрон - более длинные области). Предполагается, что кодирующие области генов занимают в молекуле ДНК 3%, а интронов - 40%

Количество генов, вовлеченных в развитие и функционирование органов и тканей человека

Мозг

3195

Лейкоцит

2164

Печень

2091

Эмбрион

1989

Легкие

1887

Матка

1859

Плацента

1290

Яичко

1232

Сердце

1195

Поджелудочная железа

1094

Селезенка

1094

Почка

712

Молочная железа

696

Кожа

620

Глаз

547

Яичник

504

Тонкий кишечник

297

Тромбоцит

22

Строение гена человека

Многие гены повторены в геноме несколько раз - это мультигенные семейства, примерами служат - рибосомальные РНК, гены HLA-комплекса, гены альфа и бета-глобинов, тубулинов, миоглобина, интерферона, иммуноглобулины др. В некоторых случаях наблюдается избирательная амплификация гена - число копий увеличивается в сотни и тысячи раз (рибосомальные РНК).

Гены отделены друг от друга - Спейсерами - которые помимо повторяющихся последовательностей могут иметь и уникальные не транскрибирующиеся последовательности.

Отличительной чертой генома человека является то, что плотность генов в разных участках генома неравномерна.

Для многих генов обнаружен целый ряд псевдогенов - они сходны с определенными нормальными генами, но не транскрибируются (в силу присутствия мутаций). Количество псевдогенов может варьировать от одного до нескольких десятков, как правило расположенных тандемно.

В геноме человека присутствуют также нуклеотидные последовательности, гомологичные некоторым ретровирусам. Впервые они были идентифицированы в геноме вирусов, индуцирующих опухоли и поэтому были названы онкогенами. Гомологичные последовательности этих ретровирусов называют - протоонкогенами, Известно более 100 протоонкогенов Они очень важны на ранних стадиях эмбриогенеза, они контролируют клеточный цикл и выбирают программу развития клетки. При возникновении специфических мутаций в протоонкогене он может начать себя вести как онкоген.

Типичный ген человека представляет собой чередование экзонов и интронов. Экзоны являются участками ДНК, которые будут представлены в зрелой матричной РНК (мРНК), которая образуется в процессе экспрессии гена. Большинство экзонов содержат информацию о последовательности аминокислот - элементарных единиц белков. Кроме этого, в начале и в конце мРНК находятся такие экзоны, которые не кодируют последовательность аминокислот, но могут содержать различные типы регуляторной информации. Интроны же являются такими участками генов, которые расположены между экзонами и отсутствуют в зрелых мРНК.

Отношение числа экзонов к числу интронов варьирует достаточно широко. Лишь небольшое количество генов не содержат интронов, в то же время есть гены, в которых интроны составляют более 95% их длины. Функция интронов и их эволюционное возникновение до сих пор не до конца поняты, но принято считать, что наличие генов, сконструированных из ряда коротких кодирующих последовательностей (экзонов), обеспечивает эволюционную пластичность. На рис. 1 схематически представлена экзон-интронная структура двух хорошо изученных генов, которые кодируют б - и в-полипептидные цепи глобиновой части гемоглобина.

структура глобиновых генов человека

Рис. 1. Структура глобиновых генов человека. Е-1, Е-2 и Е-3 являются экзонами; 1-1 и 1-2 - интроны. Закрашенные области на концах войдут в состав РНК-транкрипта (мРНК - матричной или информационной РНК), но не будут транслироваться в белковую последовательность. Числа на границах между нитронами и экзонами обозначают номера кодируемых аминокислот.

Согласно отчету Консорциума по секвенированию в среднем ген человека содержит 27 т. п.н. Если мы умножим 27 т. п.н. на 30000 генов, то получим, что гены человека занимают 0,8 млн. п. н., т. е. примерно лишь одну четверть от всего генома. Консорциум по секвенированию сообщает нам еще некоторые интересные количественные данные о генах, человека. Среднее число экзонов, приходящееся на один ген, равно примерно 8 (соответственно среднее число интронов в гене должно быть равно 7). Средний размер экзона составляет 145 п. н., а средний размер интрона - 3365 п. н. Легко сосчитать, что в среднем экзоны составляют менее 5% от общей длины гена. В среднем суммарная длина кодирующих экзонов в одном гене составляет 1340 п. н.; этого достаточно, чтобы образовать белок длиной в 447 аминокислотных остатков. Однако имеет место громадная вариабельность в размере генов, числе интронов, размере кодируемых белков и т. п. Размер наибольшего из известных генов превышает 2,4 млн. п.н., выявлены интроны длиной более 30 т. п.н., а некоторые белки содержат более 3000 аминокислотных остатков.

Упомянутая оценка числа генов в пределах 30 000-35 000 была получена путем компьютерного анализа геномных последовательностей. Сначала подсчитали число известных генов и к нему добавили число генов, наличие которых можно было предсказать из оценок числа возможных экзонов, числа сопряженных экзон-интронных последовательностей и некоторых других характеристик. Понятно, что число предсказанных генов довольно неопределенно, поскольку, с одной стороны, некоторые гены компьютер может не распознать, а с другой стороны, компьютер может ошибочно предсказать гены, которые в реальности не существуют.

Один из способов обнаруживать неизвестные гены заключается в установлении сходства с последовательностью известного гена. Многие белок-кодирующие гены образуют семейства, которые представляют собой группы генов, имеющих значительное сходство в своих последовательностях. Основным событием, приводящим к появлению семейств генов, является дупликация гена, которая может случайно возникать вследствие ошибок репликации и рекомбинации ДНК. Когда образуются две копии гена, одна из копий может мутировать таким образом, что образуется несколько измененный ген, который будет кодировать белок со свойствами, слегка отличными от оригинала. Если различия, приобретенные новым белком, придадут ему некоторые преимущества, то процесс отбора может увековечить их в последующих поколениях. Вследствие очередных ошибок в ходе репликации или рекомбинации число таких по-разному измененных копий генов может разрастись, и в результате получится мультигенное семейство и, кроме того, они могут рассредоточиться по геному на отдаленные расстояния.

Классическим примером генных семейств у человека является кластер генов в-глобина на хромосоме 11 и генов б-глобина на хромосоме 16. Их схема представлена на рис. 2.

Обратите внимание на наличие псевдогенов в каждом кластере (они обозначены греческой буквой Г). Псевдогены образуются из дуплицированных генов, одна из копий которых приобретает такие мутации, которые делают невозможным ее экспрессию. Известны многие другие генные семейства, число членов в которых исчисляется десятками; примерами являются семейства генов для актинов, миозинов, аполипопротеинов, гистонов и иммуноглобулинов. Когда анализируются удаленные друг от друга семейства, то многие из них можно назвать сверхсемействами, потому что они насчитывают сотни членов.

кластеры глобиновых генов

Рис. 2. Кластеры глобиновых генов

Давайте теперь вычислим еще одно интересное число. Какая доля генома человека содержит информацию для кодирования белков? Умножив 1340 п. н. на 30 000 генов, мы получаем, что за кодирование белков отвечают 40 200 000 п. н. Разделив это число на размер гаплоидного генома человека (3,2 млрд. п. н.), мы приходим к выводу, что только 1,25% нашего генома несут информацию о кодировании белков. Эти числа приблизительны, так что не удивляйтесь, если в других источниках вы встретите несколько отличные от этих числа. Важно то, что лишь очень малая доля человеческой ДНК кодирует белки.

Что же представляет собой остальная часть генома? Мы знаем, что 20-25% занимают интроны, но большая часть остальной ДНК является межгенной ДНК. Значительную часть межгенной ДНК составляют регуляторные последовательности, которые мы сейчас обсудим. Существует несколько групп генов, которые не кодируют белки, продуктами таких генов являются РНК, которые играют важную роль во многих клеточных процессах и структурах. Иногда из них образуются нуклеопротеиновые структуры, иногда они нацеливают ферменты на другие РНК. Кроме того, некоторые части генома играют структурную роль. Тем не менее у нас нет никакого очевидного объяснения, почему так много ДНК не участвует непосредственно ни в качестве структуры для генов, ни в любых других функциях. Некоторое понимание проблемы "избытка" ДНК можно получить, взглянув на геном с несколько иной стороны. Что мы сейчас и сделаем.

Похожие статьи




Строение гена человека - Геном человека

Предыдущая | Следующая