- Геном человека: общие понятия
- История открытия
- Расшифровка генома человека
- ДНК
- Хромосомы
- Гены
- Регуляторные последовательности
- Прочие объекты в геноме
- Содержание программы «Геном человека»
- Предпосылки
- Завершённость
- Цели
- Первые итоги и дальнейшее развитие
- Как были достигнуты результаты
- Геном для медицины
- Доноры генома
Геном человека: общие понятия
Чтобы понять, что собой представляют гены и процессы наследования организмом определенных свойств и качеств, необходимо знать и понимать основные термины и положения. Краткое изложение основных понятий даст возможность изучить эту тему дальше.
Человеческие гены — это части цепи ДНК (дезоксирибонуклеиновая кислота в форме макромолекул), которая устанавливает последовательность определенных полипептидов (семейство аминокислот) и несет основную наследственную информацию от родителей к детям.
Проще говоря, определенный ген содержит информацию о структуре белка и передает ее от родителя к ребенку, повторяя структуру полипептидов и передавая по наследству.
Геном человека — это обобщенное понятие, обозначающее ряд конкретных генов. Впервые он был введен Гансом Винклером в 1920 году, но через некоторое время его первоначальное значение несколько изменилось.
Сначала он обозначил ряд хромосом (непарные и одиночные), а через время выяснилось, что в геноме 23 парных хромосомы и митохондриальная дезоксирибонуклеиновая кислота.
Генетическая информация — это данные, содержащиеся в ДНК и несущие в себе порядок построения белков в виде кода из нуклеотидов. Также стоит помнить, что такая информация находится внутри и за пределами ячейки.
Гены человека изучаются годами, в течение которых было проведено множество экспериментов. Все еще продолжаются эксперименты, которые предоставляют ученым новую информацию.
Благодаря недавним исследованиям стало ясно, что четкая и последовательная структура не всегда наблюдается у дезоксирибонуклеиновых кислот.
Существуют так называемые прерывистые гены, связи которых разорваны, что делает ошибочными все предыдущие теории о постоянстве этих частиц. В них время от времени происходят изменения, влекущие за собой изменения структуры дезоксирибонуклеиновых кислот.
История открытия
Впервые научный термин обозначил только в 1909 году выдающийся датский ботаник Вильгельм Йохансен.
Важно! В 1912 г появилось слово «генетика», которое стало названием всего отдела биологии. Именно он изучает гены человека.
Изучение частицы началось задолго до ХХ века (точных данных о годе нет) и состояло из нескольких этапов:
- В 1868 году известный ученый Дарвин выдвинул гипотезу о пангенезисе. В нем он описал отделение геммулы. Дарвин считал, что зачаток — это особая часть клетки, из которой затем образуются половые клетки.
- Несколькими годами позже Гуго де Фрис сформировал свою собственную теорию, отличную от дарвиновской, в которой он описал процесс пангенезиса внутри клеток. Он считал, что в каждой клетке есть частица, отвечающая за некоторые наследственные свойства вида. Он назвал эти частицы «пангенсами». Разница между двумя гипотезами заключается в том, что Дарвин считал почки частями внутренних тканей и органов, независимо от типа животного, а де Ври представлял свои пангены как признаки наследования внутри определенного вида.
- В. Йохансен в 1900 году определил наследственный фактор как ген, взяв вторую часть из термина, используемого де Врисом. Он использовал это слово для определения «изначального», той частицы, которая является наследственной. При этом ученый подчеркнул независимость термина от ранее выдвинутых теорий.
Биологи и зоологи давно изучают наследственный фактор, но только с начала 20 века генетика стала развиваться с невероятной скоростью, открывая людям секреты наследственности.
Расшифровка генома человека
С того момента, как ученые обнаружили наличие гена в организме человека, они начали исследовать вопрос о содержащейся в нем информации. Более 80 лет ученые пытались его расшифровать. На сегодняшний день они достигли в этом значительных успехов, что позволило влиять на наследственные процессы и изменять структуру клеток в следующем поколении.
История декодирования ДНК состоит из нескольких определяющих моментов:
- 19 век — начало изучения нуклеиновых кислот.
- 1868 г. — Ф. Мишер впервые выделяет нуклеин или ДНК из клеток.
- В середине двадцатого века О. Эйвери и Ф. Гриффит с помощью эксперимента, проведенного на мышах, обнаружили, что нуклеиновая кислота отвечает за процесс трансформации бактерий.
- Первым человеком, который показал миру ДНК, был Р. Франклин. Через несколько лет после открытия нуклеиновой кислоты он фотографирует ДНК, случайно используя рентгеновские лучи для изучения структуры кристаллов.
- В 1953 г было дано точное определение принципа воспроизводства жизни у всех видов.
Внимание! С тех пор, как двойная спираль ДНК была впервые представлена публике, было сделано много открытий, которые позволили нам понять природу ДНК и то, как она работает.
Считается, что человеком, открывшим этот ген, является Грегор Мендель, который первым обнаружил некоторые закономерности в цепочке наследования.
Но расшифровка ДНК человека произошла на основе открытия другого ученого — Фредерика Зенгера, который разработал методы считывания последовательностей аминокислот белка и последовательности для построения самой ДНК.
Благодаря работе многих ученых за последние три столетия были выяснены процессы формирования, характеристики и количество генов в геноме человека.
ДНК
Генетическая информация в подавляющем большинстве организмов закодирована в длинных молекулах ДНК. ДНК состоит из двух спирально закрученных полимерных цепей, мономерами которых являются четыре нуклеотида: аденозин, цитидин, гуанозин и тимидин. Нуклеотиды в ДНК состоят из пятиуглеродного сахара (2-дезоксирибоза), фосфатной группы и одного из четырех азотистых оснований: аденина, цитозина, гуанина и тимина: 2.1. Азотистое основание гликозидно связано с сахаром с пятью атомами углерода (пентоза) в положении 1 ‘. Основа цепей ДНК представляет собой чередующуюся последовательность пентозных и фосфатных сахаров, фосфатные группы присоединены к сахару в положениях 5 ‘и 3’. Номера позиций пентозного кольца обозначены пунктиром, чтобы различать нумерацию сахарных колец и азотистого основания.
Из-за химического состава остатков пентозы цепи ДНК являются направленными. Один конец полимера ДНК содержит открытую гидроксильную группу дезоксирибозы в положении 3 ‘; этот конец называется концом 3 ‘. Другой конец содержит открытую фосфатную группу, это 5 ‘конец. Две нити (нити) двойной спирали ДНК ориентированы в противоположных направлениях. Синтез ДНК, даже во время репликации ДНК, происходит в направлении 5 ‘→ 3’, потому что новые нуклеотиды добавляются посредством реакции дегидратации с использованием открытого 3 ‘гидроксила в качестве нуклеофила.
Экспрессия генов, кодируемых в ДНК, начинается с транскрипции нуклеотидной последовательности ДНК в нуклеотидную последовательность другого типа нуклеиновой кислоты, РНК. РНК очень похожа на ДНК, но ее мономеры содержат рибозу, а не дезоксирибозу. Кроме того, в РНК вместо тимина используется урацил. Молекулы РНК одноцепочечные и менее стабильны, чем ДНК. Гены белков содержат кодирующую последовательность, которая состоит из серии тринуклеотидных блоков — триплетов, соответствующих аминокислотам. Правило, по которому определяется, какой триплет какой аминокислоте соответствует, называется генетическим кодом. Считывание генетического кода происходит в рибосоме во время трансляции РНК в белок. Генетический код практически одинаков для всех известных организмов: 4.1.
Хромосомы
Геном человека состоит из 23 пар хромосом (всего 46 хромосом), где каждая хромосома содержит сотни генов, разделенных межгенным пространством. Межгенное пространство содержит регуляторные области и некодирующую ДНК.
Геном содержит 23 пары хромосом: 22 пары аутосомных хромосом, а также пару половых хромосом X и Y. У человека мужской пол гетерогаметен и определяется наличием хромосомы Y. Нормальные диплоидные соматические клетки имеют 46 хромосом.
Гены
Согласно результатам проекта Human Genome, количество генов в геноме человека составляет примерно 28 000 генов. Первоначальная оценка составляла более 100 000 генов. В связи с совершенствованием методов поиска генов (предсказание генов) ожидается дальнейшее уменьшение количества генов.
Число генов человека ненамного превышает число генов у более простых организмов, например нематоды Caenorhabditis elegans или мухи Drosophila melanogaster. Это связано с тем, что альтернативный сплайсинг широко представлен в геноме человека. Альтернативный сплайсинг дает несколько белковых цепей из одного гена. Следовательно, протеом человека оказывается намного больше, чем протеом рассматриваемых организмов. Большинство генов человека имеют несколько экзонов, а интроны часто значительно длиннее, чем граничные экзоны в гене.
Гены распределены по хромосомам неравномерно. Каждая хромосома содержит участки, богатые и бедные генами. Эти области коррелируют с хромосомными полосами (полосами по хромосоме, которые можно увидеть под микроскопом) и с областями, богатыми CG. В настоящее время значение такого неравномерного распределения генов до конца не изучено.
Помимо генов, кодирующих белок, геном человека содержит тысячи генов РНК, включая транспортную РНК (тРНК), рибосомную РНК, микроРНК (микроРНК) и другие некодирующие последовательности РНК.
Регуляторные последовательности
В геноме человека обнаружено множество различных последовательностей, которые отвечают за регуляцию генов. Регулирование относится к контролю экспрессии генов (процесс построения информационной РНК вдоль части молекулы ДНК). Обычно это короткие последовательности, которые примыкают к гену или внутри гена. Иногда они располагаются на значительном удалении от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также проблемы реципрокной регуляции группы генов группой соответствующих ферментов в настоящее время находятся только на начальной стадии исследования. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих тем находится на пересечении нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Эти знания получены в результате сравнения геномов разных организмов и благодаря достижениям в организации искусственной транскрипции генов в лаборатории.
Идентификация регуляторных последовательностей в геноме человека частично была основана на эволюционном консерватизме (свойстве сохранять важные фрагменты хромосомной последовательности, которые соответствуют примерно той же функции). Согласно некоторым гипотезам, в древе эволюции ветвь, отделяющая человека от мышей, появилась примерно 70-90 миллионов лет назад. Для двух геномов компьютерные методы выявили консервативные последовательности (последовательности идентичны или немного отличаются в сравниваемых геномах) в некодирующей части и было обнаружено, что они активно участвуют в механизмах регуляции генов для обоих организмов .
Другой подход к получению регуляторных последовательностей основан на сравнении генов человека и рыб фугу. Последовательности генов и регуляторные последовательности у людей и пуховиков в целом похожи, но геном пуховиков содержит в 8 раз меньше «мусорной ДНК». Эта «компактность» генома рыб значительно упрощает поиск регуляторных последовательностей генов.
Прочие объекты в геноме
Последовательности, кодирующие белок (многие из последовательностей, составляющих экзоны), составляют менее 1,5% генома. Помимо известных регуляторных последовательностей, геном человека содержит ряд объектов, которые кажутся важными, но чья функция, если таковая имеется, в настоящее время неясна. Фактически эти объекты занимают до 97% от общего объема генома человека. К таким предметам относятся:
- реплики
- тандемные повторения
- спутниковая ДНК
- мини-спутники
- микроспутники
- разрозненные повторы
- SINE (короткие интеркалированные ядерные элементы)
- ЛИНИИ (длинный интеркалированный ядерный элемент)
- тандемные повторения
- транспозоны
- Ретротранспозоны
- LTR (длинный терминальный повтор)
- Ty1-копия
- Ty3-цыганский
- Не LTR
- LTR (длинный терминальный повтор)
- Транспозоны ДНК
- Ретротранспозоны
- псевдогены
Представленная классификация не является исчерпывающей. Большинство объектов на данный момент вообще не классифицировано мировым научным сообществом.
Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция отключена, и многие называют эти части генома «мусорной ДНК». Однако есть много свидетельств того, что эти объекты выполняют некоторую функцию, которая на данный момент не полностью изучена.
Содержание программы «Геном человека»
В 1990 году стартовал международный проект «Геном человека», возглавляемый Джеймсом Уотсоном. Его целью было выяснить, в какой последовательности расположены нуклеотиды в ДНК, и идентифицировать около 25000 генов в человеке. Благодаря этому проекту человек должен был получить полное представление о формировании ДНК и расположении всех ее составных частей, а также о механизме построения гена.
Стоит уточнить, что программа ставила перед собой задачу определить не всю последовательность нуклеиновых кислот в клетках, а только определенные участки. Это началось в 1990 году, но только в 2000 году был опубликован черновик работы, а полное исследование было завершено в 2003 году. Исследования последовательностей все еще продолжаются, и 8% гетерохроматиновых регионов еще не идентифицированы.
Предпосылки
Этот проект стал кульминацией нескольких лет работы при поддержке Министерства энергетики США, в первую очередь семинаров, проведенных в 1984 и 1986 годах, и последующих действий Министерства энергетики. В отчете 1987 года четко говорится: «Конечная цель этих усилий — понять геном человека» и «знание генома человека столь же важно для развития медицины и других наук о здоровье, как знание анатомии было необходимо для достижения его нынешнего состояния. «.» Поиск подходящих технологий для решения предложенной проблемы начался во второй половине 1980-х годов.
С 1988 года Джеймс Уотсон возглавляет Национальный центр исследования генома человека при Национальной организации здравоохранения (NIH) США. В 1992 году он был вынужден уйти в отставку, в основном из-за несогласия с позицией своего лидера Бернадина Хили по генетическим патентам. В апреле 1993 года его сменил Фрэнсис Коллинз, а в 1997 году название центра было изменено на Национальный институт исследований генома человека (NHGRI).
Проект стоимостью 3 миллиарда долларов был официально запущен в 1990 году Министерством энергетики США и Национальным институтом здравоохранения и, как ожидается, продлится 15 лет. Помимо США, в международный консорциум входят генетики из Китая, Франции, Германии, Японии и Великобритании.
Благодаря обширному международному сотрудничеству и новым достижениям в геномике (особенно секвенированию), а также значительным достижениям в области вычислений геном был завершен в 2000 году (как совместно объявили тогдашний президент США Билл Клинтон и премьер-министр Тони Блэр 26 июня 2000 года). Эта непрерывная последовательность привела к тому, что в апреле 2003 года было объявлено о близком завершении строительства, на 2 года раньше запланированного срока. В мае 2006 года была достигнута еще одна веха на пути к завершению проекта, когда последовательность последней хромосомы, Хромосома 1, была опубликована в журнале Nature .
Завершённость
Существует множество определений «полной последовательности генома человека». По мнению одних, геном уже полностью секвенирован, а по мнению других, этого еще предстоит достичь. В популярной прессе появилось много статей о «завершении» генома. Согласно определению, используемому в Международном проекте по декодированию генома человека, геном полностью расшифрован. Диаграмма расшифровки стенограммы проекта показывает, что большая часть генома человека была завершена в конце 2003 года. Тем не менее, некоторые области все еще считаются незавершенными:
- Во-первых, центральные области каждой хромосомы, известные как центромеры, которые содержат большое количество повторяющихся последовательностей ДНК; их сложно упорядочить с помощью современных технологий. Центромеры состоят из миллионов (возможно, десятков миллионов) пар оснований в длину и в целом остаются несеквенированными.
- Во-вторых, концы хромосом, называемые теломерами, также состоят из повторяющихся последовательностей, и по этой причине в большинстве из 46 хромосом их декодирование не завершено. Неизвестно точно, какая часть последовательности остается нерасшифрованной для теломер, но, как и в случае с центромер, существующие технологические ограничения препятствуют их секвенированию.
- В-третьих, в геноме каждого человека есть несколько локусов, которые содержат членов мультигенных семейств, которые также трудно расшифровать с помощью ведущего в настоящее время метода фрагментации ДНК. В частности, эти семейства кодируют белки, важные для иммунной системы.
- Помимо перечисленных регионов, в геноме все еще есть некоторые разрозненные бреши, некоторые из которых довольно большие, но, надеюсь, все они будут заполнены в ближайшие несколько лет.
Большая часть оставшейся ДНК сильно повторяется и вряд ли будет содержать гены, но это останется неизвестным до тех пор, пока не будет полностью секвенировано. Понимание функций всех генов и их регуляции остается далеко не полным. Роль мусорной ДНК, эволюция генома, различия между людьми и многие другие вопросы по-прежнему являются предметом интенсивных исследований в лабораториях по всему миру.
Цели
Последовательность ДНК человека хранится в базах данных, доступных любому пользователю через Интернет. Национальный центр биотехнологической информации США (и его партнерские организации в Европе и Японии) хранят геномные последовательности в базе данных, известной как GenBank, вместе с известными и гипотетическими последовательностями генов и белков. Другие организации, такие как Калифорнийский университет в Санта-Крус и Ensembl, поддерживают дополнительные данные и аннотации, а также мощные инструменты визуализации и поиска для этих баз данных. Были разработаны компьютерные программы для анализа данных, поскольку сами данные практически невозможно интерпретировать без таких программ.
Процесс определения границ генов и других мотивов в необработанных последовательностях ДНК называется аннотацией генома и относится к области биоинформатики. Эта работа выполняется людьми с помощью компьютеров, но они делают это медленно, и для удовлетворения требований высокой пропускной способности проектов секвенирования генома они все чаще используют специальные компьютерные программы. Лучшие современные технологии аннотации используют статистические модели, основанные на параллелях между последовательностями ДНК и человеческим языком, с использованием компьютерных концепций, таких как формальные грамматики.
Другая часто упускаемая из виду цель проекта «Геном человека» — это исследование этических, юридических и социальных последствий расшифровки генома. Важно исследовать эти проблемы и найти наиболее подходящие решения, прежде чем они станут питательной средой для политических разногласий и проблем.
У всех людей так или иначе есть уникальные геномные последовательности. Таким образом, данные, опубликованные Human Genome Project, не содержат точной последовательности генома каждого человека. Это комбинированный геном небольшого числа анонимных доноров. Полученная геномная последовательность является основой для будущей работы по выявлению различий между людьми. Основные усилия здесь сосредоточены на выявлении однонуклеотидного полиморфизма.
Большинство целей, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект по расшифровке генома человека был завершен на два года раньше запланированного срока. В рамках проекта была поставлена разумная и достижимая цель — 95% -ное секвенирование ДНК. Исследователи не только преуспели, но и превзошли свои прогнозы и смогли секвенировать 99,99% ДНК человека. Проект не только превзошел все ранее разработанные цели и стандарты, но и продолжает улучшать уже достигнутые результаты.
Первые итоги и дальнейшее развитие
Так, в 2000 году удалось получить представление о последовательности ДНК человека в составе эухроматина — участках, с которых активно идет транскрипция, то есть считывание данных РНК-полимеразой.
По оценкам ученых, эухроматин составляет около 95% всего генома. Остальная часть ДНК скрыта в плотно упакованных белковых комплексах и большую часть времени молчит. Помимо людей, как рекомендовали эксперты в 1990 году, в 2001 году были секвенированы геномы «599 вирусов и вироидов, 205 природных плазмид, 185 органелл, 31 эубактерии, семи архей, гриба, двух животных и растения». В официальном финале проекта список пополнился геномами мышей и крыс — модельных животных, без которых немыслимы никакие важные медицинские исследования.
Результат проекта, конечно же, не ограничивается одной грубой последовательностью букв. После расшифровки количество генов в геноме человека пришлось сократить со 100 000 до 30 000 — это число вдвое больше, чем у мухи или червя, писали авторы исторической публикации в Nature.
Ученые также узнали, что геном человека содержит множество повторений и движущихся элементов, подавляющее большинство из которых больше не работают. Кроме того, геном человека очень разнообразен: генетики подсчитали, что количество однонуклеотидных полиморфизмов в нем (области, где у разных людей может быть один или другой нуклеотид) достигает 1,5 миллиона. Это стало ясно, в том числе, благодаря тому, что в проекте использовалась ДНК большого количества добровольцев, а не одного человека.
«Есть много вещей, о которых вы в принципе не подозревали. Итак, вы жили где-то на берегу и думали, что живете на маленьком острове. Потом мы как-то поднялись на гору, туман рассеялся, и вы увидели, что это на самом деле целый континент », — описывает научные результаты проекта Михаила Гельфанда, лаборатория которого участвовала в сборке и анализе генома человека.
Однако геномные исследования только начались с публикации первой статьи о геноме. Гельфанд приводит несколько примеров: «После проекта« Геном человека »был, например, проект ENCODE, где люди уже целенаправленно изучали функциональные вещи. Не просто записать последовательность букв, а понять, почему ткани разные, почему гены по-разному работают в разных тканях. Опять же, как работает злокачественная дегенерация, как гены начинают работать по-разному, как это работает, как изменяется работа гена на раннем этапе развития, когда из одного типа клеток возникает множество различных тканей. Как ДНК упаковывается в клетки и на что это влияет. Существует множество технологий, которые сообщают нам точные функциональные данные, но они очень сильно связаны с секвенированием генома. Секвенируйте что-нибудь, затем нанесите на карту геном и затем сделайте из него некоторые функциональные выводы. Действительно, это было началом науки под названием системная биология, когда каждый пытается понять не один за другим, как работают гены, а как работает клетка в целом, но в то же время в мельчайших подробностях. А это в принципе невозможно без генома. И снова наш уровень понимания того, как работает клетка, резко изменился. Мы не просто как слепые слоны, слышащие с разных сторон, но теперь мы смотрим на слона целиком и полностью».
«Стандартный» или эталонный геном человека все еще находится в стадии определения. «Финальный пункт был очень условным. Мы договорились, что этот момент следует рассматривать как момент, когда Клинтон и Блэр сделали свое заявление. В то время геном еще не был завершен, поэтому люди потратили много лет на то, чтобы убрать это дело », — говорит Гельфанд. — Сейчас выходят замечательные работы, из которых следует, что если взять много-много геномов разных людей, то будут целые фрагменты, которых нет в классическом геноме, то есть мы различаемся не только точечными мутациями и заменами, но и целыми большими фрагментами генома, которые у некоторых есть, а у некоторых нет. В прошлом году вышла статья, они добавили небольшой процент к универсальному человеческому геному, просто путем секвенирования многих африканцев».
Как были достигнуты результаты
Первое бумажное издание генома человека, выставленное в Wellcome Collection в Лондоне
Проект финансировался правительством США через Национальные институты здравоохранения и Wellcome Trust, британскую благотворительную организацию, которая финансировала Институт Сенгера и многие другие группы по всему миру. Финансирование было распределено между несколькими крупными центрами секвенирования, включая Институт Уайтхеда, Институт Сенгера, Вашингтонский университет в Сент-Луисе и Медицинский колледж Бейлора.).
Геном был разделен на небольшие участки, длиной около 150 000 пар оснований. Затем эти части были вставлены в вектор, известный как искусственная бактериальная хромосома или ВАС. Эти векторы созданы из генетически модифицированных бактериальных хромосом. Затем векторы, содержащие гены, могут быть вставлены в бактерии, где они копируются механизмами репликации бактерий. Затем каждый из фрагментов генома был секвенирован отдельно с использованием метода дробовика, а затем все полученные последовательности были объединены в виде компьютерного текста. Размер полученных больших фрагментов ДНК, собранных для воссоздания структуры целой хромосомы, составлял приблизительно 150 000 пар оснований. Эта система известна как «иерархический метод дробовика», потому что сначала геном разбивается на части разного размера, положение которых на хромосоме должно быть известно заранее.
Геном для медицины
За двадцать лет, прошедших с момента завершения сборки черновой версии генома, технологии секвенирования и анализа последовательностей достигли такого уровня развития, что сегодня обнаружение последовательности кодирующих областей генома не будет стоить вам трех миллиардов долларов геном (экзом) но всего несколько сотен.
Исследовательские базы данных продолжают расти: это делает, например, проект «Тысяча геномов», призванный оценить генетическое разнообразие жителей планеты. Создаются национальные банки ДНК. Например, исландская компания deCODE genetics владеет генетической информацией двух третей исландского населения. Эти данные также используются для разработки персонализированной медицины — индивидуального назначения терапии на основе генетических данных пациента.
Генотипирование — определение однонуклеотидных полиморфизмов конкретного человека — во многих отношениях уже стало обычным делом: база данных UK Biobank содержит данные о полном типировании генома 500 000 человек. Помимо генетических данных, записи участников содержат информацию о показателях здоровья, привычках, семейном анамнезе и т.д. Такие наборы данных позволяют исследователям проводить так называемое исследование геномной ассоциации (GWAS), которое может выявить, например, генетическую предрасположенность к определенному заболеванию.
«Геномные исследования могут показать, что носители этого варианта гена болеют, например, в пять раз чаще, чем носители другого варианта. Эти знания могут помочь вам скорректировать свой образ жизни, чтобы свести к минимуму вероятность. Но расчет рисков развития заболевания полностью основан на статистике, еще есть возможности для развития математического аппарата, — говорит Лебедев. — Что касается предсказания генома ребенка для спорта и музыки, это, конечно, из области фантастики. Однако секвенирование генома или экзома может помочь родить здоровых детей, если родители несут определенные вредные мутации».
В последние годы в онкологии активно используются секвенирование ДНК и генотипирование (мы уже подробно обсуждали это в материале «Под индивидуальным руководством»). Помимо назначения терапии, в зависимости от наличия определенных мутаций в опухоли, онкогеномика помогает понять природу опухолей и их метастазов. «Многое в медицинской генетике, онкологии и иммунологии также связано с геномами. Сейчас люди уже начали смотреть на геномы отдельных клеток, это позволяет, например, обнаружить развитие рака. Раковая опухоль неоднородна, имеет много разных клонов, и это очень важно для лечения. Содержит устойчивые клоны, не поддающиеся никакому лечению. Те, у кого есть метастазы, и те, кто недостаточно злокачественен, чтобы метастазировать. И теперь появляются первые работы такого рода, когда люди просто создают генеалогию отдельных клеток раковой опухоли », — поясняет Гельфанд.
«С помощью современных постгеномных технологий вы можете увидеть, сколько клеток в организме человека инфицировано SARS-CoV-2», — приводит яркий пример Лебедев, лаборатория которого в настоящее время изучает субпопуляции иммунных клеток человека. — И вы можете понять, убиваются ли эти клетки, умирают или сражаются, как развивается иммунный ответ. Используя как секвенирование, так и другие методы, такие как многомерная флуоресцентная гибридизация (FISH), можно подсчитать в образце крови пациента, сколько цитотоксических лимфоцитов имеется, сколько вспомогательных лимфоцитов, сколько антител они вырабатывают, сколько из них уже есть перешли в ячейки памяти».
Доноры генома
В рамках Межгосударственного проекта генома человека (HGP) исследователи IHGSC взяли образцы крови (женской) и спермы (мужской) у большого числа доноров. Из собранных образцов лишь несколько стали источником ДНК. Поэтому личности доноров были скрыты, чтобы ни доноры, ни ученые не могли знать, кто была секвенированная ДНК. В ходе проекта были использованы многочисленные клоны ДНК из различных библиотек. Большинство этих библиотек было создано доктором Питером Дж. Де Йонгом. Неофициально сообщалось и хорошо известно генетическому сообществу, что большая часть ДНК в правительственном проекте была получена от единственного анонимного донора, самца буйвола (кодовое имя RP11) .
Ученые HGP использовали лейкоциты из крови двух доноров мужского и двух женского пола (случайным образом выбранных из 20 образцов каждого пола) — каждый донор стал источником отдельной библиотеки ДНК. Одна из этих библиотек (RP11) использовалась гораздо чаще, чем другие, по соображениям качества. Небольшой технический нюанс заключается в том, что мужские образцы содержали только половину количества ДНК от X- и Y-хромосом по сравнению с другими 22 хромосомами (аутосомами); это потому, что каждая мужская клетка (сперматозоид) содержит только одну X и одну Y хромосому, а не две, как другие клетки.
Хотя основная фаза проекта «Геном человека» завершена, исследования вариабельности ДНК продолжаются в рамках международного проекта HapMap, который направлен на определение структуры кластеров однонуклеотидного полиморфизма (SNP) (называемых гаплотипами). Образцы ДНК для HapMap были получены от 270 человек: народа йоруба из Ибадана, Нигерия, японцев из Токио, китайцев из Пекина и французского источника Centre d’Etude du Polymorphisms Humain (CEPH), который состоит из жителей США западного и североевропейского происхождения.
В проекте Celera Genomics для секвенирования использовалась ДНК пяти человек. Крейг Вентер, основатель компании, который в то время был также научным директором Celera, позже сообщил (в публичном письме в Science), что его ДНК, являющаяся одним из 21 образца общего фонда, была включена в выбранную пятерку лучших для использования в проекте.
Команда под руководством Крейга Вентера опубликовала полную последовательность ДНК 4 сентября 2007 года, впервые открыв шесть миллиардов нуклеотидных последовательностей одного генома человека.