Секвенирование генома что это такое


Полное секвенирование генома: инструкция по применению

Интерес к теме полного секвенирования генома во многом стимулируется коммерческими лабораториями, которые предлагают клиентам узнать все о своем геноме, чтобы правильно подобрать диету, определить таланты, узнать свою этническую принадлежность. Однако полное секвенирование генома -  серьезный медицинский инструмент, который позволяет диагностировать наследственные болезни. О том, кому нужно секвенирование генома и как правильно им воспользоваться, рассказал кандидат биологических наук, руководитель Лаборатории Клинической Биоинформатики Федор Коновалов.

 1742 • • 29.11.2018

- Что дает анализ «полное секвенирование генома»?

- Строго говоря, полное секвенирование генома - не медицинский анализ, это просто способ получения генетической информации. В ходе секвенирования прочитывается практически весь геном человека. Сегодня используется такой подход: ДНК случайным образом разрезается на множество мелких фрагментов, к фрагментам добавляются специальные адаптеры на концах, и затем их количество нарабатывается с помощью ПЦР. После все эти кусочки параллельно «читаются», специальные программы «собирают» из них геном и выявляют изменения в нем относительно так называемого референса – это искусственная стандартная последовательность генома, своеобразный пример для сравнения.

В ходе секвенирования генома можно проанализировать практически все гены, межгенные участки, митохондриальную ДНК. В целом, полное геномное секвенирование хорошо справляется с выявлением «точковых» мутаций, а структурные изменения (транслокации, инверсии) выявляются хуже. Поэтому в случае подозрений на такие хромосомные перестройки лучше использовать более надежные специализированные методы: таргетные тесты, FISH или кариотипирование.

Использовать данные секвенирования можно по-разному, но мы остановимся на применении в медицинских целях.

- Кому стоит задуматься о полном секвенировании генома?

- Задуматься о нем имеет смысл тем, у кого есть причины для посещения врача-генетика.

Во-первых, полное секвенирование генома – инструмент для выявления причины наследственного заболевания. Тест действительно универсальный, его особенность в том, что одновременно с «обычными» хромосомами читается и митохондриальная ДНК: маленькая, но очень важная кольцевая молекула. Однако здесь важно понимать, что есть типы мутаций, которые с помощью этого анализа не выявляются. Хороший врач на основе предполагаемого или уже существующего клинического диагноза выбирает метод для проведения анализа.

Во-вторых, секвенирование генома можно было бы использовать при планировании семьи – как метод скрининга на носительство патогенных мутаций, при наличии которых в одном и том же гене у обоих родителей в семье могут родиться дети с рецессивными заболеваниями. Впрочем, когда есть популяционные данные о частых мутациях для определенного народа, вполне рационально будет провести не секвенирование генома целиком, а специальный тест на выявление этих часто встречающихся мутаций – так выйдет дешевле, но это поможет значительно снизить риск рождения больного ребенка. Кроме того, носительство некоторых частых и при этом тяжелых заболеваний (таких как спинальная амиотрофия) для надежной детекции требует специального теста, поэтому я бы не стал переоценивать возможности геномного секвенирования. Это в любом случае не метод, который позволит застраховаться от абсолютно всех генетических рисков.

В-третьих, полное секвенирование генома позволяет получить информацию о некоторых высокорисковых состояниях, например, о высокой вероятности заболевания раком молочной железы и яичников. Это актуально, например, для женщин, в семье которых были случаи рака молочной железы или яичников в молодом возрасте или несколько случаев рака молочной железы и яичников у нескольких родственников.

К возможностям геномного секвенирования следует подходить разумно: эффективность анализа генома несколько выше, чем у менее масштабных, но тоже современных исследований (в частности, экзомного секвенирования), однако отличается не в разы, а лишь – в случае экзома – на несколько процентов.

Сегодня я бы рассматривал геном скорее как исследование «последней линии» либо как выбор для тех, кто хочет получить максимум информации на будущее – ведь данные секвенирования можно при необходимости переанализировать.

- Сколько стоит секвенирование генома?

- В рамках проекта «Геном человека» (международный проект, целью которого было определить последовательность нуклеотидов, которые составляют ДНК и идентифицировать 20—25 тыс. генов в человеческом геноме – G-I) ежегодно в течение 10 лет тратилось от 30 до 50 млн долларов. Тогда геном секвенировали еще на капиллярных секвенаторах по одному фрагменту за раз; впрочем, и требования проекта были существенно строже, чем необходимо сейчас – ведь тогда речь шла о создании той самой референсной последовательности, с которой сегодня мы сравниваем данные.

При переходе на секвенирование нового поколения цена, конечно, значительно снизилась. Буквально 7 лет назад она составляла примерно 10 тыс. долларов. Сегодня цена полного секвенирования генома составляет менее 1 тыс. долларов в крупных лабораториях Китая и Кореи (без интерпретации). В России цена чуть выше – в районе 1,5-2 тыс. долларов.

- Что нужно знать пациенту/клиенту, чтобы подобрать лабораторию для проведения теста?

- В России рынок лабораторной геномики - это «Дикий Запад», где каждый ковбой сам за себя.

Еще не сложились единые высокие стандарты – а точнее, не везде используются те международные рекомендации, которые считаются общепринятыми. Несмотря на это, хорошие лаборатории есть, и они следуют этим стандартам.

Для начала я бы описал, по каким параметрам не стоит выбирать лабораторию.

Во-первых, не нужно ориентироваться на цену. Есть мнение, что чем выше цена, тем выше качество. Это не так. Цена может быть ниже по многим причинам – например, лаборатория только вышла на рынок и хочет привлечь клиентов, или лаборатория пользуется более производительным секвенатором. В-вторых, не стоит выбирать клинику по красоте сайта: он должен быть прежде всего информативным.

Имеет смысл посоветоваться с врачом, которому вы доверяете. Если это врач, который придерживается позиций доказательной медицины, сам участвует в конференциях, следит за новостями медицинской науки и развивается как профессионал, то скорее всего он сможет вам порекомендовать хорошую лабораторию.

Также вы можете обратить внимание на деятельность сотрудников самой лаборатории. Если сотрудники публикуются в международных научных журналах, выступают на конференциях с докладами, показывают честную статистику – значит, скорее всего, это добросовестная команда.

Важно отметить, что качество результата складывается из качества собственно процедуры секвенирования и качества интерпретации. В первом случае имеет значение избыточность данных (так называемая средняя глубина прочтения, или среднее покрытие) – от этого зависит качество выявления мутаций. Заранее спросите: с каким средним покрытием секвенируется геном? Для генома это число должно быть выше 30x; для экзома и панелей – не менее 70x.

После проведения анализа имеет смысл запросить не только заключение, но и первичные данные секвенирования: по этим файлам можно оценить качество прочтения генома. Лучше делать это в другой, независимой лаборатории.

Что касается интерпретации данных – здесь все сложнее. Боюсь, что человек без специального образования и опыта не разберется во всех терминах современного генетического заключения. Однако ничто не мешает вам оценить аккуратность, с которой написано заключение.

В медицинской генетике формулировки играют огромную роль, и иногда одно-два слова полностью меняют клиническое значение той или иной находки. Если лаборатория за несколько десятков тысяч рублей не может выдать аккуратное, подробное и грамотно написанное заключение, значит, на всем остальном она тоже сэкономила.

Можно ли сказать, что полное секвенирование генома лучше заказывать за рубежом? (там делают качественнее или, возможно, дешевле?)

Как я уже говорил, в России есть хорошие лаборатории, работающие на мировом уровне. Другой вопрос: насколько вероятно получить качественную услугу, обратившись в случайно выбранную организацию? В случайно выбранной немецкой лаборатории все-таки выше вероятность найти достойное качество, чем в случайно выбранной российской. На сложившихся рынках Запада меньше шарлатанов – требовательный рынок уже приучил своих участников работать хорошо. Сам я врачам и представителям пациентских организаций уверенно рекомендую сдавать анализ в России, но при этом имею в виду определенные лаборатории, которым доверяю. Если врач не дал вам таких рекомендаций, и вы выбираете наобум – возможно, есть смысл обратить внимание на ведущие зарубежные предложения.

- Как проходит сам анализ?

- В качестве биоматериала обычно собирают венозную кровь, из нее выделяют ДНК, с которой затем проводят множество манипуляций. Сам процесс пробоподготовки и секвенирования сложный – он состоит из нескольких десятков этапов.

Есть заблуждение, что все, что необходимо для проведения теста – это секвенатор. На самом деле, в процессе участвует множество приборов. Но еще важнее работа специалистов. Подготовка «библиотек» (наборов фрагментов ДНК для секвенирования) – сложная и ответственная задача; на последних этапах стоимость ошибки сотрудника лаборатории может составлять миллион рублей и выше; и это если считать только стоимость потраченных реагентов.

Секвенатор анализирует «библиотеку» ДНК автоматически. На выходе получаются «сырые данные» объемом десятки и сотни гигабайт. С ними уже работают биоинформатики: они выявляют генетические изменения, анализируют их по нескольким десяткам параметров, сопоставляют с базами данных, представляют информацию в структурированном виде – и в конечном итоге помогают врачам принимать информированные и обоснованные решения о том, что считать причиной заболевания.

В России полное секвенирование генома занимает от 1,5 до 4 месяцев. В действительности, если на всех этапах работать максимально оперативно, то можно уложиться в 10 дней. Но это практически предел.

- Насколько это точный тест?

- Анализ «полное секвенирование генома» нельзя считать самостоятельным диагностическим тестом.

Для генома нельзя измерить чувствительность и специфичность в отношении выявления всех возможных мутаций. Существуют гены, расположенные в очень сложных для чтения участках; есть гены, у которых в хромосомах есть очень похожие на них копии – псевдогены; в таких случаях точность и даже сама возможность детекции уже ниже. Поэтому результаты геномного секвенирования необходимо проверять референсным методом.

Допустим, в заключении приведены 4 мутации. Врач-генетик смотрит на них, сопоставляет описание заболеваний с клиническими данными больного и определяет: какие из этих вариантов по сочетанию типа наследования, клинических признаков и других параметров могут иметь отношение к случаю пациента. И именно эти варианты дополнительно проверяют секвенированием по Сэнгеру, причем часто и у родителей больного.

С технической точки зрения у хорошей лаборатории ложных результатов почти не бывает, однако перепроверка никогда не будет лишней. Хуже другое – ложная классификация мутаций: прежде всего, сообщение под видом патогенных заведомо доброкачественных генетических изменений, которые не могут быть причиной заболевания. Это проблема интерпретации, а не детекции. Врач должен быть очень бдительным. В заключении, если мутация описывается как патогенная или вероятно патогенная, лаборатория обязательно должна подтверждать свои слова ссылками на статьи или базы данных – и эта информация должна быть проверяемой. Хорошее описание мутации в лабораторном заключении – это обычно увесистый абзац текста, со ссылками на литературу, номера в базах данных, с указанием численных параметров и точных координат мутации в разных форматах по международной номенклатуре. Это делается не для того, чтобы «загрузить» врача – а чтобы можно было перепроверить сделанные выводы о патогенности мутации, не анализируя данные «с нуля».

При этом нет ничего плохого в сообщении вариантов с неопределенной клинической значимостью (а они часто встречаются в заключениях), когда такая классификация корректна. Если убедительных данных за патогенность мутации или за ее доброкачественность сегодня нет, то по международным рекомендациям принято все же сообщать такие варианты, если они могут иметь отношение к заболеванию, но при этом честно указывать их неопределенный статус. После дополнительных исследований часто оказывается, что такие варианты сообщены не зря.

Вопрос «ложноотрицательных» результатов сложнее. В качестве таковых иногда рассматривают «пустое» заключение, например, если врач уверен в наследственной природе болезни пациента. Здесь не стоит спешить винить лабораторию – если, конечно, при перепроверке данных не выяснилось, что она упустила что-то очевидное. Степень изученности групп заболеваний разная, далеко не для всех генов хорошо известна связь с той или иной патологией; поэтому, несмотря на бурное развитие технических методов, причину заболевания удается установить только у определенной доли пациентов – и эта доля сильно зависит от клинической картины. В этом смысле статистика хороших российских лабораторий примерно сопоставима с мировой.

Интерпретация результатов генетических тестов очень сложна, как и сама медицинская генетика. Лучше доверить и назначение геномных исследований, и постановку диагноза на их основе опытному врачу.

Авторы:

12 методов в картинках: секвенирование нуклеиновых кислот

Секвенирование ДНК и РНК — это рутинный процесс, позволяющий, тем не менее, вникнуть в суть всего живого. Первоначально расшифровка генома была «развлечением» для избранных, а сегодня заказать эту услугу может каждая вторая научно-исследовательская лаборатория. С каждым годом проникнуть в дебри геномной, транскриптомной и эпигеномной информации становится все проще. Этот обзор посвящен основным принципам секвенирования нуклеиновых кислот и может послужить превосходным путеводителем как для любителя, изучающего основы молекулярной биологии, так и для специалиста, который планирует эксперимент и грезит научными прорывами.

Генеральный партнер цикла — компания «Диаэм»: крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.

Партнер этой статьи — «СкайДжин»

Пять причин выбрать SkyGen:

  1. Доступ к высококачественной продукции для молекулярной биологии
  2. Быстрая логистика и складская программа
  3. Удобное и взаимовыгодное сотрудничество
  4. Высококвалифицированная поддержка
  5. Адекватные цены

Одна из главных миссий «Биомолекулы» — докопаться до самых корней. Мы не просто рассказываем, какие новые факты обнаружили исследователи — мы говорим о том, как они их обнаружили, стараемся объяснить принципы биологических методик. Как вытащить ген из одного организма и вставить в другой? Как проследить в огромной клетке за судьбой нескольких крошечных молекул? Как возбудить одну крохотную группу нейронов в огромном мозге?

И вот мы решили рассказать о лабораторных методах более системно, собрать воедино в одной рубрике самые главные, самые современные биологические методики. Чтоб было интереснее и нагляднее, мы густо проиллюстрировали статьи и даже кое-где добавили анимации. Мы хотим, чтобы статьи новой рубрики были интересны и понятны даже случайному прохожему. И с другой стороны — чтобы они были так подробны, что даже профессионал мог бы обнаружить в них что-то новое. Мы собрали методики в 12 больших групп и собираемся сделать на их основе биометодический календарь. Ждите обновлений!

С момента открытия нуклеиновых кислот прошло уже почти полторы сотни лет. В далеком 1869 году Иоганн Фридрих Мишер выделил из находившихся в гное клеток неизвестное доселе вещество, содержащее азот и фосфор, которое назвал нуклеином, а затем (из-за его свойств) — нуклеиновой кислотой. Первоначально считалось, что молекулы нуклеиновых кислот — резерв фосфора в клетках, однако уже в первой половине XX века ученые доказали их наследственную природу. Тогда же появилось понятие гена —наименьшей структурной и функциональной единицы наследственности, — и сформировалась новая наука — генетика.

Вплоть до середины прошлого века структура носителей генетической информации и способы ее передачи оставались неясными. Модель двойной спирали ДНК, которая входит во все современные учебники генетики и молекулярной биологии, предложили в 1953 году Френсис Крик и Джеймс Уотсон (за это в 1962 ученые получили Нобелевскую премию). Последовавшие следом открытие генетического кода и разработка центральной догмы молекулярной биологии дали мощный толчок к развитию естественных наук, в первую очередь — генетики. Основные исторические вехи этого процесса показаны на рисунке 1.

Рисунок 1. История геномных исследований и секвенирования нуклеиновых кислот. 8 марта 1865 г. — Грегор Мендель доложил результаты своих опытов, объясняющие механизм наследования. 1869 г. — Иоганн Фридрих Мишер выделил из клеток в гное неизвестное доселе вещество, содержащее азот и фосфор, которое назвал нуклеином. 1905–1909 гг. — появление терминов «ген» и «генетика». 1953 г. — Френсис Крик и Джеймс Уотсон предложили структуру двойной спирали ДНК. 1958 г. — Френсис Крик сформулировал центральную догму молекулярной биологии. 1975 г. — Сэнгер с коллегами разработал «плюс-минус» метод секвенирования ДНК. 1977 г. — группа Сэнгера разработала метод «терминаторов». 1977 г. — Максам и Гилберт предложили метод секвенирования ДНК путем химической деградации. 2001 г. — опубликован первый полный геном человека. 2005 г. — коммерциализация технологии пиросеквенирования. 2006 г. — коммерциализация технологии Solexa (Illumina). 2006 г. — коммерциализация технологии лигазного секвенирования. 2010 г. — коммерциализация технологии ионного полупроводникового секвенирования (технология PostLightTM). 2011 г. — первый коммерческий релиз секвенаторов PacBio, основанных на технологии одномолекулярного SMRT-секвенирования. 2015 г. — начало продаж первых приборов, основанных на секвенировании через нанопору. Чтобы увидеть рисунок в полном размере, нажмите на него.

Осознав основные принципы функционирования нуклеиновых кислот (НК), научное сообщество предприняло грандиозные усилия для того чтобы разработать быстрые и эффективные методы определения их первичной последовательности (рис. 2) — как это принято говорить сегодня, секвенирования. Спустя десятилетия после открытия Уотсона и Крика в биологической науке наступила новая эпоха — эра секвенирования нуклеиновых кислот и геномики...

Рисунок 2. Секвенирование нуклеиновых кислот (другими словами, определение их нуклеотидной последовательности) — это расшифровка первичной структуры линейных молекул ДНК или РНК, состоящих из последовательности «букв» — нуклеозидтрифосфатов: дАТФ, дГТФ, дЦТФ, дТТФ и УТФ. Эти «буквы» зачастую именуют просто по азотистому основанию, входящему в их состав — аденин (А), гуанин (Г), цитозин (Ц), тимин (Т), а также урацил (У) в случае РНК.

Кстати, секвенировать можно не только нуклеиновые кислоты, но и другие биополимеры — например, пептиды и белки, «сотканные» из аминокислотных остатков. Однако в этом спецпроекте мы предпочли подробно остановиться на секвенировании только нуклеиновых кислот и не затрагиваем отдельно тему белкового секвенирования.

Примечание от «Диаэм»: Белковое секвенирование методом Эдмана проводят на приборах Shimadzu в сочетании с ВЭЖХ.

Аннотация геномамаркировка генов и других объектов внутри них. Геномнаследственный материал, заключенный в клетке организма и необходимый для построения и поддержания его жизнедеятельности. Раздел молекулярной генетики, занимающийся геномом и генами организмов, принято называть геномикой. ДНКдезоксирибонуклеиновая кислота, макромолекула, обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы у многих организмов. ДНК-библиотека (геномная библиотека)набор ДНК-фрагментов всего генома организма. Эти ДНК-фрагменты фланкированы идентичными ДНК-адаптерами и содержат различные вставки генома. ДНК-адаптерынебольшие фрагменты ДНК известной последовательности, фланкирующие ДНК-библиотеку. Используются как участки, с которых начинается амплификация или секвенирование ДНК-библиотеки. Метилирование ДНКсвоеобразная модификация молекулы ДНК путем присоединении метильной группы (-Ch4) к цитозину в составе CpG-динуклеотида. Один из способов регуляции работы генома без изменения нуклеотидной последовательности ДНК. Нуклеотиды (нуклеозидфосфаты)низкомолекулярные вещества (мономеры), составляющие сложные биологические полимеры: соответственно РНК или ДНК. Нуклеотиды, составляющие ДНК: аденин (A), тимин (T), гуанин (G) и цитозин (C). В РНК вместо тимина присутствует урацил (U). ПЦР (полимеразная цепная реакция)молекулярно-биологический метод, позволяющий добиться колоссального (до 1012 раз) увеличения или амплификации числа копий определенного фрагмента ДНК in vitro. РНКрибонуклеиновая кислота, макромолекула, образующаяся у многих организмов в результате считывания с ДНК (транскрипции), необходима в процессе синтеза белков, а также многочисленных регуляторных процессов в клетке. Также ответственна за хранение, передачу из поколения в поколение и реализацию генетической программы у некоторых вирусов. Ресеквенированиеповторное определение последовательности ДНК организма с уже расшифрованным геномом (применяется, например, при поиске вариантов, связанных с наследственными заболеваниями у человека). Секвенирование ДНК или РНКопределение первичной последовательности нуклеотидов в составе макромолекул, несущих наследственную информацию. Секвенирование de novoсеквенирование нового для науки (ранее не прочитанного) генома. Чтения (риды, reads)фрагменты ДНК (длиной от 25 до 20 000 нуклеотидов), считываемые с генома при помощи специальной машины — секвенатора. Эмульсионная ПЦР (эПЦР)ПЦР, проводимая в эмульсии, где в каждой капельке масла амплифицируется единичная молекула ДНК (фрагмент ДНК). Эпигеномикаодин из разделов геномики, посвященный изучению изменения экспрессии генов, вызванного механизмами, не затрагивающими последовательности ДНК, например, через метилирование ДНК.

Почти четверть века назад в Соединенных Штатах стартовал грандиозный по своему масштабу научный проект, посвященный определению последовательности генома человека [1]. Основной его целью стала расшифровка генетической информации, заключенной в хромосомах (компактизованная ДНК), которые мы наследуем от своих родителей. В течение тринадцати лет многочисленные исследовательские группы по всему миру работали над определением полной последовательности генома человека. Почти три миллиарда долларов, потраченные на этот проект, открыли перед исследователями замечательные перспективы. Используя полученные данные, появилась возможность искать и находить участки ДНК, связанные с генетически обусловленными заболеваниями. И если природа многих моногенных болезней (вызываемых отказом единственного гена нашего генома) стала понятна уже давно, то некоторые заболевания — сердечно-сосудистые, онкологические, болезни Альцгеймера [2] и Паркинсона — являются многофакторными: вызвать их может широкий спектр изменений генома, многие из которых до сих пор неизвестны. Информация о генетических вариантах, связанных с человеческими недугами, позволяет формировать научно-обоснованный подход при их диагностике и лечении.

Расшифровка и аннотация (маркировка генов и других объектов в последовательности ДНК) генома человека поставили вопрос об использовании генетической информации как для диагностики заболеваний и их долговременного прогнозирования у человека, так и для исследования популяционной структуры сообществ, этногенеза и эволюционных процессов. Применение современных технологий секвенирования и генотипирования предлагает перспективные способы решения задач современной медицинской геномики и эпигеномики.

Такие результаты могут быть использованы при создании систем для проведения дифференциальной диагностики и выявления генетической природы заболеваний, для проведения персональной терапии и подбора методик лечения на основе анализа индивидуальных генетических характеристик. Решение таких задач тесно связано с разработкой эффективных алгоритмов и математических моделей для биоинформатической обработки данных геномного секвенирования и их использованием на базе суперкомпьютерных кластеров.

Геномные исследования позволяют решать массу задач как прикладного, так и фундаментального плана. Благодаря им разрабатываются новые лекарства и продукты, они же позволяют проникнуть в глубокую историю человечества [3] или понять причину массового вымирания видов.

Сейчас разработано несколько способов секвенирования НК. Самый популярный и надежный из них — секвенирование по Сэнгеру — позволяет «считывать» последовательности до 1000 пар оснований (п.о.) и используется для небольших фрагментов генома/генов или для валидации результатов более современного секвенирования нового поколения (next-generation sequencing, NGS), где размер одного прочитанного фрагмента варьирует от 25 до 500 п.о. В отличие от секвенирования по Сэнгеру, методы NGS используют для глубокого (многократного) прочтения генетического материала, которое необходимо, например, для ресеквенирования и сборки новых геномов (de novo), транскриптомных и эпигеномных исследований [4]. Помимо этого, NGS-секвенирование значительно производительнее, позволяя одновременно считывать миллионы и даже миллиарды коротких фрагментов. Такой рост производительности привел к возможности определения последовательности сразу десятков геномов (в зависимости от их размера) за один запуск прибора (рис. 3).

Рисунок 3. Современные технологии делают процесс секвенирования ДНК рутинной процедурой.

Стремительно развивающиеся новые технологии секвенирования ДНК позволяют быстро и эффективно определять особенности организмов на уровне их геномов. Главным итогом развития геномных и постгеномных технологий стало существенное расширение возможностей изучения генетической природы целого спектра заболеваний человека. Масштабные ассоциативные исследования на больших клинических выборках позволяют получать данные о генетических характеристиках, присущих конкретным группам людей (семьям, популяциям), развивая методы персонализированной медицины. В связи с этим, изучение механизмов генетической предрасположенности к многофакторным заболеваниям и выявление специфических генетических маркеров сегодня имеет особенную актуальность. Подобные методы широко применяются за рубежом и в России, где технологии современного секвенирования также постепенно внедряют в медицинские исследования и медицинскую практику с целью персонификации стратегии лечения [1].

Технологической основой для подобных исследовательских и сугубо прикладных проектов служат геномные секвенаторы (приборы, на которых проводят секвенирование), поставляемые различными коммерческими компаниями, такими как Illumina, Thermo Fisher Scientific, Oxford Nanopore Technologies, Pacific Biosciences и другие.

В 2017 году на рынке представлены сразу несколько перспективных разработок в области секвенирования НК. Эти подходы применены в секвенаторах нового поколения:

  • Ion Proton и Ion Personal Genome Machine (Thermo Fisher Scientific) — технология ионного полупроводникового секвенирования;
  • MiSeq и NovaSeq (Illumina) — технология секвенирования на молекулярных кластерах с использованием флуоресцентно меченых нуклеотидов;
  • MinION, GridION X5, PromethION и SmidgION (Oxford Nanopore Technologies) — нанопоровое секвенирование;

и некоторых других.

Современные технологии делают процесс секвенирования ДНК рутинной процедурой, особенно в том случае, когда речь идет об организмах с уже известной последовательностью генома — их последующая биоинформатическая обработка не представляет значительного труда, поскольку исследователь уже имеет референсный (ранее отсеквенированный) геном, который позволяет избежать ошибок при анализе полученных данных. При анализе нового, неопубликованного ранее, генома (de novo секвенирование и сборка) перед исследователем стоит ряд более сложных задач, в ходе решения которых он пытается сложить единичные фрагменты в цельную последовательность, задействуя многочисленные математические алгоритмы и суперкомпьютерные мощности [5], [6].

Однако наибольший интерес представляет не сама последовательность генома, а понимание того, как он функционирует: какие гены обеспечивают жизнедеятельность клетки, как происходит регуляция (включение или выключение генов) или какие генные пути начинают работать в ответ на стрессовые факторы.

Все современные секвенирующие платформы отличаются от метода секвенирования по Сэнгеру тем, что не требуют этапа клонирования фрагментов ДНК. Это экономит рабочее время и позволяет избежать ряда проблем с клонированием АТ-богатых участков. Общий принцип пробоподготовки для большинства современных (NGS) секвенаторов включает фрагментирование ДНК, привязку к субстрату, амплификацию фрагментов с помощью ПЦР (в одномолекулярном секвенировании от ПЦР удалось отказаться) и последующее считывании последовательности НК. В отличие от метода секвенирования по Сэнгеру, современные платформы обеспечивают параллельное проведение миллиардов реакций в малых объемах, что позволяет получить намного больший объем информации на выходе.

Рассмотрим основные технологии секвенирования нуклеиновых кислот подробнее.

Секвенирование по Сэнгеру

«Плюс-минус» метод секвенирования ДНК

Один из наиболее популярных методов секвенирования обязан своим появлением английскому биофизику Фредерику Сэнгеру (1918–2013) — единственному ученому в истории мировой науки, получившему сразу две Нобелевские премии по химии (в 1958 и 1980 годах). Первую премию присудили за установление структур белков, особенно инсулина, а вторую награду ему вручили в том числе и за разработку методов определения первичной последовательности нуклеиновых кислот.

Методику секвенирования ДНК с использованием радиоактивно меченых нуклеотидов и ДНК-полимеразы (или фрагмента Кленова ДНК-полимеразы I) предложили Сэнгер и его коллеги в 1977 году, причем с течением времени этот метод прошел несколько модификаций и к настоящему моменту считается золотым стандартом современного секвенирования.

Первоначально Ф. Сэнгер и Алан Коулсон разработали так называемый «плюс-минус» метод секвенирования ДНК [7], который можно подразделить на две основные стадии:

  1. Полимеразная цепная реакция [8], в которой используется ДНК (например, ДНК человека), фермент (ДНК-полимераза), олигонуклеотидные праймеры и смесь четырех дезоксинуклеотидов (dNTPs) (А, Т, G и C), причем один из дезоксинуклеотидов радиоактивно помечен по α-положению фосфата (32P).
  2. Очистка смеси амплифицированных фрагментов от дезоксинуклеозидтрифосфатов, не вступивших в реакцию (например, на колонках). Смесь делят на восемь равных частей (в разных пробирках). В «плюс»-системе проводят четыре ПЦР-реакции в присутствии каждого из четырех типов дезоксинуклеозидтрифосфатов; параллельно в «минус»-системе проводят четыре ПЦР-реакции в отсутствии каждого из них. Далее результаты визуализируют с помощью электрофореза, и определяют последовательность ДНК, исходя из того, что в «плюс»-системе терминация (прерывание) ПЦР происходит после конкретного dNTP, а в «минус»-системе — перед ним (рис. 4).

Рисунок 4. «Плюс-минус» метод секвенирования ДНК, предложенный Ф. Сэнгером и А. Коулсоном.

Секвенирование ДНК по Сэнгеру: метод «терминаторов»

Спустя пару лет Сэнгер с коллегами предложил еще один способ секвенирования, получивший название метода «терминаторов» или метода «обрыва цепи» [9]. Суть этого метода заключается в том, что в реакционную смесь добавляют аналоги привычных нуклеотидов (дидезоксинуклеозидтрифосфаты), включение которых в синтезируемую цепь приводит к невозможности ее дальнейшего синтеза (терминации), а по образовавшемуся «обломку» можно установить последнюю букву секвенируемого фрагмента ДНК (рис. 5).

Рисунок 5. Метод «терминаторов»: используют ДНК-полимеразу, олигонуклеотидные праймеры и смесь четырех дезоксинуклеотидов (dNTPs) (А, Т, G и C), один из которых радиоактивно помечен по α-положению фосфата (32P). В каждую из четырех реакций добавляется по одному 2’,3’-дидезоксинуклеозидтрифосфату (ddATP, ddTTP, ddCTP или ddGTP), которые терминируют дальнейшую реакцию (синтез комплементарной молекулы ДНК с матрицы) — таким образом в каждой пробирке образуется набор фрагментов ДНК разной длины, которые заканчиваются одним и тем же нуклеотидом. Затем полученные фрагменты визуализируют с помощью электрофореза и, сравнивая длины фрагментов из четырех реакций с ddATP, ddTTP, ddCTP или ddGTP, восстанавливают последовательность ДНК.

Автоматизированные модификации метода «терминаторов» активно применяют до сих пор в специальных приборах — секвенаторах. Открытие многочисленных флуоресцентных молекул позволило отказаться от использования радиоактивной метки и сделало возможным проведение реакции в одной пробирке. Реакционную смесь разделяют капиллярным электрофорезом, a выстроившиеся в синтезируемую цепочку ДНК меченые нуклеотиды затем регистрируют детекторами флуоресценции, предоставляя возможность считывать последовательность всего секвенируемого ДНК-фрагмента.

Капиллярные секвенаторы ДНК Applied Biosystems (Thermo Fisher Scientific) — золотой стандарт секвенирования по Сэнгеру. Производительность — 4, 8, 24, 48 и 96 образцов. Они предназначены для секвенирования относительно небольших фрагментов ДНК длиной до 1000 нуклеотидов, характеризуются высокой точностью и используются для генотипирования человека, животных и других организмов (в том числе в медицине — трансплантологии, перинатологии, онкологии, фармакогенетике и др.), для выявления точечных мутаций, делеций и инсерций, для валидации мутаций, выявленных NGS-секвенированием, для анализа метилирования ДНК, для идентификации личности в криминалистике и др.

Новейшая разработка в этой области — капиллярный секвенатор SeqStudio (Applied Biosystems):

  • 4 капилляра;
  • удобный картридж с капиллярами, встроенной помпой, полимером и контейнером с анодным буфером;
  • запуск прибора за считанные минуты;
  • самая привлекательная цена среди капиллярников.

Первые впечатления пользователей нового капиллярного секвенатора SeqStudio

Материал предоставлен партнёром — компанией «Диаэм»

Другие методы секвенирования «старого поколения»

Кроме методов, предложенных Сэнгером, в конце прошлого века развивались и другие подходы к определению последовательности НК, которые — в частности, метод химической деградации, разработанный Максамом и Гилбертом [10], — не получили дальнейшего распространения из-за быстрого развития энзимологии (раздел биохимии, изучающий ферменты), которая предоставила преимущество методу «терминаторов» Сэнгера.

Использование секвенирования по Сэнгеру

Секвенирование по Сэнгеру позволяет «считывать» последовательности до 1000 пар нуклеотидов и применяется для небольших фрагментов генома/генов. В частности, оно используется для:

  • секвенирования отдельных участков генома с целью анализа мутаций и полиморфизмов;
  • идентификации вирусов и организмов (бактерий, растений, грибов и животных);
  • валидации данных, полученных на платформах секвенирования нового поколения (NGS);
  • микросателлитного анализа;
  • анализа делеций и инсерций (малых и протяженных).

Наиболее популярными секвенаторами, использующими технологию секвенирования по Сэнгеру, являются приборы, производимые компанией Thermo Fisher Scientific: 3730xL, 3730, 3500xL, 3500, 3130xL, 3130, 310.

Следует отметить, что все описанные выше типы исследований сейчас можно проводить с помощью секвенирования «нового поколения», речь о котором пойдет в следующей главе, однако главные плюсы секвенирования по Сэнгеру — высокая точность (достоверность) полученных данных и невысокая стоимость работ при анализе небольшого количества ДНК-фрагментов — сохраняют актуальность этого типа определения последовательности НК.

Секвенирование «нового поколения» — next-generation sequencing (NGS)

За последние полтора десятилетия были разработаны, коммерциализированы и продолжают успешно развиваться совершенно новые технологии определения последовательности НК, в основе которых лежит стремление к миниатюризации, автоматизации, увеличению объема получаемых данных, а также удешевлению процесса. Появление NGS впервые позволило значительно ускорить и удешевить определение полной последовательности миллионов геномов организмов, начиная от бактерий и заканчивая человеком. Более того, появилась реальная возможность единовременно оценивать экспрессию (работу) тысяч генов в организмах, тканях и единичных клетках (секвенирование транскриптомов), а также анализировать регуляцию их активности (анализ экспрессии микроРНК и метилирования генома). В настоящее время на рынке представлено сразу несколько разработок, позволяющих определять последовательность полных геномов организмов, проводить анализ экспрессии генов и метилирования генома. Эти подходы реализуются на секвенаторах нового поколения производства коммерческих компаний Illumina, Thermo Fisher Scientific, Pacific Biosciences и Oxford Nanopore Technologies. Часть разработанных платформ уже ушли с рынка (например, GS FLX, 454/Roche или HeliScope/Helicos Bioscience); другие, пройдя несколько реинкарнаций и модификаций, прочно закрепились на нем (Illumina и Thermo Fisher Scientific); третьи только нащупывают почву, намереваясь занять свою нишу и найти своего потребителя (например, Oxford Nanopore Technologies).

Появление высокопроизводительных технологий секвенирования сопровождается прогрессом программного обеспечения — создаются алгоритмы с открытым программным кодом, появляются открытые источники данных и платформы для вычислений. Новые математические и информационные технологии позволяют геномике развиваться быстрее и использовать более сложные алгоритмы. Эти алгоритмы могут включать в себя сразу несколько приложений и программ и позволяют работать с очень большим объемом данных.

Секвенирование «нового поколения» применяется как для анализа геномов организмов, для которых уже доступен референсный геном (ресеквенирование), так и для того, чтобы впервые расшифровать геном организма (секвенирование de novo).

Для ресеквенирования успешно используют платформы, генерирующие большое количество коротких чтений (секвенируемых фрагментов ДНК), поскольку даже относительно короткие фрагменты ДНК успешно картируются (картирование, или выравнивание, — процесс биоинформатического поиска расположения конкретного короткого фрагмента в полной геномной последовательности) на референсный геном (последовательность ДНК в цифровом виде, составленную учеными как общий репрезентативный пример последовательности генома конкретного вида) при биоинформатическом анализе данных. Такие выравненные чтения могут использоваться для поиска однонуклеотидных полиморфизмов (SNPs), малых делеций и инсерций или других структурных изменений в геноме.

Что касается секвенирования de novo и сборки новых, ранее не прочитанных, геномов, то использование коротких чтений сильно усложняет сборку, особенно в случае больших по размеру и сложно устроенных геномов эукариот (например, полиплоидных геномов). В этих случаях используют комбинированный подход — сочетание платформ, генерирующих как короткие, так и длинные чтения. При сборке генома de novo ученые уподобляются ребенку, пытаясь правильно сложить элементы геномного пазла (короткие фрагменты отсеквенированной ДНК) в единую картину, созданную эволюцией за сотни миллионов лет (рис. 6).

Рисунок 6. Cеквенирование de novo и сборка новых, ранее непрочитанных, геномов требует значительных усилий.

В то же время наибольший интерес представляет отнюдь не сама последовательность генома, а понимание того, как он функционирует. Новые методы секвенирования НК позволяют оценивать уровень метилирования ДНК, проводить анализ дифференциальной экспрессии генов, в том числе и генов-регуляторов (например, микроРНК). Возможность анализа экспрессии генов в биологических системах открывает перед исследователем огромные возможности. Например, этот метод можно применять при исследовании функционирования центральной нервной системы человека (для понимания основных молекулярных аспектов работы головного мозга [11], [12]), при оценке защитного ответа клеток на атаки вирусов [13] или ответной реакции на стресс [14]. Не менее интересные данные может дать изучение регуляции экспрессии генов посредством анализа их метилирования [15] или изучение экспрессии некодирующих РНК [16], [17].

Оценка уровня метилирования генома, например, позволяет определить, какие генные пути и сети включаются в ответ на меняющиеся факторы окружающей среды; такие работы зачастую проводят для изучения эволюционных механизмов в живых системах. Изучение экспрессии кодирующих белки и некодирующих РНК в разных тканях и клетках также позволяет понять и описать гены, вовлеченные в жизнедеятельность клеток, органов и организмов.

Пиросеквенирование

Одним из первых методов глубокого секвенирования, предложенным на суд научного сообщества, было пиросеквенирование, подразумевающее «секвенирование путем синтеза». Основной смысл этого типа секвенирования заключается в последовательном синтезе ДНК на ДНК-фрагментах изучаемого организма в специальных пиколитровых «реакторах». В ходе синтеза дочерней цепочки ДНК детектируют пирофосфаты, высвобождающиеся при включении нуклеотида в синтезируемую на матрице (участке молекулы ДНК, служащим матрицей для синтеза) комплементарную цепь .

Технологию предложил в 1996 году Пол Нирен с коллегами из Королевского технологического института в Стокгольме [19]. Затем ее коммерциализировали (2005 год) и воплотили в приборе GS FLX, 454 производства Roche (2008 год). Этим методом можно определять нуклеотидную последовательность фрагментов геномной ДНК размером 300–500 пар оснований (п.о.). Особо следует отметить тот факт, что подавляющее большинство NGS-методов требуют предварительной фрагментации ДНК для упрощения ферментативных реакций. К обоим концам фрагментированной ДНК «пришивают» ДНК-адаптеры (данная конструкция называется ДНК-библиотекой), необходимые для эмульсионной ПЦР (эПЦР) на магнитных сферах и последующего секвенирования.

Готовые ДНК-библиотеки иммобилизуют на магнитных сферах. Затем магнитные сферы с нанесенной на них клональной библиотекой доставляют на проточную ячейку, где в присутствии праймера, дезоксинуклеотидтрифосфатов и ферментов — ДНК-полимеразы, люциферазы, АТФ-сульфурилазы — происходит циклический синтез новой цепи.

Во время цикла пиросеквенирования при образовании фосфодиэфирной связи между матричной цепочкой ДНК и нуклеотидом синтезируемой цепи выделяется пирофосфат, который запускает каскад химических реакций, приводящих к выделению АТФ, необходимой для реакции окисления люциферина с выделением кванта света, который фиксируют аналоговой интегральной микросхемой (ПЗС-матрицей), состоящей из светочувствительных фотодиодов. Нуклеотиды, не вовлеченные в синтез новой цепи, удаляют из проточной ячейки, и начинается следующий реакционный цикл, в ходе которого добавляют дезоксинуклеотидтрифосфат другого типа (рис. 7).

Рисунок 7. Принцип пиросеквенирования. При включении нуклеотида в синтезируемую цепочку ДНК происходит регистрация высвобождающихся пирофосфатов — побочного продукта реакции полимеризации нуклеотидов в ДНК.

Принцип пиросеквенирования используется в секвенаторе PyroMark Q24, производимом компанией Qiagen. Этот прибор предназначен для одновременного прочтения 24 коротких последовательностей (до 100 нуклеотидов) и широко применяется в научных исследованиях и диагностике для точечного генотипирования и анализа метилирования. Основное достоинство секвенатора PyroMark — высокая точность и возможность анализа практически любого точечного полиморфизма.

Материал предоставлен партнёром — компанией «Диаэм»

Технология секвенирования на молекулярных кластерах с использованием флуоресцентно меченых нуклеотидов

Технология секвенирования на молекулярных кластерах, так же как и пиросеквенирование, подразумевает синтез новой молекулы ДНК по матрице. Этот метод начали разрабатывать еще в середине 90-х годов прошлого века химики Шанкар Баласубраманиан и Дэвид Кленерман из Кембриджа, изучавшие работу ДНК-полимеразы на молекулярном уровне, используя флуоресцентно меченые нуклеотиды и ДНК-матрицу, иммобилизованную на поверхности [20]. Творческие семинары в лаборатории и дружеские посиделки в баре привели к коммерциализации этой технологии в 2006 году под брендом Solexa, который спустя год был приобретен компанией Illumina. Сейчас платформа продолжает развиваться, и потребителям предлагают новые линейки приборов.

Суть метода заключается в следующем. К обоим концам предварительно фрагментированной ДНК лигируют адаптеры, необходимые для ПЦР и последующего секвенирования на молекулярных кластерах. Полученные ДНК-библиотеки иммобилизуют на поверхности проточной ячейки, где и проводят циклический процесс секвенирования. Реакционная смесь для синтеза комплементарной ДНК подается на поверхность проточной ячейки и содержит ферменты, олигонуклеотиды, а также четыре типа флуоресцентно меченых дезоксинуклеозидтрифосфатов. После включения в синтезируемую цепь ДНК нуклеотида-терминатора идентифицируют с помощью ПЗС-матрицы как тип включенного нуклеотида, так и его положение. Затем терминирующая группа и флуоресцентная краска отщепляются от нуклеотида, и цикл синтеза повторяется. Эта серия шагов продолжается определенное количество раз, число которых задает пользователь (рис. 8).

Рисунок 8. Принцип секвенирования на молекулярных кластерах: полимеризация (синтез «дочерней» цепочки) ДНК с использованием флуоресцентно меченых нуклеотидов внутри специальной камеры, регистрирующей флуоресценцию.

Размер чтений, получаемых с секвенатора, может достигать 300 п.о. (прибор Illumina MiSeq). Кроме того, серия секвенаторов 2017 года NovaSeq позволяет определять последовательность до 48 геномов человека за один запуск прибора.

Технология циклического лигазного секвенирования

Технология циклического лигазного секвенирования была разработана группой Джорджа Макдональда Черча [21] и, в отличие от представленных выше, использует метод лигирования (формирование химических связей между нуклеотидами при помощи специального фермента — лигазы). Данный подход к секвенированию НК коммерциализировали в 2006 году, и приборы, известные под брендом SOLiD, уже длительное время представлены на рынке (первоначально развитием этой системы секвенирования занималась компания Applied Biosystems, а затем Life Technologies и Thermo Fisher Scientific).

Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК размером 25–75 п.о. К обоим концам предварительно фрагментированной ДНК лигируют адаптеры, необходимые для эПЦР на магнитных сферах и последующего секвенирования на проточной ячейке.

Магнитные сферы с нанесенной на них клональной библиотекой помещают на проточную ячейку, где и происходит секвенирование с помощью лигирования восьминуклеотидных зондов, несущих четыре различных флуорофора на 5’-конце. Флуоресценция считывается с помощью специальной камеры после каждого цикла секвенирования и, затем переводится в последовательность нуклеотидов (рис. 9).

Рисунок 9. Принцип лигазного секвенирования и последовательность зондов, которые используют при секвенировании. Зонды для секвенирования можно разделить на несколько участков (начиная с 3’-конца): первые два нуклеотида зонда лигируются к комплементарным участкам на секвенируемой ДНК-библиотеке, нуклеотиды с третьего по пятый — вырожденные (т.е. могут гибридизоваться с любыми тремя нуклеотидами секвенируемой ДНК-библиотеки). Нуклеотиды с шестого по восьмой также способны гибридизоваться с любыми тремя нуклеотидами секвенируемой ДНК-библиотеки, однако они отщепляются вместе с флуоресцентным красителем в конце каждого цикла секвенирования.

Технология лигазного секвенирования применялась в приборах, выпускаемых под брендом SOLiD. Спустя несколько поколений приборов пробоподготовку усовершенствовали, и на рынок вышла новая линейка приборов — 5500, 5500xl, а также 5500w, использующий изотермальную ПЦР (WildFire технология) для клонирования ДНК-библиотек [22].

Ионное полупроводниковое секвенирование

Ионное полупроводниковое секвенирование, основанное на технологии PostLightTM, разработано компанией Ion Torrent и в настоящее время применяется в приборах, реализуемых Thermo Fisher Scientific — Ion S5 / Ion S5 XL, Ion Proton, Ion Personal Genome Machine (PGM).

Технология, предлагаемая в этой приборной линейке, основана на использовании полупроводниковых микрочипов для секвенирования. Суть этого подхода весьма проста и заключается в регистрации локального изменения рН на микрочипе в момент удлинения синтезируемой цепи ДНК-полимеразой на ДНК-матрице (рис. 10).

Рисунок 10. Принцип полупроводникового секвенирования основан на обнаружении ионов водорода, которые выделяются во время полимеризации ДНК.

Высокопроизводительные секвенаторы нового поколения Ion S5/S5 XL (Thermo Fisher Scientific) работают по технологии полупроводникового секвенирования Ion Torrent, которая обеспечивает простейшую процедуру таргетного секвенирования, высокую скорость и экономичность. Использование микрочипов различной производительности позволяет проводить на одном приборе анализ как отдельных генов, бактериальных геномов, так и экзомов и транскриптомов.

Материал предоставлен партнёром — компанией «Диаэм»

Пробоподготовка (приготовление ДНК-библиотек) напоминает таковую при циклическом лигазном секвенировании. Первоначально ДНК фрагментируют, затем к концам полученных фрагментов лигируют специфические ДНК-адаптеры, необходимые для эмульсионной ПЦР на магнитных сферах и последующего секвенирования.

Выделение НК и подготовка библиотек для NGS — это довольно трудоемкий процесс, который включает множество шагов, занимает немало времени и требует максимальной сосредоточенности оператора. На помощь ученым-лаборантам приходят автоматизированные технологии на каждом из этапов пробоподготовки:

  • роботы, которые выделяют НК с помощью наборов на магнитных частицах, позволяют автоматизировать процесс выделения;
  • дозирующие устройства, позволяющие одномоментно раскапать плашку на 96 образцов (например, дозатор PlateMaster), значительно ускоряют работу и снижают вероятность ошибки оператора;
  • система Ion Chef упрощает процедуру полупроводникового секвенирования и автоматизирует ее — начиная от загрузки готовых библиотек и заканчивая подготовкой одного или двух чипов, готовых к секвенированию.

Материал предоставлен партнёром — компанией «Диаэм»

Одномолекулярное секвенирование

SMRT-секвенирование (single molecule real time sequencing), предложенное сотрудниками компании Pacific Biosciences, не только позволило отказаться от проведения полимеразной цепной реакции при пробоподготовке, но и дало возможность наблюдать за работой ДНК-полимеразы, наращивающей синтезируемую цепь, в реальном времени [23].

Создание платформы Pacific Biosciences не только решило проблему ПЦР-дупликатов, но и значительно увеличило длину чтений, что крайне важно при сборке геномов de novo. Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК размером до 20 000 п.о. с лигированными к их концам специфическими ДНК-адаптерами, необходимыми для последующего секвенирования.

Сама реакция секвенирования молекул ДНК проходит в специальных ячейках (SMRT-ячейки) на прозрачной (кремниевой) подложке, с напыленным на нее слоем алюминия. В основе метода лежит использование технологии Zero-mode waveguide (ZMW) [24]. Сквозь дно в ячейку подается свет, однако благодаря особенностям ее строения, пучок фотонов не рассеивается, а освещает только конкретную часть (на подложке), где закреплена молекула phi29 ДНК-полимеразы. Эта полимераза была выбрана в качестве «считывающего» фермента благодаря своей высокой точности, скорости синтезирования дочерней цепи и эффективной работе с нуклеотидами, несущими флуоресцентную метку [25].

Смысл SMRT-секвенирования схож с описанными ранее методами NGS — ДНК-полимераза достраивает вторую цепь исследуемой молекулы ДНК, используя нуклеотиды, меченные различными флуоресцентными метками, которые регистрируют при помощи конфокальной микроскопии. В 2016 году анонсировали покупку платформы Pacific Biosciences биотехнологическим гигантом Roche Diagnostics, однако сделка так и не состоялась [26].

Разработка другого способа одномолекулярного секвенирования (коммерциализированного к настоящему времени) началась в конце прошлого века, когда группа американских ученых наглядно продемонстрировала возможность побуждать молекулы ДНК и РНК проходить сквозь ионный канал диаметром 2,6 нм в двуслойной липидной мембране под воздействием электрического поля. Более того, уже тогда исследователи сумели различать ДНК и РНК, а также оценивать длину входящих в нанопору олигонуклеотидов [27]. Спустя 13 лет впервые продемонстрировали возможность определения последовательности НК нанопоровым секвенированием [28], а затем данную технологию коммерциализировала и представила на рынок компания Oxford Nanopore Technologies (рис. 11).

Рисунок 11. Принцип нанопорового секвенирования, коммерциализованный компанией Oxford Nanopore Technologies. Данный тип секвенирования основан на измерении меняющейся силы тока при прохождении молекулы НК сквозь нанопору в двухслойной мембране.

Суть работы нанопоровых систем (MinION, GridION X5, PromethION и SmidgION), предложенных британской компанией, достаточно проста. Реакционная камера, в которой проходит процесс считывания последовательности НК, разделена двухслойной мембраной с единичной порой. К камере прикладывается напряжение, вызывающее движение ионов и молекул ДНК или РНК через пору. При прохождении молекулы НК сечение поры (доступное для миграции ионов) уменьшается, в результате чего сила тока падает. Таким образом, считывая изменение силы тока, можно определять тип нуклеотида, проходящего через пору в конкретный отрезок времени.

Кроме описанных выше двух технологий компания Helicos Biosсiences пыталась продвинуть на биотехнологический рынок свою технологию одномолекулярного секвенирования — true Single Molecule Sequencing (tSMS). Данный подход во многом схож с технологией секвенирования на молекулярных кластерах (Illumina), однако позволяет обходиться без ПЦР при пробоподготовке.

Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК размером до 50 п.о. К обоим концам предварительно фрагментированной ДНК лигируют адаптеры. Полученные ДНК-библиотеки иммобилизуют на поверхности проточной ячейки, где и проводят циклический процесс секвенирования. Один цикл состоит из удлинения синтезируемой на матрице цепочки за счет одного из четырех флуоресцентно меченых нуклеотидов, присоединение которого детектируется прибором.

Небольшая длина чтения (до 50 п.о., медиана — 30 п.о.) и большое количество ошибок (3–5%) данной платформы привели к оттоку потенциальных покупателей. Технология не получила широкого распространения, несмотря на потенциальную применимость в работе со сложными образцами, например, в палеогеномике [29], где отказ от ПЦР мог бы привести к сокращению процентного соотношение экзогенной (мусорной) ДНК в анализируемых образцах древней ДНК [30]. В итоге, в конце 2012 года компания Helicos Biosciences была признана банкротом и прекратила свое существование [31].

Одномолекулярное секвенирование длинных фрагментов ДНК может найти свое применение в самых разнообразных областях, и, что самое интересное, при работе с единичными клетками позволяет описывать их молекулярный «портрет» [32]. Это особенно важно при анализе транскриптомов клеток, позволяя описывать все возможные изоформы активных генов — благодаря длине чтений, недоступных для технологии Solexa или PostLight [33].

Технологию одномолекулярного секвенирования можно также назвать технологией третьего поколения, поскольку она работает по принципу, совершенно отличному от того, который применяется в секвенаторах второго поколения. Кроме того, характерной особенностью таких секвенаторов является их сверхкомпактность. Например, самый компактный портативный секвенатор MiniION имеет вес всего 100 граммов и работает от USB 3.0 обычного компьютера или ноутбука. Первые приборы MiniION уже применяют и в России (официальный дистрибьютор Oxford Nanopore — компания «Диаэм»).

MiniION — портативный прибор для прямого секвенирования ДНК/РНК онлайн от Oxford Nanopore.

Для высокопроизводительного секвенирования Oxford Nanopore разработал приборы, в которые можно параллельно установить несколько секвенаторов MiniION:

В настоящее время Oxford Nanopore работает над созданием модели секвенатора SmidgION, который будет работать от обычного смартфона и сможет применяться в полевых условиях, где нет лаборатории и даже компьютера.

Материал предоставлен партнёром — компанией «Диаэм»

У нас есть три основных принципа:

  1. Мы сразу устанавливаем адекватные цены и не играем в наценки/скидки. Все цены открыты на сайте.
  2. Мы доставляем товар быстро за счет того, что не консолидируем заказ и не гонимся за максимальным сокращением расходов в ущерб оперативности.
  3. Мы понимаем ту продукцию, которую предлагаем. Действует постоянная техническая и научная поддержка.

Бóльшая часть производителей в нашем портфолио — это прямые эксклюзивные поставщики. Мы являемся первым звеном в поставках для таких компаний как Agilent Technologies, New England Biolabs, Oxford Nanopore, QIAGEN, Macherey-Nagel, NIMAGEN, EdgeBio, Thermo Scientific, SIGMA-ALDRICH, Santa Cruz Biotechnology, ChemGenes, Bruker, Dornier, Bio Molecular Systems, Gilson, Opentrons, Titertek-Berthold.

В 2017 году компания «СкайДжин» стала официальным дистрибьютором нанопоровых секвенаторов Oxford Nanopore Technologies в России, Белоруссии и Казахстане. Наши специалисты окажут техническую поддержку и проведут обучение на месте. С нами технология нанопорового секвенирования стала доступной для вас!

Мы верим: чтобы быть близкими к вам, недостаточно просто выставлять счета и осуществлять доставку. Нам важно глубоко разобраться в теме и быть поддержкой для вас. Для этого мы публикуем новости, обзоры и высоко ценим любые замечания и критику. Каждый продукт мы «пропускаем» через себя. Анализируем плюсы и минусы, представляем, как и где он будет работать, консультируемся с вами. И, как результат, создаем методички, проводим семинары и презентации.

Сегодня мы предлагаем современные решения для проведения секвенирования на различных платформах — от капиллярного секвенирования и NGS до мономолекулярного анализа с технологией Oxford Nanopore. Выбор за вами!

  • Полный спектр реагентов для капиллярных секвенаторов: реактивы для терминирующего секвенирования, очистки реакционной смеси, полимеры и буферные растворы для капиллярного электрофореза.
  • Пробоподготовка NEB для секвенаторов следующего поколения Illumina и Thermo Fisher Scientific: наборы для удаления бактериальной ДНК или наоборот, обогащения микробиома, проведения фрагментации ДНК, выделения полиА-мРНК, наборы для мультиплексирования и создания библиотек ДНК, РНК и микроРНК. Дополнительно доступны отдельные модули для проведения каждого этапа протокола создания библиотек.
  • Решения для обогащения от NEB, Agilent Technologies и QIAGEN: от анализа единичных генов до обогащения полного экзома человека.

Ознакомиться с потенциалом применения новой технологии нанопорового секвенирования MinION можно здесь.

Вы всегда можете обратиться к нам, связавшись с менеджерами или написав по адресу [email protected], а также позвонив по телефону +7 (495) 215-02-22 или бесплатной линии 8 (800) 333-12-26.

Мы стараемся угнаться за вами в научном познании мира, мы стараемся учиться и расти вместе с вами!

Команда «СкайДжин»

Материал предоставлен партнёром — компанией «СкайДжин»

Использование секвенирования нового поколения

Производительность и относительная доступность NGS-методов привели к настоящей революции в биологической и медицинской науке. Более того, благодаря новым подходам появилась реальная возможность проводить ранее технически недоступные исследования. Использование секвенирования нового поколения позволяет проводить такие проекты как:

  1. Полногеномный анализ (в том числе, ресеквенирование и секвенирование de novo). Ресеквенирование полных геномов человека в интересах персонализированной медицины или секвенирование ранее не изученных геномов вирусов, бактерий, архей, растений, грибов и животных как с чисто фундаментальными, так и прикладными целями.
  2. Секвенирование РНК (RNA-Seq), позволяющее оценивать экспрессию генов не только качественно, но и количественно. Существует возможность отдельно оценивать экспрессию кодирующих и регуляторных РНК. Данные методики направлены на изучение работы генома (активности его генов, в том числе генов-регуляторов) в разных клетках, тканях и органах.
  3. Метагеномное секвенирование — оценка разнообразия микроорганизмов в различных образцах. Позволяет оценивать бактериальное разнообразие в различных средах, например, в кишечнике человека, донных отложениях озера Байкал или в горячих источниках Камчатки.
  4. Анализ ДНК-белковых взаимодействий (ChIP-Seq) — изучение влияния транскрипционных факторов и других ДНК-связывающих белков на экспрессию генов, а через нее на фенотипические и физиологические особенности клеток, органов и тканей.
  5. Бисульфитное секвенирование и его модификации (например, RRBS) — оценка метилирования в геноме или его участках. Влияние метилирования регуляторных участков генома на уровень экспрессии генов через подавление их транскрипционной активности.
  6. Таргетное секвенирование (экзомное секвенирование, секвенирование митохондриальных генов, секвенирование ампликонов). Секвенирование отдельных (выбранных исследователем) участков генома, например, только генов митохондриальной ДНК, кодирующих белки генов или генов, для которых уже описано участие в процессах онкогенеза. Таргетное секвенирование позволяет значительно снизить стоимость эксперимента (из расчета на один образец) и многократно увеличить количество анализируемых образцов.

Примером практического применения таргетного секвенирования в медицинских целях может быть HLA-типирование — секвенирование генов главного комплекса гистосовместимости, ответственных за распознавание организмом клеток по типу «свой-чужой». HLA-типирование проводят при трансплантации, при патологиях беременности, при аутоиммунных заболеваниях и др. NGS, в отличие от других методов HLA-типирования (серологический анализ, методы SSP и SSO, секвенирование по Сэнгеру), позволяет получить полную последовательность генов главного комплекса и гистосовместимости и, соответственно, точный генотип.

Набор для HLA-типирования Holotype HLA от компании Omixon позволяет не только секвенировать эти гены, но и правильно интерпретировать результаты секвенирования. Этот продукт включает в себя реагенты для пробоподготовки и программное обеспечение HLA Twin для интерпретации и предназначен для всех современных моделей NGS-секвенаторов.

Материал предоставлен партнёром — компанией «Диаэм»

Большим недостатком метода NGS является высокая стоимость реагентов. Однако на сегодняшний день можно найти на рынке относительно недорогую альтернативу: например, наборы Lexogen для анализа транскриптома. Это хорошее решение для полнотранскриптомного секвенирования, построения экспрессионного профиля, обогащения фракции мРНК и удаления нецелевых фракций РНК. Для интерпретации данных секвенирования хорошим помощником является программное обеспечение RNA-Seq от Lexogen.

Материал предоставлен партнёром — компанией «Диаэм»

Заключение

В наши дни происходит бурное развитие технологий, связанных с исследованием генов, белков и других молекулярных структур живых организмов. Разрабатываются портативные, быстрые, точные и универсальные методы исследований биологических объектов. Появление высокопроизводительных технологий секвенирования НК сопровождается развитием в области программного обеспечения, создаются алгоритмы с открытым программным кодом. Новые математические и информационные технологии позволяют геномике развиваться быстрее и использовать более сложные алгоритмы (например, нейронные сети).

На сегодняшний день объемы получаемой секвенаторами информации значительно обогнали возможности математического анализа получаемых результатов. Но даже несмотря на это, биомедицинская наука вовлечена в круговорот геномной революции, когда новые данные появляются ежедневно, а биотехнологические компании предлагают все новые и новые решения, значительно облегчающие диагностику заболеваний, приближая мир к новому направлению — персонализированной медицине [34].

Календарь

На основе статей спецпроекта мы решили сделать календарь «12 методов биологии» на 2019 год. Эта статья представляет апрель.

  1. Геном человека: как это было и как это будет;
  2. На руинах памяти: настоящее и будущее болезни Альцгеймера;
  3. Генофонд австралийских аборигенов хранит ключ к тайне выхода человека из Африки;
  4. Erwin L. van Dijk, Hélène Auger, Yan Jaszczyszyn, Claude Thermes. (2014). Ten years of next-generation sequencing technology. Trends in Genetics. 30, 418-426;
  5. Код жизни: прочесть не значит понять;
  6. Наука витает в облаках;
  7. F. Sanger, A.R. Coulson. (1975). A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. Journal of Molecular Biology. 94, 441-448;
  8. Важнейшие методы молекулярной биологии и генной инженерии;
  9. Sanger F., Niclein S., Coulson A.R. (1977). DNA sequencing with chain-terminating inhibitors. Proc. Natl. Acad. Sci. USA. 74, 5463–5467;
  10. Maxam A.M. and Gilbert W. (1977). A new method of sequencing DNA. Proc. Natl. Acad. Sci. USA. 74, 560–564;
  11. Zhisong He, Dingding Han, Olga Efimova, Patricia Guijarro, Qianhui Yu, et. al.. (2017). Comprehensive transcriptome analysis of neocortical layers in humans, chimpanzees and macaques. Nat Neurosci. 20, 886-895;
  12. Dolina I.A., Efimova O.I., Kildyushov E.M., Sokolov A.S., Khaitovich P.E., Nedoluzhko A.V. et al. (2017). Exploring terra incognita of cognitive science: Lateralization of gene expression at the anterior pole of the human brain. Psychology in Russia: State of the Art. 10, in press;
  13. Hu B., Li X., Huo Y., Yu Y., Zhang Q., Chen G. et al. (2016). Cellular responses to HSV-1 infection are linked to specific types of alterations in the host transcriptome. Sci. Rep. 6, 28075;
  14. Wang M., Sun X., Yu D., Xu J., Chung K., Li H. (2016). Genomic and transcriptomic analyses of the tangerine pathotype of Alternaria alternata in response to oxidative stress. Sci. Rep. 6, 32437;
  15. Artemov A.V., Mugue N.S., Rastorguev S.M., Zhenilo S., Mazur A.M., Tsygankova S.V. et al. (2017). Genome-wide DNA methylation profiling reveals epigenetic adaptation of stickleback to marine and freshwater conditions. Molecular Biology and Evolution;
  16. S. M. Rastorguev, A. V. Nedoluzhko, F. S. Sharko, E. S. Boulygina, A. S. Sokolov, et. al.. (2016). Identification of novel microRNA genes in freshwater and marine ecotypes of the three-spined stickleback (Gasterosteus aculeatus). Mol Ecol Resour. 16, 1491-1498;
  17. O. A. Shulga, A. V. Nedoluzhko, A. V. Shchennikova, N. M. Gruzdeva, A. A. Shelenkov, et. al.. (2017). Profiling of microRNAs in wild type and early flowering transgenic Chrysanthemum morifolium by deep sequencing. Plant Cell Tiss Organ Cult. 128, 283-301;
  18. 454-секвенирование (высокопроизводительное пиросеквенирование ДНК);
  19. Mostafa Ronaghi, Samer Karamohamed, Bertil Pettersson, Mathias Uhlén, Pål Nyrén. (1996). Real-Time DNA Sequencing Using Detection of Pyrophosphate Release. Analytical Biochemistry. 242, 84-89;
  20. Mark A. Osborne, W. Scott Furey, David Klenerman, Shankar Balasubramanian. (2000). Single-Molecule Analysis of DNA Immobilized on Microspheres. Anal. Chem.. 72, 3678-3681;
  21. J. Shendure. (2005). Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome. Science. 309, 1728-1732;
  22. Z. Ma, R. W. Lee, B. Li, P. Kenney, Y. Wang, et. al.. (2013). Isothermal amplification method for next-generation sequencing. Proceedings of the National Academy of Sciences. 110, 14320-14323;
  23. J. Eid, A. Fehr, J. Gray, K. Luong, J. Lyle, et. al.. (2009). Real-Time DNA Sequencing from Single Polymerase Molecules. Science. 323, 133-138;
  24. Levene M.J., Korlach J., Turner S.W., Foquet M., Craighead H.G., Webb W.W. (2003). Zero-mode waveguides for single-molecule analysis at high concentrations. Science. 299, 682–686;
  25. Jonas Korlach, Arek Bibillo, Jeffrey Wegener, Paul Peluso, Thang T. Pham, et. al.. (2008). Long, Processive Enzymatic DNA Synthesis Using 100% Dye-Labeled Terminal Phosphate-Linked Nucleotides. Nucleosides, Nucleotides and Nucleic Acids. 27, 1072-1082;
  26. PacBio announces termination of agreement with Roche Diagnostics. (2016). Pacific Biosciences of California;
  27. Kasianowicz J.J., Brandin E., Branton D., Deamer D.W. (1996). Characterization of individual polynucleotide molecules using a membrane channel. Proc. Natl. Acad. Sci. USA. 93, 13770–13773;
  28. D. Stoddart, A. J. Heron, E. Mikhailova, G. Maglia, H. Bayley. (2009). Single-nucleotide discrimination in immobilized DNA oligonucleotides with a biological nanopore. Proceedings of the National Academy of Sciences. 106, 7702-7707;
  29. Древняя ДНК: Привет из прошлого;
  30. L. Orlando, A. Ginolhac, M. Raghavan, J. Vilstrup, M. Rasmussen, et. al.. (2011). True single-molecule DNA sequencing of a pleistocene horse bone. Genome Research. 21, 1705-1719;
  31. Helicos BioSciences files for Chapter 11 bankruptcy protection. (2012). GenomeWeb;
  32. Секвенирование единичных клеток (версия — Metazoa);
  33. Donald Sharon, Hagen Tilgner, Fabian Grubert, Michael Snyder. (2013). A single-molecule long-read survey of the human transcriptome. Nat Biotechnol. 31, 1009-1014;
  34. От медицины для всех — к медицине для каждого!.

Как секвенируют ДНК

Секвенирование ДНК в последние десятилетия превратилось из узкой области, которой занималось небольшое число ученых, в одну из самых стремительно развивающихся технологий. Рост производительности и падение стоимости даже опережают закон Мура, и, из-за большой конкуренции на рынке и огромного спроса, развитие и дальше будет идти высокими темпами. Кроме того, развитие секвенирования привело к такому же буму в биоинформатике и коренным образом изменило биологию, и, постепенно, также основательно меняет медицину.

По катом я подробнее рассказываю, как это делают. Что такое ДНК Для начала, чтобы понимать сам процесс, немного необходимой теории. ДНК — это полимерная цепь, состоящая из мономеров четырех типов, называемых нуклеотидами, последовательность которых и кодирует информацию об организме. Иначе говоря, ДНК можно представить как текст, написанный четырехбуквенным алфавитом. ДНК — молекула, состоящая из двух цепочек, и, хотя, последовательность нуклеотидов у них разная, последовательность одной цепочки можно однозначно восстановить, если известна последовательность другой. Поэтому цепочки называют комплементарными. (англ. Complement – дополнение) Это свойство используется при копировании клетки, когда цепочки ДНК расплетаются, и, на каждой, как на матрице, синтезируется вторая, и каждая из двух дочерних клеток получает свою двуцепочечную ДНК. Вся последовательность ДНК организма называется геномом. Например, геном человека состоит из 46 хромосом. Несмотря на большое количество разнообразных, как экспериментальных, так и устаревших методов, мейнстримовые коммерческие методы довольно похожи, и, чтобы не делать оговорки каждый раз, сразу скажу, что речь дальше будет идти именно об этих мейнстримовых методах.

Как это выглядит в общем

Перед описанием технологии секвенирования, для интуитивного понимания, проведу следующую аналогию: стопку одинаковых газет взрывают так, что они разлетаются на небольшие кусочки с отрывками текста, а, затем, каждый из этих кусочков читают и, из этих прочтений восстанавливают текст первоначальной газеты. Чтобы секвенировать ДНК, сначала ее выделяют из исследуемого образца, затем режут на небольшие фрагменты случайным образом, фрагменты называются ридами. От каждого рида оставляют по одной цепочке, и на этой цепочке, как на матрице, синтезируют вторую, причем, тип каждого следующего присоединяющегося нуклеотида как-то детектируют. Таким образом, записывая последовательность присоединившихся нуклеотидов, восстанавливают их последовательность в каждом риде. Затем, из последовательностей ридов с помощью компьютерных программ реконструируют геном. Важный момент. Суммарная длина ридов должна многократно превышать длину исследуемой ДНК. Делается это потому, что, когда ДНК выделяют из образца, и когда ее режут, часть ее теряется, так что никто не гарантирует, что каждый ее участок попадет хотя бы в один рид. Поэтому, чтобы каждый участок гарантированно был бы прочтен, ДНК берут с большим запасом. Кроме того, при секвенировании возможны ошибки, и, чтобы более надежно прочитать ДНК, каждый ее участок следует прочитать несколько раз.

ДНК разрезают на риды, которые читают, и из них восстанавливают первоначальную последовательность Такая методика используется не от хорошей жизни. Она добавляет множество трудностей, и, если бы исследователи могли взять и прочитать за раз целую последовательность генома, то они были бы счастливы, однако, это на данный момент невозможно. У этого есть 2 причины. Первая — это ошибки, происходящие при чтении каждого нуклеотида. Они постепенно накапливаются, и, каждый следующий нуклеотид читается хуже предыдущего, и, в какой-то момент качество чтения настолько снижается, что дальше продолжать процесс бессмысленно. У разных методов секвенирования длина рида, которы они могут хорошо прочитать, составляет порядка десятков или сотен нуклеотидов. Вторая заключается в том, что ДНК — это очень длинная молекула, и, при скрупулезном чтении каждой буквы друг за дружкой, секвенирование заняло бы неприлично много времени, а в данном случае этот процесс легко распараллеливается, и можно одновременно читать миллионы и миллиарды ридов.

Illumina

Такая схема в общих чертах описывает все популярные методики секвенирования. Различаются они лишь методами детекции присоединившихся нуклеотидов при синтезе, и методикой подготовки материала. На сегодняшний день самым распространенным является метод, который используется в секвенаторах компании Illumina. В этом методе сначала множество различных ридов прикрепляется к стеклянной пластине. Затем, с каждого рида делают множество копий на поверхности пластины так, чтобы на каждом ее небольшом участке располагались лишь одинаковые копии. Это делается для того, чтобы при последующем секвенировании получать сигнал не от одиночной молекулы, а от группы одинаковых молекул, располагающихся рядом. Так и сигнал легче считывать, и надежность считывания увеличивается. Эти молекулы являются одноцепочечными ДНК, и на них в процессе секвенирования синтезируются комплементарные цепи. Реакцию синтеза проводят следующим образом: К началу каждой молекулы присоединяется по одному нуклеотиду. Этот нуклеотид химически блокирован так, что после его присоединения синтез дальше не идет. Кроме того, к нему присоединена метка, которая под действием лазера люминесцирует. Причем, для каждого типа нуклеотидов цвет люминесценции разный. После присоединения нуклеотида пластину освещают лазером и фотокамера фиксирует цвета, которыми люминесцирует пластина. После этого блокировку снимают, метку также снимают, и присоединяют таким же образом следующий нуклеотид. Последовательность световых сигналов на каждом участке пластины в компьютере переводится в последовательность нуклеотидов, и, на выходе получается файл, содержащий последовательности ридов.

Секвенирование по методу Illumina 1 — геномная ДНК 2 — разрезается на риды 3 — к ридам прикрепляются адаптеры, с помощью которых они приклеиваются на 4 — пластину 5 — размножение ридов на пластине 6 — засовывам в секвенатор и 7 — секвенируем

Сборка и аннотирование генома

Если геномы близких организмов раньше не секвенировались, то из ридов, затем, с помощью программ, пытаются собрать единую последовательность нуклеотидов. Риды частично перекрываются, и, с помощью этих перекрытий пытаются выстроить единую последовательность. Здесь есть множество моментов, которые существенно осложняют дело. Например, можно загрязнить образец, и программа будет пытаться выстроить одну последовательность из ДНК разных организмов. Секвенатор может ошибиться при чтении рида, или неверно связать два места в геноме, потому что они очень похожи. На самом деле, сложностей так много, что всех тут не перечислишь. И, некоторые из них настолько сложно поддаются устранению, что, даже геном человека, самый важный и широко исследуемый геном, все еще не секвенирован до конца.

риды и внизу последовательность генома, которая реконструирована на их основе Когда последовательность генома собрана, то нужно понять, что она значит. На ней находят участки, которые похожи на гены. Делается это следующим образом: В начале и конце генов находятся определенные «метки» из нуклеотидов, и, если на ДНК находят такие последовательности на таком растоянии, что между ними может уместиться ген, то такое место заносится в список потенциальных генов. Затем, этого претендента сравнивают с базой данных уже известных генов других организмов, и, если в ней находят ген, достаточно сильно похожий на этот участок, то ему присваивают функцию этого гена.

Если геном другого организма этого вида уже секвенировался, то его используют, для сборки. Так как геномы разных организмов одного вида различаются лишь незначительно, то для каждого рида находят место на секвенированном геноме, к которому он ближе всего, и на основе этого генома собирают новый.

Теги:
  • секвенирование
  • биоинформатика
  • биология
  • illumina

Секвенирование ДНК в домашних условиях: как на коленке собрать прибор за 10 миллионов

Всем привет, меня зовут Александр Соколов, и я хочу рассказать, как сделал дома секвенатор – прибор для расшифровки ДНК. Рыночная цена такого прибора составляет около 10 миллионов рублей.

Краткий экскурс в генетику. Если вдруг вы помните, в 2003 г. было сделано сенсационное заявление: ученые, наконец, расшифровали геном человека. Геном построен из ДНК, а ДНК – это исходный код организма. ДНК представляет собой двойную цепочку, состоящую из 4-х видов нуклеотидов, которые повторяются в геноме человека порядка 3 млрд. раз. Так же, как в битах зашифрована вся информация на вашем компьютере, в нуклеотидах зашифрована инструкция о сборке всех белков человеческого тела. То есть зная, в какой последовательности расположены нуклеотиды в ДНК, мы теоретически можем собрать все необходимые белки и получить модель человека. Так вот в стандартном понимании ученые не расшифровали ДНК, а просто перевели химическую последовательность в набор нулей и единиц на компьютере. Что делать с этим дальше – отдельный разговор. Например, на данный момент нам ясна функция лишь 5% всего массива генома (это кодирование белков). Чем занимаются остальные 95%, можно только предполагать. В 2003 году стоимость секвенирования ДНК человека составляла около 100 млн долларов. С течением времени эта цифра уменьшалась и сейчас она приближается к тысяче долларов. Вы платите, вашу ДНК секвенируют и отдают вам жесткий диск с 3 ГБ информации – вашим геномом в цифровом виде. Сегодня на рынке представлено три основных секвенатора. Самый производительный, Hiseq, и его приемник NovaSeq, обеспечивает самое дешевое (флуоресцентное) секвенирование. Один его запуск длится несколько дней, и за это время обрабатываются геномы сразу нескольких человек. Однако сам запуск стоит около десятка тысяч долларов. К слову, и сам прибор стоит порядка $1 млн, а, поскольку устаревает он примерно за 3 года, для того, чтобы он окупился, он должен приносить вам $1000 в день. Второй прибор появился на рынке буквально прошлым летом. Он называется Nanopore и базируется на очень интересной технологии, когда ДНК секвенируется путем пропускания через нанопору. Самый дешевый вариант Nanopore позиционируется как одноразовый домашний секвенатор и стоит $1000. Третий прибор – PGM, полупроводниковый секвенатор, который стоит $50 000 у себя на родине и около 10 млн рублей (с доставкой, растаможиванием и т. д.) в России. Процесс секвенирования на нем занимает порядка нескольких часов. Что ж, десяти миллионов у меня не было, а PGM захотелось. Пришлось сделать самому. Сначала вкратце о том, как происходит полупроводниковое секвенирование. Вся цепочка ДНК делится на фрагменты длиной по 300-400 нуклеотидов, называемые ридами. Затем риды прикрепляются к маленьким сферам и многократно копируются – в итоге на каждой сфере «висит» целый пучок одинаковых фрагментов ДНК. Копирование нужно для усиления сигнала от каждого конкретного рида. Набор разных сфер называется библиотекой ДНК. Сердцем PGM является одноразовый чип – матрица, похожая на матрицу в фотокамере, только вместо пикселей, реагирующих на свет, здесь pH-транзисторы, реагирующие на изменение кислотно-щелочного баланса. Полученная библиотека ДНК загружается на чип, содержащий 10 млн лунок, на дне каждой из них находится pH-транзистор. В лунку умещается только одна сфера и, следовательно, риды только одного типа (с одной определенной последовательностью нуклеотидов). Далее на чип подаются реагенты таким образом, чтобы ДНК начала себя копировать. А копируется она линейно, то есть нуклеотиды прикрепляются к вновь создаваемой цепочке в том порядке, в котором они стоят в материнской цепочке. Поэтому на чип подается один тип нуклеотидов – и тут же фиксируется изменение pH в некоторых лунках (это значит, что в них произошло присоединение данного нуклеотида). Далее подается другой тип нуклеотидов и фиксируется изменение pH в лунках и т. д. Таким образом, подавая на чип все 4 типа нуклеотидов много раз, мы можем получить информацию о последовательности нуклеотидов в каждом риде. Затем математическими способами прочитанные короткие отрезки собираются на компьютере в единую цепочку. Чтобы собрать ее более-менее уверенно, каждый рид нужно прочесть примерно по 100 раз.

Рис.1. Полупроводниковое секвенирование Теперь разберемся, из чего состоит сам прибор. Имеется, как мы уже знаем, чип, а также система подачи реагентов и материнская плата. Все секвенирование ведется именно на чипе – остальной аппарат только передает на него определенные сигналы, подает реагенты, считывает с него аналоговые сигналы, оцифровывает их и гонит полученный поток информации на компьютер, где данные накапливаются и обрабатываются.

Рис. 2. Устройство секвенатора Чип позиционируется как одноразовый и после использования выкидывается. Соответственно, там, где работает PGM, такие чипы можно достать бесплатно в любом количестве. Зачем их доставать, спросите вы? Дело в том, что чип мне уже удалось использовать многократно. По сути он вечен: достаточно хорошо промывать его – и можно применять вновь и вновь. По точности работы он ничем не будет отличаться от нового. Сама моя идея заключалась в том, чтобы сделать прибор под этот условно бесплатный чип. Итак, передо мной встала задача реверс-инжиниринга чипа. Разумеется, никакой документации на заветную микросхему найти было нельзя – производитель не собирался делиться секретами производства, а хотел спокойно продавать свои приборы за $50 000. Для начала я сделал самое очевидное и простое: прозвонил контакты тестером. Стало ясно, где расположены цифровые и аналоговые входы-выходы, питание и прочее. Кое-какую информацию удалось почерпнуть из патентов на чип. Но всего этого, понятно, было недостаточно для создания полноценного продукта. Я еще повозился с чипом, проверял разные свои догадки, поэкспериментировал с подачей сигналов, но никуда принципиально не продвинулся. Пришлось поставить проект на паузу.

Рис. 3. Прозвонка чипа

А затем внезапно на Habrahabr мне попалась статья известного блоггера BarsMonster о том, как он делает реверс-инжиниринг чипов! Воодушевился, написал ему, написал другим энтузиастам, отправил запрос в Киев, где занимались фотографированием чипов. Из Киева ответили, что полировать по слоям они не умеют, могут только отснять верхний слой, а так как мой чип – многослойный, будет не понятно, куда идут дорожки от контактов. Потом познакомился с одним американцем, который тоже занимается реверс-инжинирингом чипов, послал ему свои микросхемы, но и тут дальше фотографирования верхнего слоя дело не пошло. Затем наткнулся в интернете на статью про тех, кто смог отреверсить чип Sony PlayStation и пр. («Слава героям!» и вот это все, если кто в курсе). Решил написать им с вопросами, нашел их ники – и тут же понял, что один из них мне знаком. Недавно товарищ свел меня со своим другом, который «тоже занимается генетикой на любительском уровне», мы пообщались с этим другом в Skype и на этом диалог закончили. И вот я понимаю, что мой новый приятель – мегакрутой мастер реверс-инжиниринга чипов. Тут же написал ему. Однако выяснилось, что, хоть помочь он и готов, у него нет микроскопа. Снова тупик.

А через несколько месяцев нужный микроскоп нашелся в соседней лаборатории! Правда, встроенная в него камера была ужасной, я фотографировал на мобильный телефон через окуляр и получал снимки вот такого качества:

Рис. 4. Чип под микроскопом Затем на последний Новый год отличный микроскоп за 130 тыс. появился у меня на работе (я – специалист по квантовой криптографии). Мечты сбываются. Наконец, я смог нормально сфотографировать чип сверху.

Рис. 5. Мой рабочий микроскоп А потом… Потом мне все-таки пришлось самому освоить технику его полировки. Трудность полировки заключается в том, чтобы снимать слои металла толщиной порядка 1 микрона – при этом ширина чипа составляет 1 сантиметр. Для сравнения скажу, что это примерно то же, что допустить на 1 км погрешность не более 10 см. Я очень старался. Результаты моих трудов представлены на следующем фото:

Рис. 6. Реверс-инжиниринг под оптическим микроскопом Довольно хорошо видны нижний кремниевый слой, верхний слой с транзисторами, первый, второй, третий и четвертый слои металла. Чип состоит из повторяющихся зон (типа сдвиговых регистров), и по таким картинкам было очень удобно его анализировать: сразу становилось ясно, что происходит на разных слоях. Я «отреверсил» самые «нафаршированные» участки с обилием логики, которые многократно повторялись. Но самым сложным оказалось отследить трассы, идущие по всему чипу, понять, какой внешний контакт к чему относится. С новогодних праздников до конца февраля, я, вооружившись новым прекрасным микроскопом, корпел над этой задачей – сидел на работе до десяти ночи, «реверсил», думал. И тут произошло новое чудо: товарищ смог организовать бесплатную фотосъемку чипа по слоям на электронном микроскопе в МИРЭА. «Фотосессия» крохи в 1 кв. см представляла собой 50 ГБ черно-белых фотографий. Теперь все эти отдельные фотографии нужно было каким-то образом объединить в одну целую картинку. Чуть ли не в тот же день я написал на «питоне» программу, которая генерировала HTML-файл – при его открытии в браузере я получал требуемое. (Кстати, самая старая 10-я Opera справилась с этим лучше всего, рекомендую!) Затем на javascript написал еще одну программу, позволяющую сравнивать слои, плавно переходить между ними, выравнивать их, подбирать масштаб и т. д. Наконец, в моих руках были все инструменты для решения главных задач. Я отследил трассы, пронизывающие чип, и восстановил всю его структуру до последнего транзистора. Еще одна фотография среза чипа, сделанная под рентгеном (в МИРЭА):

Рис. 7. Съемка под электронным микроскопом Хорошо видны лунки, куда попадают сферы с ридами. Ниже располагаются три слоя металла, а еще ниже – слой с транзисторами. Следующим этапом борьбы за светлое будущее стало создание под чип материнской платы. Спроектировал ее и отправил заказ на производство. А пока суд да дело использовал для работы с чипом плату «Марсоход-2» с FPGA. (FPGA – это, грубо говоря, массив из 10 000 универсальных логических элементов; программируя FPGA, мы можем получать любую логическую схему, легко обрабатывающую гигабитные потоки информации.) Прошивку для FPGA я написал сам, а кроме того, для динамического управления системой написал софт, который задает всю конфигурацию для FPGA. Потом вновь образовался полугодовой перерыв (ездил в командировку на Байкал, готовил в лаборатории установку, которую демонстрировали Путину). Но в конце концов звезды сошлись: у меня появилось время, приехали готовые платы – и я собрал свою систему.

Рис. 8. Создание «железа» Подал все необходимые сигналы и – о, чудо! – увидел на осциллографе сигнал с чипа. (Осциллограф я купил когда-то за 6 000 рублей на eBay, еще 1 000 стоила прошивка к нему.) На картинке хорошо видны пятна – капельки какого-то реагента.

Рис. 9. Сигнал с чипа на осциллографе Теперь мне нужно было придумать, как оцифровать эту картинку и передать ее на компьютер. Я собрал вот такую установку:

Рис.10. Схема прибора

Рис. 11. Готовая установка Есть компьютер, который подает данные управления на плату с FPGA. Плата генерирует цифровые сигналы и отправляет их на чип. Сигнал с чипа идет на усилитель, далее – на АЦП на плате, оцифровывается и передается через COM-порт на компьютер. Вообще, пропускная способность COM-порта невелика: 15 килобит в секунду (т. к. в одном чипе находится от 1 млн до 10 млн «пикселей», а максимальная скорость передачи – 115200 бод). Тем не менее картинка на компьютер в итоге попадает.

Рис. 12. Обработанный сигнал на компьютере. На фото выше видно, что, когда на использованный б/у-шный чип подается библиотека ДНК, чип заполняется неравномерно: по краям – в меньшей степени. Разные цвета обусловлены разным напряжением на pH-транзисторах. То есть мы можем ясно различить те лунки, куда попали сферы с ридами – впоследствии это поможет нам контролировать промывку чипа. Соответственно, следующей задачей стала промывка чипа. Нужно было добиться, чтобы он стал, как новый. К счастью, у меня имелся совершенно новый чип в качестве референсного образца. На илл. А видно, что в активной области такой чип практически одного цвета (вертикальные повторяющиеся полосы – это просто шумы, наводки).

Рис. 13. Промывка чипа На рис. 13 B неудачно промытый чип – он разноцветный. На рис.13 D – использованный, но хорошо промытый чип. Видно, что градиент по краям исчез. Тем не менее стоило бы еще доказать, что он действительно чистый и может использоваться повторно. Поскольку библиотеки ДНК прикрепляются к танталовому покрытию чипа в кислой среде и открепляются – в щелочной (то есть при высоком pH), то чип промывается с помощью специальных полуавтоматических пипеток растворами с разными pH. На сегодняшний день мне удалось добиться практически полной очистки чипа. У меня интересовались, почему, когда я полностью разобрался в структуре чипа, я не стал заказывать его изготовление, а предпочел по-прежнему искать и доставать б/у-шные, возиться с их промывкой и т. п. Да потому, что разработка микросхемы стоит огромных денег, миллионы долларов, и солидная часть этой суммы уходит на физическую отладку полученного продукта: подгонку, настройку всех параметров транзисторов и т. д. То есть просто скопировать логическую схему – недостаточно. Поэтому я беру условно бесплатную, уже готовую – спроектированную, изготовленную, отлаженную – микросхему и таким образом экономлю значительные средства, серьезно удешевляю проект. Следующей моей задачей было собрать более продвинутый прибор, который позволял бы быстрее передавать информацию на компьютер и при этом не состоял бы из огромного количества отдельных плат.

Рис.14 Разработка следующей версии прибора Я взял новую плату с FPGA – на том же кристалле здесь было 2 ARM-ядра с Linux, имелся Gigabit Ethernet и прочие «плюшки», но зато, в отличие от предыдущего варианта, не было АЦП. Позже спроектировал еще одну плату, с высокоскоростными АЦП и всеми другими необходимыми элементами. Запустил – все заработало. Что осталось сделать для появления финального прибора? Всего три вещи. Первое. Нужен гигабитный интернет, быстрая передача данных на компьютер. Это я реализовал буквально вчера. Второе. Система подачи реагентов. Проектирование специального клапана уже в процессе. Третье. Софт для обработки информации с чипа. С ПО пока есть вопросы, поэтому приглашаю к сотрудничеству программистов. Финальный прибор стоит 10 млн рублей. Себестоимость секвенирования составляет несколько тысяч долларов. Чипы обходятся от 100 до 1000 долларов – в зависимости от количества «пикселей» в них. (К слову, восстановление чипов само по себе может стать неплохим заработком, особенно учитывая, что для промывки нужно сделать лишь пару кликов.) Реагенты тоже покупаются, но в перспективе будут создаваться и они. В общем все это очень интересно, но главное – за этим будущее. Сегодня биотехнологии занимают в мировом научно-техническом прогрессе то же место, что компьютерные технологии в 80-х гг. прошлого века. При этом секвенирование – одно из ключевых направлений для современной биологии и медицины. Ну и, конечно, биотехнологии – это очень прибыльно. В последнее время на рынке появился полупроводниковый секвенатор S5, и в ближайшее будущие я планирую переключиться на него. Буду рад пообщаться со всеми, кто захочет тем или иным образом поучаствовать в развитии этого проекта!

Проект был бы не возможен, без теоретической подготовки Владимира Зубова. Выражаю ему свою благодарность.

Спасибо за внимание! Теги:
  • Секвенатор
  • Биотехнологии
  • diy
  • генетика
  • днк

Секвенируй это

Каждые два года количество транзисторов, размещаемых на интегральной микросхеме, увеличивается вдвое. Так звучит каноническая версия закона Мура, – эмпирического наблюдения одного из основателей Intel, которое известно каждому, интересующемуся новостями технологий. Как драйвер невероятного успеха IT-индустрии закон Мура давно стал, пожалуй, самым наглядным маркером прогресса. Однако есть области технологий, где даже эта «икона сингулярности» выглядит довольно бледно. Речь идет о технологиях чтения ДНК.

Первый человеческий геном, полученный в рамках десятилетнего международного проекта, обошелся примерно в три миллиарда долларов — это стоимость всей программы, включающая многочисленные научные исследования, который приходилось проводить по ходу работы. На момент окончания проекта (черновая версия генома была опубликована в 2001 году) стоимость прочтения еще одного генома сравнимого размера оценивалась приблизительно в 100 миллионов долларов. Нетрудно подсчитать, что сейчас, 14 лет спустя, если бы закон Мура действовал в биотехе, стоимость секвенирования составила бы около 750 тысяч долларов. На самом деле по состоянию на 2015 год стоимость чтения полного человеческого генома составляет около пяти тысяч долларов, а цена генотипирования — анализа только избранных, «ключевых» участков генома — опустилась уже до сотни долларов. Даже с учетом подготовки проб и логистики оба варианта процесса занимают уже не годы, а примерно несколько недель.

Закон Мура и динамика стоимости секвенирования генома.

Изображение: genome.gov

И тут возникают как минимум два вопроса. Во-первых, — что же произошло в технике секвенирования за это время, что позволило так радикально снизить стоимость секвенирования? И, во-вторых, почему мы на себе практически не замечаем этого взрывного прогресса?

На второй вопрос ответить проще: «взрыв» геномной революции действительно произошел, но до нас, обычных потребителей, пока не дошла его «взрывная волна». Геномные данные уже давно стали радикально доступнее ученым и фармкомпаниям, но в жизнь самих их обладателей геномные данные стали выходить только в последние несколько лет. А вот первый вопрос — как и почему это произошло, как менялась технология секвенирования и как сегодня ученые читают ДНК — требует отдельного разбора.

Для начала нужно определится с тем, что такое секвенирование. Секвенированием (от слова sequence — последовательность) называют определение порядка элементраных единиц мономеров в полимере. Причем эти полимером может быть не только ДНК или РНК, но и, например, белок или даже полисахарид. Сам термин «секвенирование» возник в тот момент, когда стало понятно, что в биологии свойства и функции полимеров не могут определяться просто их составом, как привыкли думать химики: слишком похож оказался этот состав у совершенно разных с функциональной точки зрения молекул. А если дело не в составе, значит ключевую роль играет именно последовательность мономеров — идея, которая кажется тривиальной сейчас, но в 40-е годы прошлого века была совершенно новой.

Приоритет в открытии этой ключевой для биологии концепции принадлежит британскому ученому Фредерику Сенгеру. «Папа секвенирования» родился в 1918 году в семье врача и прожил очень длинную и исключительно плодотворную научную жизнь. Единственный в мире дважды нобелевский лауреат по химии (1958 и 1980 годов) он в полной мере успел застать геномную революцию, созданную прежде всего своими же руками.

Однако объектом первого в мире секвенирования, которое в конце 40-х провел Сенгер, была вовсе не ДНК или РНК. Это был инсулин – единственный в то время пептид, доступный в более-менее чистом виде в достаточных количествах. То, какие аминокислоты входят в состав инсулина было к тому моменту известно, но ученые полагали, что пропорции этих аминокислот в инсулине приблизительны, да и не слишком важны — предполагалось, что при создании белков жизнь руководствуется «аналоговым» подходом, «насыпая» аминокислоты в разные белки на глазок.

Именно Сенгер показал, что это не так. Ему удалось найти реагент, который избирательно взаимодействует только с одной аминокислотой из всей полипептидной цепочки: той, которая находится в самом начале пептида, и у которой, из-за этого, есть уникальная химическая группа. И если для исходного полипептида такая аминокислота одна, то после частичного разрезания концевой может стать любая из аминокислот, а значит все их можно идентифицировать. Путем разбивания инсулина на мелкие фрагменты и определения концевых аминокислот Сенгеру удалось (всего-то за восемь лет кропотливой работы) собрать полный «пазл» мономеров, и определить, таким образом, точную структуру инсулина. За эту работу Сенгер спустя всего шесть лет после последней публикации получил Нобелевскую премию по химии.

Однако после успеха с инсулином никто — ни Сенгер, ни его конкуренты, даже не пытались подступиться к секвенированию ДНК. «Самая главная молекула» выглядела слишком огромной и устрашающей для того, чтобы можно было попытаться прочитать ее последовательность. Кроме того, в каждой клетке, как известно, содержится всего одна или две копии геномной ДНК, а значит получить достаточное количество одинаковых молекул (чего требует метод), довольно сложно.

Тактической целью стала другая нуклеиновая кислота, РНК. Точнее говоря, ее отдельная разновидность, транспортная РНК, которая в клетке используется в качестве адаптера, «подносящего» аминокислоты при синтезе белка. Ее длина составляет всего 70-80 нуклеотидов, а число копий на клетку достигает сотен тысяч штук. Для секвенирования РНК Сенгер применил ту же общую стратегию: мечение концевого мономера с последующим частичным разрушением молекулы на множество фрагментов. Однако тут удача ему изменила. Роберт Холли с соавторами из Корнельского университета смог опубликовать последовательность одной из тРНК дрожжей уже в 1965 году, именно Холли стал первым человеком, определившим последовательность какой-либо нуклеиновой кислоты. И хотя всего три года спустя группе Сенгера удалось секвенировать РНК почти вдвое длиннее (это была одна из тех молекул, что входят в состав рибосомы), по-настоящему отыграться за это поражение ему удалось только спустя десять лет.

Метод секвенирования ДНК, несущий сейчас имя Сенгера, был опубликован в 1977 году. На протяжении более 30 лет, вплоть до середины нулевых годов, он оставался главным способом определения последовательности любой нуклеиновой кислоты: именно этим методом (с незначительными модификациями) был прочитан геном человека. И до сих пор секвенирование по Сенгеру является самым точным методом, к которому обращаются при необходимости проверить результаты секвенирования нового поколения.

Идея, лежащая в основе секвенирования по Сенгеру, настолько проста и изящна, что на ней хочется остановится подробнее. До сих пор, как мы видели, все методы чтения последовательности были основаны, условно говоря, на разрушении: на получении чистого вещества, его фрагментировании и восстановлении «пазла» из получившихся фрагментов. Сенгер решил действовать противоположным образом: читать ДНК не фрагментированием, а синтезом, причем использовать для этого природный фермент, ДНК полимеразу — ту самую молекулярную машину, которая удваивает ДНК перед делением клетки.

Процедура проводится следующим образом: фрагмент ДНК, помеченный с одного из концов радиоактивным изотопом, разделяют на четыре пробирки. В каждую из них добавляют реактивы, необходимые для синтеза новой ДНК, в том числе одиночные «буквы», которые полимераза должна будет связать в новую нить — в точном соответствии с исходной матрицей. Однако помимо обычных «букв» к раствору добавляется некоторое небольшое число специально «испорченных» — таких, после которых невозможно присоединить следующую «букву» (они просто лишены соответствующего места для связи).

В результате в конце синтеза в каждой пробирке появляется набор ДНК разной длины, причем каждая из молекул несет радиоактивную метку в начале и испорченную «букву» на конце. Поскольку в каждую из четырех пробирок мы кладем только один вид испорченных оснований, мы знаем, какой буквой кончаются все фрагменты ДНК в данной пробирке. Теперь достаточно разогнать содержимое всех четырех пробирок в геле, разделяющем ДНК по длине и приложить к нему фотопленку, которая зафиксирует скопления радиоактивности. На пленке появится «лестница» из ступенек, каждая из которых будет соответствовать одной букве в последовательности. Поднимаясь по лестнице, мы прочтем всю последовательность исходной ДНК.

Метод Сенгера оказался исключительно надежным и удобным для чтения последовательностей. Возможно, именно благодаря тому, что он полагался на «выдрессированные» в ходе миллиардов лет эволюции природные ферменты, а не синтетические реактивы. Именно с помощью этого метода (точнее, с помощью его непосредственного варианта-предшественника) Сенгеру удалось прочитать первый в истории полный геном отдельного организма — геном бактериофага ϕX174, содержащий всего 5386 оснований (кстати, этот же фаг в 2003 году стал первым организмом, геном которого был полностью синтезирован искусственно).

Уже несколько лет спустя, в середине 80-х, когда инкрементные улучшения постепенно увеличивали скорость и мощность секвенирования, стали появляться полные геномы все более сложных вирусов и ученые впервые заговорили о возможном секвенировании геномов высших организмов, в том числе и человека.

Подобраться к этой задаче стало возможно тогда, когда появились методы молекулярного клонирования, позволявшие вырезать из генома отдельные фрагменты, затем вставлять их в модельные организмы (кишечную палочку или дрожжи), а потом постепенно, по кусочку, секвенировать – тем же самым методом Сенгера.

В 1990 году стартовала международная программа «Геном человека», в которой каждому коллективу из Америки, Европы и Японии были выделены отдельные участки предварительно размеченного генома для секвенирования. К этому моменту несколько биотехнологических компаний, прежде всего Applied Biosciences, научились автоматизировать процессы секвенирования по Сенгеру. Сначала секвенаторы могли самостоятельно только читать «лестницы» на фотопленке, превращая их в буквенную последовательность, а затем сам процесс разделения фрагментов ДНК удалось перенести из геля (который нужно было каждый раз заливать заново) в тонкий капилляр. Радиоактивные метки заменили флюоресцентными, и это позволило читать последовательность прямо во время прохода сквозь капилляр: четыре цвета — четыре разные буквы.

Одним из первых, кто осознал возможности автоматизации секвенирования, был Крейг Вентер — будущий одиозный зачинатель «гонки геномов», решивший опередить в прочтении генома человека всю международную коллаборацию (а также автор первого живого организма с полностью синтетической ДНК). В 1992 году, спустя два года после старта проекта «Геном человека», Вентер организовал собственный институт с броской аббревиатурой TIGR (The Institute for Genomic Research), в котором секвенирование ДНК было впервые поставлено на поток. В 1995 году группе Вентера удалось получить первый геном полноценного клеточного организма, точнее даже двух: бактерий Haemophilus influenzae и Mycoplasma genitalium.

С чисто биологической точки зрения принципиальным было то, что речь шла именно о полноценных клеточных геномах: вирусы живут только в клетках и в своей жизни почти во всем полагаются на клеточные системы, кодируемые не собственным геномом, а геномом клетки. И только последние содержат полную необходимую для жизни информацию и поэтому гораздо интереснее вирусных геномов.

С технической точки зрения новаторство Вентера заключалось в том, что он впервые применил радикальный подход к секвенированию генома. Как уже говорилось, до сих пор ученые работали с геномом «по кусочкам», что позволяло читать ДНК самых сложных организмов но и требовало огромных затрат времени на клонирование. Вентер стал пионером так называемого «метода дробовика», когда весь геном целиком нарезается на множество коротких пересекающихся фрагментов, которые прочитываются, а затем собираются снова: снизу вверх.

Такой подход существенно упрощает все стадии, требующие участия человека и хорошо подходит для автоматизации. Однако у него есть два принципиальных недостатка. Во-первых, сборка генома из миллионов и миллионов коротких фрагментов требует огромных вычислительных ресурсов, подразумевает создание принципиально новых математических алгоритмов и требует многократного покрытия (например, чтобы собрать геном длиной 100 нуклеотидов вам нужно прочитать фрагментов общей длиной в 1000 — в этом случае говорят про десятикратное покрытие).

А во-вторых, работает этот метод по принципу «пока не сделано всё — не сделано ничего». Именно благодаря этой особенности наблюдать за гонкой геномов было особенно интересно: если бы качества и количество «сырых» последовательностей Вентеру немного не хватило, вся авантюра c секвенированием оказалась бы пустой тратой времени. Этого, однако, не случилось. Оба генома — и полученный в ходе международного проекта и собранный частной компанией Вентера были опубликованы в двух выпусках Nature и Science, вышедших на одной неделе в феврале 2001 года.

Услышав про проект «Геном человека» многие спрашивают: — а какого именно? Кем был тот человек, на прочтение генома которого было потрачено столько денег и усилий ученых? И хотя ответ тривиален (никем он не был, это референтный геном, ДНК для которого была получена у нескольких анонимных доноров) такой вопрос бьет в самую точку. Никто из нас не является обладателем консенсусного генома, в ДНК каждого существует огромное количество уникальных отличий, и именно эти отличия делают нас теми, кто мы есть. Поэтому в первый же день после публикации референтного генома человека стало ясно, что главной целью всех последующих исследований в человеческой геномике станут индивидуальные отличия.

Есть определенная ирония в том, что первыми людьми, персональный геном которых был прочитан, стали два главных соперника «гонке геномов»: первооткрыватель структуры ДНК Джеймс Уотсон и уже знакомый нам Крейг Вентер. По сравнению с референтным геномом у каждого из них было обнаружено около трех миллионов индивидуальных полиморфизмов — однобуквенных замен, которые отличаются от человека к человеку. Стоимость секвенирования обоих индивидуальных геномов к моменту их прочтения в 2007 году составила около миллиона долларов. И это, конечно существенно ниже, чем 100 миллионов в 2001 году, но все равно немало: с такими ценами рассчитывать на прочтение геномов сотен или тысяч человек или предлагать такую услугу обычным людям было бы странно. Однако, к счастью, как раз в тот момент, когда референтный геном был создан, созрела технология, позволяющая «вылавливать» индивидуальные отличия в геномах принципиально проще и дешевле обычного секвенирования. Речь идет о технологии ДНК-микрочипов.

ДНК-микрочип — это небольшая пластинка, на которой с помощью технологии, напоминающей фотолитографию, закреплены короткие одноцепочечные фрагменты ДНК. При инкубации с раствором образца две молекулы ДНК — одна на чипе, другая в образце — могут образовать прочную пару. Если все молекулы образца предварительно пометить флюоресцентным маркером, то после инкубации мы увидим на чипе светящиеся точки в тех местах, где образовались прочные пары. И если это произошло, значит последовательности фрагментов ДНК в образце точно совпали с последовательностями на чипе — а их мы знали заранее.

Установив, какие в популяции существуют индивидуальные особенности, мы можем создать микрочип с сотнями тысяч различных полиморфизмов. Это позволит получать информацию о наличии тех или иных «однобуквенных» замен в вашей ДНК всего за несколько часов. Формально, такая процедура не является секвенированием, но она позволяет читать последовательности ДНК, варианты который мы уже знаем. Использовать микрочипы для чтения совершенно новых последовательностей нельзя (хотя работы в этом направлении ведутся), но когда речь идет о персональной геномике, этого и не требуется: ДНК разных людей, как известно, совпадают на 99 процентов. С помощью современных микрочипов можно прочитать около миллиона известных полиморфизмов, то есть примерно одну треть от того их количества, которое присутствует в геноме.

ДНК-микрочипы стали появляться в научных лабораториях в 90-х, а в середине 2000-х появились первые компании, предлагающие анализ персонального генома на их основе. Небезызвестная 23andMe, основанная бывшей женой Сергея Брина, как раз была одной из первых таких компаний. Сейчас у компании Энн Вожитски появилось множество конкурентов, причем, как в мире, так и в России.

Однако сегодня технологиям генотипирования наступают на пятки (и по скорости, и по стоимости) так называемые методы секвенирования нового поколения. Именно их появление обвалило стоимость процедуры с миллионов до тысяч долларов. Это методы очень разные, и обо всех них рассказать не получится.

Немного остановится можно, пожалуй, только на так называемом пиросеквенировании — методе, который основан на гидролизе пирофосфата. При соединении нуклеотидов друг с другом в цепочку ДНК в раствор всегда выбрасывается это соединение — высокоэнергетичный фрагмент нуклеотида, который затем бесследно разрушается и своей «гибелью» обеспечивает однонаправленность реакции синтеза. В середине 2000-х многие научные группы независимо заметили, что разрушение пирофосфата уместно использовать при секвенировании: его можно «скармливать» специальному ферменту, который умеет превращать энергию связи пирофосфата в импульс света. Тогда, по наличию или отсутствию вспышки можно будет судить — прошла ли реакция присоединения нуклеотида к цепочке или нет. Когда на матрице ДНК образца синтезируется ее копия, вспышка означает наличие в нуклеиновой кислоте комплементарного основания.

Выглядит это так: ДНК режут на миллионы коротких фрагментов, наносят на микроскопические шарики, копируют их (так, чтобы на одном шарике были только идентичные копии одного фрагмента) и распределяют по микроскопическим ячейкам, сделанным в специальной подложке. После этого в ячейках начинается синхронная реакция. Сквозь подложку пропускают один вид нуклеотидов — если в ячейке при этом происходит вспышка, значит этот нуклеотид подходит для синтеза, значит на матрице находится комплементарный нуклеотид. Затем подложку отмывают от первого нуклеотида и подают второй — на этот раз загораются другие ячейки, те, в которых есть соответствующее комплементарное основание. Так, многократно промывая ячейки четырьмя нуклеотидами, биоинженеры читают последовательность ДНК по вспышкам в отдельных ячейках. Главная особенность этого и подобных методов — возможность проводить огромное количество параллельных реакций. И хотя точность реакции в каждой из ячеек невелика, огромное количество таких ячеек делает секвенирование очень быстрым и, следовательно, дешевым.

И все же пока полногеномное секвенирование не может сравняться по стоимости с генотипированием. Да, в исследовательских лабораториях технологии нового поколения уже вытесняют генотипирование из традиционных для этого метода задач (например, для анализа РНК и экспрессии генов). Но вот в персональной геномике дела обстоят иначе: особенности генома, которые заметны только при полном секвенировании и не видны микрочипам настолько редки, что настоящее секвенирование кажется стрельбой из пушки по воробьям.

В последние год-два на рынке полногеномного чтения ДНК наблюдается небольшой застой (кстати, напоминающий ситуацию перед тем, как появились методы нового поколения). Поэтому можно ожидать, что в ближайшие годы потребительская геномика будет по-прежнему полагаться на ДНК-микрочипы. Учитывая, то, насколько доступными они уже стали, даже введение новых революционных методов секвенирования вряд ли что-либо сильно поменяет на потребительском рынке. А значит, наступил момент, когда дело уже не в технологиях, с помощью которых получаются геномные данные, а в их интерпретации. Но это уже совсем другой разговор.

Александр Ершов

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

Почему могилы звезд шоу-бизнеса могут стать популярным местом поклонения

Секвенирование – это... Секвенирование по Сэнгеру

Известно, что человеческий геном состоит из четырех «букв». Они условно обозначаются как А, Ц, Г и Т. То есть геном человека полностью складывается из молекул четырех типов – аденина, цитозина, гуанина и тимина. Большее количество хромосом в генах не является свидетельством большей развитости. Оно лишь говорит о количестве угроз и потрясений, через которые удалось пройти тому или иному биологическому виду. Какая информация заключена в ДНК и с помощью каких методов стало возможным расшифровать содержимое человеческого генома?

Цели генетических исследований

Полное секвенирование генома позволяет прочесть все последовательности этих «букв». Оно позволяет определить неизвестные гены и сделать медицинскую терапию максимально эффективной. Именно поэтому одной из самых популярных медицинских услуг (конечно, среди тех, кто может себе это позволить) является секвенирование. Диабет, злокачественные опухоли и заболевания сердца – предрасположенность к этим болезням позволяет выявить процедура расшифровки ДНК. На основе полученных прогнозов человек имеет возможность скорректировать свой образ жизни, снизить неблагоприятные факторы окружающей среды. Поэтому некоторые исследователи убеждены, что полное секвенирование генома должно входить в набор обязательных исследований новорожденных.

История проекта

Проект расшифровки генома был запущен еще в начале 90-х годов. Для того чтобы произошла полная расшифровка генома, потребовалось порядка полутора десятка лет. Этот научный проект объединил вокруг себя ученых из самых разных стран – Китая, Германии, Франции, Японии. В начале нового тысячелетия Билл Клинтон и Тони Блэр официально заявили о том, что «черновик» генома завершен. В 2006 году издательство Nature опубликовало информацию о том, что получена последовательность последней хромосомы. Также на рынке генетических услуг появилось секвенирование экзома – процесс определения поврежденных участков в молекуле ДНК. Общество считало, что находится на пороге новой эры.

Что же такое секвенирование?

Секвенирование – это заключительная ступень анализа генома человека. Перед этим следуют такие стадии: материал отбирается и клонируется. А также происходит предварительное тестирование участка ДНК более простыми методами. Секвенирование – это заключительное определение нуклеотидного ряда молекулы ДНК. Всего существует два способа этого генетического исследования: во-первых, используется метод Максама-Гилберта. Он базируется на способах расщепления молекулы ДНК по одному основанию. Есть более простой способ, который в практике используется чаще. Это так называемый дидезокси-метод, или секвенирование по Сэнгеру.

Стадии расшифровки генома по Сэнгеру

Последний метод включает в себя следующие стадии исследования:

  • изучаемый фрагмент молекулы ДНК гибридизируется с праймером;
  • происходит ферментативный синтез молекулы;
  • на следующей стадии материал подвергается электрофорезу;
  • и, наконец, полученные результаты анализируются исследователями-генетиками на радиоавтографе.

Большая часть этих приборов способна распознавать до 300 полос в молекуле ДНК.

Процесс дешифровки ДНК по Сэнгеру

Первоначальным способом секвенирования, который научные работники смогли использовать с целью обработки геномов, стало секвенирование по Сэнгеру (Sanger sequencing). Суть его состоит в следующем: ДНК клонируется, а затем полученная смесь делится на четыре части. Каждая из них помещается в специальный раствор, в котором присутствуют следующие вещества:

  • молекулы ДНК-полимеразы;
  • праймеры, которые способствуют процессу репликации;
  • смесь из четырех копий нуклеотидов;
  • отдельные вариации оного из нуклеотидов.

Таким образом, расшифровка генома по Сэнгеру практически идентична с процессом клонирования ДНК человека. Отличаются эти процессы только тем, что в нуклеотиды подмешиваются ложные компоненты.

Процесс расшифровки сегодня

Сейчас метод секвенирования по Сэнгеру полностью является автоматизированным. Он проводится на специальном оборудовании – эти машины называются секвенаторами. Химические реакции проводятся в одной пробирке. Результаты, полученные в результате расшифровки по Сэнгеру, анализируются с помощью компьютерной техники. Современные секвенаторы могут «считывать» информацию с 600-1000 нуклеотидов одновременно. С помощью автоматизации процесс секвенирования сейчас происходит намного быстрее, чем раньше.

Станет ли это доступным?

Сейчас ведущими странами, которые производят секвенирование ДНК, являются Китай и Соединенные Штаты Америки. Они находятся в ситуации конкуренции – победит та страна, которая первой сможет расшифровать человеческий геном, потратив на это менее сотни долларов. Американская исследовательская компания под названием Ilumina – вот главный противник Китая в этом вопросе. Китайскими учеными еще в 2010 году было закуплено первоклассное оборудование, которое позволяло им занимать все эти годы лидирующие позиции на рынке по услугам секвенирования генома. Но, во-первых, эти приборы стали неизбежно устаревать, а, во-вторых, услуга по расшифровке ДНК становится все более и более дешевой. Сейчас Китай не хочет тратить и без того недостающие финансовые средства на оборудование из-за рубежа – ученые решили разработать собственную аппаратуру. Кто победит в схватке за лидерство – покажет будущее. Но уже сегодня расшифровка генома в отдельных случаях стоит не более 600 долларов.

Действительно ли расшифровка генов полезна?

Впрочем, не все так просто в этом вопросе. Некоторые исследователи настаивают на том, что секвенирование генов приносит не столько пользу, сколько вред. Может ли этот процесс действительно что-то дать отдельному индивиду или быть вкладом в науку? Почему часть специалистов относится к расшифровке ДНК более чем критически?

Дело в том, что методы секвенирования, с их точки зрения, являются не более чем суперсовременным способом гадания на кофейной гуще. Ответственность за получение информации о своем геноме человек несет сам. Разные мотивы толкают людей на ответы на вопросы о своем ДНК. Кто-то стремится таким образом лучше узнать себя. Кто-то пытается себя обезопасить от заболеваний – и делает все, чтобы перестраховаться. Однако такой подход может быть крайне негативным.

Например, люди, которые узнают, что имеют риск заболеть онкологией, в дальнейшем начинают страдать от серьезных депрессий и без конца бегать по врачам. И это при том, что даже полное секвенирование дает результаты, которые прогнозируют развитие страшных заболеваний с риском 50%. Однако среди клиентов этих услуг все больше распространяется волна истерии. Все это привело к тому, что некоторые власти, например, в Соединенных Штатах, серьезно взялись за ограничение деятельности медицинских компаний.

В отечественной среде более популярным является выражение «генетический паспорт». Но, как это часто случается, наука не смогла предугадать всех последствий своих достижений. Ведь расшифровка «букв» еще не дает гарантии того, что правильно будут поняты написанные «слова». Например, генетики до сих пор не могут однозначно ответить на вопрос, сколько генов содержится в человеческом геноме. Раньше считалось, что это количество колеблется от 10 тысяч до 40 тысяч. Теперь исследователи выдвигают предположение о том, что это число колеблется в пределах 10 – 25 тысяч. Точнее сказать невозможно. И секвенирование генома является лишь одним примером того, как научное открытие становится причиной еще большего количества вопросов без ответа.

Стоимость расшифровки генома сейчас составляет порядка 1 тыс. долларов. Однако прочтение генов для многих является лишь источником дополнительного стресса. За свои же деньги клиенты получают такие результаты, от которых потом не могут заснуть по ночам. Секвенирование – это исследование, в которое включается получение информации о различных генах. В том числе в «генетический паспорт» входят гены, которые принимают участие в развитии различных болезней – диабета, ожирения, сердечно-сосудистых заболеваний. Не нужно быть генетиком международного класса, чтобы понять: к этим болезням могут быть генные предпосылки, однако и образ жизни, который ведет человек, играет значительную роль.

Возможные ошибки

Сейчас многие ученые указывают на тот факт, что в процессе секвенирования часто нельзя избежать ошибок. Причем их вероятность измеряется не десятыми долями, а целыми процентами. Их возникновение связано с особенностями технологии расшифровки. Секвенирование – это процесс, который можно сравнить со снятием копии с огромного фильма длиной несколько тысяч кадров. При этом позволяется снимать копии, которые будут длиной не более 20 кадров. Чтобы они были как можно более точными, их снимают «с запасом», чтобы дополнительные отрезки друг друга перекрывали. С расшифровкой человеческого генома все еще сложнее – ведь длина человеческой хромосомы составляет десятки и сотни миллиардов букв. Задача собрать человеческий геном была достаточно амбициозной для многих стран. Однако сейчас вывод можно сделать только один – геном собран с большим количеством ошибок. Возможно, в будущем ученые смогут собирать данные более точно. А сегодня нужно мириться с такой ситуацией.


Смотрите также