Олигонуклеотидные микрочипы. Метод SAGE

Обновлено: 18.05.2024

Нозерн-блот анализ (Nothern-blot)
Гибридизация с
радиоактивно
меченым
зондом
Разделение РНК в
денатурирующем
геле по размеру
Результат
авторадиографии
Перенос РНК на
нитроцеллюлозный
фильтр
Отмывка от
несвязавшегося
зонда

Нозерн-блот анализ (Nothern-blot)
Преимущества метода
1.
2.
3.
Довольно точная оценка
экспрессии гена
Сравнительный анализ нескольких
образцов
Возможность оценить не только
наличие, но и размер транскрипта
(транскриптов)
Недостатки метода
1.
2.
3.
4.
Недостаточная чувствительность
метода
Необходимы довольно большие
количества суммарной РНК
Необходимость работать с
радиоактивными изотопами.
Редкие и слабо представленные
РНК не выявляются, что может
приводить к ложноотрицательному
результату.

Методы на основе ПЦР
Качественные:
1. Дифференциальный дисплей
2. Неконкурентная мультиплексная ПЦР
Полуколичественные:
1. Конкурентная мультиплексная ПЦР
2. Анализ с помощью микрочипов
Количественный:
1. ПЦР в реальном времени (Real-time PCR)
2. Цифровая ПЦР

Реакция обратной транскрипции
3’
мРНК
поли A хвост
oligo dT праймер
Реакция обратной
транскрипции – синтез
кДНК по матрице мРНК
кДНК

Полимеразная цепная реакция
Наработка специфического продукта.
Теоретицеский коэффициент размножения – 2
Реальный коэффициент размножения в хорошо
оптимизированных условиях– 1,6-1,4.

Дифференциальный дисплей
Образцы
мРНК
синтез кДНК
ПЦР реакция с
использованием
комбинации
случайных
праймеров

Дифференциальный дисплей
Преимущества метода
1.
2.
3.
4.
Проведение сравнительного анализа
Анализ экспрессии сразу большого количества
генов
Теоретически возможно идентифицировать все
неизвестные транскрипты
Низкая стоимость используемых реактивов
Недостатки метода
1.
2.
3.
Получение качественных, а не количественных
данных
Большая трудоёмкость метода
За счет конкуренции за dNTP и фермент не
выявляются “редкие” малокопийные мРНК

Неконкурентная мультиплексная ПЦР
1
2
3
Фрагмент А
Контрольный
фрагмент
Интенсивность полосы А
Интенсивность контрольной
полосы
Неконкурентная мультиплексная ПЦР
является методом относительной оценки
экспрессии генов. Используют две пары
специфических праймеров в одной
реакции. В качестве контроля выступают
гены, экспрессия которых слабо
меняется в условиях эксперимента.

Конкурентная мультиплексная ПЦР
Оба продукта ПЦР синтезируются с ОДНИХ и тех же праймеров.
Конкурентная ДНК добавляется в реакции серией
заранее известных разведений

Особенности ПЦР, искажающие количественные показатели
•Существование фазы «плато»
•Уровень плато определяется множеством
параметров
•Высокая чувствительность метода
•Чувствительность ферментов к загрязнениям и
изменению условий
•Низкая чувствительность метода детекции
(окраска бромистым этидием).
Для фрагментов длиной менее 300 п.н.
детектируемые количества продукта
нарабатываются уже в районе перегиба, а не в
линейной фазе реакции
•Различия в эффективности амплификации
фрагментов разной длины и разного
нуклеотидного состава.
При разнице эффективности амплификации
двух фрагментов 5% изменение относительных
концентраций уже на 25 цикле составит 3,6 раза.
При 10% - 14 раз
При 15% - 58 раз.

Мультиплексная ПЦР
Преимущества метода
Довольно точная оценка
экспрессии гена (возможно
обнаружить двукратные различия
при статистической обработке
результатов)
Метод достаточно дёшев, прост и
быстр.
Возможно оценить экспрессию
редких и слабо представленных
мРНК
Требуется малое количество
исходного материала
Недостатки метода
Главный недостаток – сильная
подверженность влиянию
«синдрома китайского студента».
Точность метода сильно зависит от
квалификации и подготовки
исследователя, что не является
объективным критерием.
На точности метода сильно
сказываются недостаточно
чувствительные методы детекции

ПЦР в реальном времени (Real-time PCR)
Детекция продукта производится в режиме
реального времени по флуоресценции
возбуждаемого лазером красителя
непосредственно в реакционной смеси.
Упрощённая модификация метода –
использование интеркалирующего
красителя SYBR-green.
Образование целевого продукта
отслеживается при построении кривой
плавления. Высокая чувствительность
метода позволяет гарантированно снимать
показания на линейной части кривой, до
выхода реакции на плато.

Real-time PCR с использованием Taq-Man зондов.
Преимущества метода
1.
2.
3.
Точный метод оценки уровня экспрессии гена
Возможен сравнительный анализ экспрессии нескольких (до 4) генов в
одной пробе при использовании разных флуоресцентных красителей
Быстрота получения результата.
Недостатки метода
1.
2.
Сложности с выбором зондов
Высокие трудозатраты и цена

Digital PCR.
Комбинация ПЦР в реальном времени с Taqman-зондами
и эмульсионной ПЦР с одной молекулы
Преимущества метода
Самый точный
Очень чувствительный
Недостатки метода
1.
2.
Сложности с выбором
зондов
Цена

Скрининг изменений экспрессии с помощью микрочипов
Микрочипы – стеклянные пластинки с иммобилизоваными короткими фрагментами ДНК
Олигонуклеотидные
На основе участков кДНК

Скрининг изменений экспрессии с помощью микрочипов
Преимущества метода
Быстрый скрининг по большому
количеству генов
Наличие уже готовых панелей с
различными целевыми наборами
зондов.
Возможность автоматизации
процедуры
Недостатки метода
Слабая воспроизводимость
Высокие уровни ошибок пере- и
недопредсказания
Результаты необходимо
перепроверять методом Real-time
PCR
Исследуются только заказанные
транскрипты

SAGE - serial analysis of gene expression
Модификации метода – различаются по длине тага.
SAGE, LongSAGE, SuperSAGE
Синтез кДНК
Выделение фракции поли-А РНК
Разрезание первой рестриктазой
Лигирование с линкером, содержащим сайт
Eco15I
Рестрикция ферментом Eco15I
Лигирование с образованием ди-тагов
Отрезание линкеров третьей рестриктазой
Лигирование в конкатемеры
Клонирование в бактериальный вектор
Секвенирование методом Сэнгера
Секвенирование на пиросеквенаторе Roche

SAGE - serial analysis of gene expression
Достоинства SAGE
Более точное количественное
измерение уровней транскрипции по
сравнению с микрочиповыми
технологиями
Возможность получения данных о
неизвестных до того транскриптах
Недостатки:
Меньшая точность по сравнению с
Real-Time PCR
Большая стоимость и трудоёмкость
по сравнению с микрочипами

Прямое измерение уровня экспрессии с помощью методов
высокопроизводительного секвенирования (RNA-Seq)
Добавление внутренних контролей ERCC mix
Получение фракции мРНК и ribo-depleted RNA
Фрагментация РНК РНКазой III
Лигирование со специфическими
адаптерами
Получение кДНК
Фракционирование
Амплификация библиотеки

Прямое измерение уровня экспрессии с помощью методов
высокопроизводительного секвенирования
Проведение ПЦР в эмульсии
Собственно секвенирование
Выравнивание и подсчёт копийности

Прямое измерение уровня экспрессии с помощью методов
высокопроизводительного секвенирования
Метод, свободный от начальной гипотезы
Быстрый и сравнительно недорогой скрининг
транскриптома без предварительных его
исследований.
Возможность прямого сравнения экспрессии
интересующих групп генов.
Идентификация групп генов,
скоординированно меняющих свою
экспрессию.
Наглядная классификация транскриптов по
функциям и группам.
Обнаружение кластеров скоординированно
меняющих экспрессию генов, не связанных
общей функцией
Freed 2008

Объёмы данных для различных вариантов RNA-Seq
1) Ribo-depletion – удаление рибосомальных РНК в ходе пробоподготовки.
Стандартный вариант – чтение с одного праймера, 50-75 п.н. – 40 млн. ридов.
Позволяет идентифицировать экспрессию 80-85% генов
При изучении альтернативного сплайсинга \ транскрипции – чтение с двух
сторон по 75\150 п.н.
2) Поли-А РНК - чтение с одного праймера, 50-75 п.н. – 20 млн. ридов.
3) Транскриптом de novo – максимально длинные чтения, поли-А РНК,
направленные библиотеки, 20-40 млн. ридов
4) Анализ микроРНК – 5-10 млн. ридов, чтение 36 п.н.
5) Single cell RNA-Seq – от 1 млн. ридов в стандартной методике до 100 тыс.
ридов в модификациях.

Пределы достоверности
Неравномерность
распределения
чтений по гену
Внутренний контроль –
ERCC spike-In

Прямое измерение уровня экспрессии с помощью методов
высокопроизводительного секвенирования
Относительная обеднённость/обогащённость определёнными последовательностями
в библиотеках
Неравномерность представленности фрагментов по длине транскрипта

Панели РНК наборов генов как замена RT-PCR
50 ампликонов ~150 п.н. длиной для
количественной оценки экспрессии генов

Изыскания на тему экспрессии генов

Экспрессия генов — процесс, в котором наследственная информация от гена (последовательности нуклеотидов ДНК) преобразуется в функциональный продукт — РНК или белок.

Первая, самая простая (хотя вообще-то, не очень простая), задача анализа экспрессии генов — выявление изменений экспрессии, связанных с конкретными условиями или воздействиями. Самый дешёвый способ получения данных для анализа — ДНК-микрочипы. На микрочип помещается матрица из ДНК-олигонуклеотидов (синтетических односпиральных НК), которые гибридизируются с комплементарными участками ДНК или РНК (см. кДНК, Гибридизация ДНК). Далее с помощью того или иного вида люминесценции измеряется (сканируется) количество гибридизированных ДНК в каждой точке чипа. Этот процесс повторяется на различных источниках или в различных условиях воздействия, откуда получаются экспреиментальные данные для дальнейшего анализа. Идея анализа заключается в том, что понимание того, какие гены меняют свою экспрессию в тех или иных условиях, может помочь в понимании процессов, происходящих при этих воздействиях в организме и/или клетке.

Задача анализа в целом статистическая, так как данные, полученные с микрочипов, имеют статистическую природу — например, они подвержены фоновому шуму, имеют выбросы, содержат не чистые, а коррелированные данные в случаях, когда два гена коэкспрессируют. Последнее является особенной проблемой, так как на сегодня наука находится лишь в начале понимания многих генетических процессов, и многие зависимости ещё не известны. Здесь обычно применяются два различных пути решения:

  1. Забить на корреляции и анализировать все гены отдельно друг от друга стандартными статистическими методами например, t-тестами Стьюдента. Плюс подхода — он применяется «в лоб». Минус подхода — низкая гипотетическая точность и необходимость проводить большое количество тестов.
  2. Выделить небольшое количество генов, представляющих интерес для конкретной биологической задачи, с известными взаимодействиями между ними, и проводить тесты с учётом этих взаимодействий.

Таким образом, задача обычно заключается в том, что нужно либо выяснить, какие гены не изменили экспрессию, либо наоборот — какие гены существенно изменили экспрессию.

Содержание

Постановка задач

Поиск наиболее стабильного гена

Берем группу экспериментов на клеточных линиях с разными воздействиями, проводим предобработку (переход от DataSeries к DataSet), далее, ищем гены, минимально меняющие свою экспрессиию. Нужна какая-то «метрика» стабильности (коэф.вариации?).

Задача важна с целью использования таких генов при негативных контролях. Интересно и то, что можно её «масштабировать»: работать с данными по одной линии или нескольким, менять широту воздействий — только гомоцистеин, гомоцистеин+другие агенты-индукторы стресса ЭР, предыдущие + другие виды стресса (тепловой, недостаток компонентов питания и т. д.). Важно и то, что результаты мы можем относительно легко проверить лабораторными методами (для 3-5 наиболее стабильных генов). Вообще о биологических задачах: Гомоцистеин и UPR.

Техническая часть: загрузка/сохранение «сырых» данных и функционал сравнения изменения экспрессии для двух «матриц» с такими данными, пока без особых изысков, возможно, что-то вроде обычной корреляции или относительного СКО.

Далее нужны тестовые реальные данные, для которых будет ясен верный ответ, и в случае неудовлетворительной работы алгоритма сравнения изменения экспрессии — его можно будет корректировать или выбрать другой. Критерием завершения (Definition Of Done) можно считать корректный результат для большинства этих данных.

Форматы

Ниже описаны некоторые общеизвестные форматы для хранения и обмена данными экспрессии генов.

Affymetrix CEL

Простой формат хранения низкоуровневых данных, а именно, изображения с ДНК-микрочипа. Ровно одного изображения. Состоит из заголовка и самого изображения. Заголовок содержит информацию о размерах, каким алгоритмом обработано, с какими параметрами и т. п. Каждая точка изображения содержит следующую информацию:

  • Яркость (возможно, усреднённая).
  • СКО яркости.
  • Количество пикселей, из которых получена усреднённая яркость.
  • Некий пользовательский флаг (точка «маскирована» или нет).
  • Флаг «является ли данная точка выбросом» (установленный алгоритмом обработки).

Заголовок хранится в INI-подобном текстовом виде (key=value), данные изображения — в бинарном виде после заголовка.

  • Описание формата Affymetrix CEL.
  • celintensityread, функция чтения CEL в Matlab.
  • Bio::Expression::MicroarrayIO::affymetrix — парсер CEL для Perl’а.

GPR — формат хранения низкоуровневых данных, производимый сканером GenePix. По содержимому похож на CEL, бинарных данных не содержит (полностью текстовый), также довольно простой.

Семейство MIAME

MIAME — аббревиатура для Minimum Information About a Microarray Experiment — «минимум информации об эксперименте на микрочипе». MIAME не является конкретным форматом, а лишь описывает, какую информацию должен включать уважающий себя эксперимент и, соответственно, уважающий себя формат, в котором передаются данные этого эксперимента.

Конкретные форматы — это 2 GEO'вских: SOFT, MINiML, и 2 MGED'шных: MAGE-ML, MAGE-TAB.

MGED: MAGE-ML и MAGE-TAB

MAGE-ML «не взлетел», ибо монструозен и на «минимум информации» претендовать может разве в качестве издёвки. Причина этого кроется в том, что авторы его сильно любят UML и объектную ориентированность, что и привело к существованию 25 различных сущностей, связанных друг с другом различными отношениями (наследования и т. п.). MAGE-TAB более молодой и простой, текcтовый, взлетит ли — посмотрим, но есть подозрение, что тоже вряд ли, ибо содержит все те же данные, что и MAGE-ML (в конечном счёте всё маппится на объектный MAGE-OM), но в виде plaintext таблиц, форматированных Tab’ами. Хоть бы CSV выбрали, что ли — чего велосипед изобретать. Масла в огонь подливает и то, что различные MAGE-TAB файлы могут выглядеть совершенно по-разному в зависимости от данных, которые содержат.

GEO: SOFT и MINiML

Банк данных Gene Expression Omnibus использует свои форматы (правильно, они же не мазохисты) — SOFT и MINiML (второй произносится «минимал»). SOFT текстовый, а минимал — XML’ный. Данные при этом они содержат, по сути, одни и те же.

Минимал, как ни странно, действительно минимал, всё его описание влезает в несколько экранов. MINiML включает в себя всего три базовых типа объектов:

  • «Platform» — описание эксперимента (содержимое описания).
  • «Sample» — одна гибридизация.
  • «Series» — данные эксперимента, включающие в себя несколько Sample’ов.

Банк Gene Expression Omnibus, содержит в основном сырые данные, полученные обычно либо с тех или иных микрочипов, либо методами SAGE (Serial Analysis of Gene Expression), MPSS (Massively Parallel Signature Sequencing). Иногда попадаются обработанные заданным алгоритмом данные, и всегда присутствует пометка, каким именно алгоритмом. Полный список типов данных, принимаемых в GEO, можно увидеть по ссылке.

Транскриптомика – как следует из ее названия – наука о транскриптоме. Транскриптомом называют совокупность всех транскриптов, которые синтезируются в. - презентация

Презентация на тему: " Транскриптомика – как следует из ее названия – наука о транскриптоме. Транскриптомом называют совокупность всех транскриптов, которые синтезируются в." — Транскрипт:

2 Транскриптомика – как следует из ее названия – наука о транскриптоме. Транскриптомом называют совокупность всех транскриптов, которые синтезируются в одной клетке или группе клеток (в том числе мРНК и некодирующие РНК). Понятие «транскриптом» может обозначать полный набор транскриптов, синтезируемых в данном организме, или специфический набор транскриптов (молекул РНК), представленный в клетках определенного типа. Если геном у всех клеток одной линии, как правило, одинаков, то транскриптом может быть весьма изменчив и зависит от условий окружающей среды. Понятие «транскриптом» отражает профиль экспрессии генов в данный момент времени, поскольку включает в себя все транскрипты данной клетки. Понятие о транскриптоме и транскриптомике

3 Актуальность Цель транскриптомики – определение, описание механизмов регуляции экспрессии генов. Сегодня благодаря появлению и совершенствованию методов транскриптомики получен огромный массив данных о закономерностях контроля экспрессии генов в самых разных аспектах. Получена масштабная информация о влиянии различных факторов на активность генома. Появляется все больше информации о тканеспецифичных уровнях экспрессии всех генов во всех тканях человека и других животных.

4 Задачи транскриптомики Исследование структуры и динамики транскриптом, лежащих в основе формирования второго уровня фенотипа – протеома клеток, тканей и т.д., является задачей транскриптомики. Некоторые задачи транскриптомики в то же время являются также и задачами функциональной геномики – в той мере, в какой информация, необходимая для формирования структуры транскриптом, закодирована в геноме и может быть выявлена при его изучении. Задачи функциональной геномики, перекрывающиеся с задачами транскриптомики, заключаются в выявлении и исследовании условий для формирования характерной для клеток определенных типов структуры транскриптом, предопределенной генетическими программами развития, т.е. зашифрованными в геноме сигналами.

5 Собственные задачи транскриптомики состоят в выявлении и изучении не зависящих от геномных сигналов факторов, влияющих на формирование структуры и динамики транскриптом, и, в конечном счете, протеома. В целом, к задачам транскриптомики относятся: – выявление всех транскрипционных единиц, включая мРНК, некодирующие РНК и малые РНК; – анализ транскрипционной структуры генов - сайтов инициации транскрипции, 5- и 3-концов генов; – анализ паттернов сплайсинга и других посттранскрипционных модификаций.

6 Методы исследования транскриптом Существует несколько распространенных методов для широкомасштабного исследования транскриптом – «серийный анализ экспрессии генов» - Serial analysis of gene expression (SAGE), «прочитанные фрагменты экспрессированных последовательностей» - Expressed Sequence Tags (ESTs), «Массовое одновременное секвенирование характерных фрагментов» Massively Parallel Signature Sequencing (MPSS).

7 Метод ДНК Microarray (ДНК- микро матрицы) Одним из наиболее распространенных современных методов, позволяющих сравнивать транскриптомные профили, является метод ДНК Microarray (ДНК- микро матрицы), заключающийся в использовании фиксированных на твердом носителе (чипе) в определенном порядке большого числа строго определенных олигонуклеотидов, с которыми осуществляется взаимодействие (гибридизация) анализируемого пула кДНК. Поскольку на одном чипе можно поместить более тысячи различных олигонуклеотидных зондов (даже более ), это дает возможность анализировать одновременно уровень и паттерн большого количества кДНК. Далее профиль транскриптов анализируется с помощью кластерного анализа.

8 Серийный анализ генной экспрессии (SAGE). Другой современный подход, применяющийся для анализа уровня транскриптов большого количества генов, – серийный анализ генной экспрессии (SAGE). Его основные этапы - выделение тегов, соединение их в протяженные ряды и их массовое секвенирование. Полученные тексты обрабатывают компьютерными методами и с помощью подсчета коротких одинаковых последовательностей получают количественные данные о распределении транскриптов многих тысяч генов для разных образцов. Появление новых технологий секвенирования (NGS), основанных на детекции продуктов с помощью лигазной реакции (платформа Solid), при освобождении пирофосфата в ходе роста цепочки нуклеотидов (Roshe), флуоресценции меченого нуклеотида в результате синтеза нуклеотидной последовательности (платформа Illumina) позволили значительно упростить применение данного метода для исследования транскриптонов различных организмов.

9 Анализ прочитанных фрагментов экспрессированных последовательностей (EST). Другой современный метод оценки транскриптом различных организмов – анализ прочитанных фрагментов экспрессированных последовательностей (EST). Основные этапы метода заключаются в синтезе кДНК, однонаправленном клонировании, создании библиотеки кДНК-клонов, частичном секвенировании каждого клона с двух сторон - получении EST, кластеризации и выравнивании EST, генерировании консенсусов, реконструирующих структуру транскриптов. Чаще всего этот подход используется для создания ДНК-зондов, которые в дальнейшем используются для анализа уровня транскриптов генов методом Microarray.

10 Наиболее удачная и эффективная до недавнего времени техника – анализ на микрочипах. Но достижения технологий последних лет открывают новые горизонты транскриптомики, и в основном это связано с развитием второй ветви технологий транскриптомики – секвенирования.

11 Олигонуклеотидные микрочипы В 1988 г. группой ученых Института молекулярной биологии им. В.А. Энгельгардта РАН, руководимой А.Д. Мирзабековым, была инициирована разработка олигонуклеотидных микрочипов (micro­chip), иначе называемых олигонуклеотидными микро матрицами (microarray). Целью этого исследования была разработка метода, позволяющего секвенировать короткие фрагменты ДНК путем гибридизации с олигонуклеотидами известной последовательности, которые иммобилизованы на твердом носителе в строго определенном порядке (это и называется микро матрицей или микрочипом). В дальнейшем благодаря созданию специального оборудования удалось роботизировать процесс получения микрочипов с нанесением в строго определенном порядке микроколичеств олигонуклеотидов или фрагментов ДНК (кДНК) на твердый носитель (обычно используют стекло, нейлоновые мембраны, силиконовые поверхности и др.). Это позволило создавать микро матрицы, содержащие на поверхности в несколько квадратных сантиметров сотни и тысячи индивидуальных проб для последующей гибридизации. Препараты ДНК, предназначенные для гибридизации на микрочипе, флуоресцентно метят, обычно в процессе ПЦР. После гибридизации и отмывки микрочип анализируют с помощью лазерного сканера и данные флуоресценции каждой ячейки микро матрицы подвергают компьютерной обработке, используя специальное программное обеспечение.

12 Секвенирование многочисленных кДНК и полных геномов все расширяющегося спектра организмов создало базу для получения микрочипов, позволяющих одновременно изучать экспрессию большого числа генов на уровне целого генома. Современных метод исследования транскриптом – использование гибридизации кДНК с упорядоченными олигонуклеотидными зондами, организованными в виде биочипов высокой плотности (tiling arrays).

14 Плюсы и минусы биочиповых технологий В принципе, биочиповые технологии позволяют проводить до 109 индивидуальных гибридизаций на одном чипе и получать уникальную информацию об особенностях транскрипции больших геномов, в том числе, осуществлять картирование транскриптов с разрешением в несколько п.н. Несмотря на выдающиеся возможности биочиповых технологий, они не лишены ряда недостатков, среди которых необходимо отметить значительную стоимость индивидуальных экспериментов, необходимость знания последовательностей нуклеотидов анализируемого генома, высокий фон от неспецифических перекрестных гибридизаций, а также ограниченный диапазон количественных измерений уровней транскрипции генов, связанный с вышеупомянутым фоном и быстрым насыщением гибридизационного сигнала.

15 Новые инструменты транскриптомики: RNA-Seq Методология RNA-Seq (RNA sequencing) успешно конкурирует с биочиповыми технологиями в исследованиях транскриптом. Основное преимущество этого подхода заключается в непосредственном определении последовательностей нуклеотидов исследуемых кДНК высокопроизводительными методами NGS и прямом подсчете индивидуальных молекул кДНК в исследуемых образцах. RNA-Seq позволяет как картировать транскриптом, так и количественно оценивать уровни транскрипции индивидуальных участков генома.

16 Принцип RNA-Seq Принцип RNA-Seq заключается в глубоком секвенировании кДНК с добавленными адаптерами на одном или обоих концах кДНК. Секвенирование при RNA-Seq производится не по Сэнгеру, а с помощью секвенирования следующего поколения (NGS). Каждая молекула секвенируется (с амплификацией или без нее) с одного или двух концов на высокопроизводительных платформах. В результате секвенирования получаются риды (Рид (read) – короткая нуклеотидная последовательность) длиной нуклеотидов. Затем риды или выравниваются на рефренсном геноме или рефренсных транскриптах, или осуществляется сборка de novo без рефренсной последовательности. В результате получаются полно геномные транскрипционные карты, включающие качественные (в т.ч. структурные) и/или количественные характеристики экспрессии каждого гена.

17 Плюсы и минусы RNA-Seq Применение RNA-Seq-методов в функциональной транскриптомике, в принципе, не требует знания первичной структуры исследуемых геномов и позволяет выявлять структурные варианты (например, SNP) транскриптов. Кроме того, для этой группы методов, в отличие от биочиповых технологий, характерен очень низкий уровень фоновых сигналов. Основными же их недостатками являются артефакты, связанные с приготовлением библиотек кДНК и оставляющая желать лучшего эффективность методов биоинформатики, разработанных для анализа больших массивов данных.

18 Заключение В фундаментальном плане развитие техник транскриптомики позволяет лучше понять не только мир РНК и его особенности в клетках различных тканей и у разных организмов. Методы полного профилирования транскриптом позволили выявить (на сегодняшний день) у человека РНК, не кодирующих белок, а также качественное разнообразие транскрипции белок-кодирующих генов. Вся эта информация оказывается чрезвычайно важной для понимания молекулярной биологии клетки, так как именно на основе выявления методами транскриптомики читаемых участков ДНК делается вывод о закономерностях регуляции работы генома. В области биомедицины данные о закономерностях экспрессии генов используются для выявления нарушений течения клеточных процессов при патологиях. В последнее десятилетие транскриптомика широко применялась для изучения молекулярных основ развития огромного количества заболеваний, и транскриптомика оказывается эффективной для изучения групп патологий, для которых характерна высокая этиологическая гетерогенность при сходстве фенотипической манифестации.

Идентификация генов человека, экспрессия которых меняется при инфекции вирусом клещевого энцефалита Гаврилов Борис Гавриилович

Идентификация генов человека, экспрессия которых меняется при инфекции вирусом клещевого энцефалита

Гаврилов Борис Гавриилович. Идентификация генов человека, экспрессия которых меняется при инфекции вирусом клещевого энцефалита : диссертация . кандидата биологических наук : 03.00.03.- Москва, 2003.- 101 с.: ил. РГБ ОД, 61 03-3/1421-1

Содержание к диссертации

ПОДХОДЫ К АНАЛИЗУ ИЗМЕНЕНИЯ ЭКСПРЕССИИ КЛЕТОЧНЫХ ГЕНОВ ПРИ ВИРУСНЫХ ИНФЕКЦИЯХ (ОБЗОР ЛИТЕРАТУРЫ) - [7]

Культуры клеток и объект анализа изменения экспрессии клеточных генов - пул мРНК (кДНК)-[10]

Исследование экспрессии клеточных генов с использованием микроматриц (микрочипов) ДНК - [12]

Серийный анализ генной экспрессии (SAGE) - [19]

Метод дифференциального дисплея - [23]

Метод вычитающей гибридизации - [30]

Подтверждение дифференциальной транскрипции - [46]

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ И ИХ ОБСУЖДЕНИЕ - [49]

Стратегия, использованная для поиска дифференциально экспрессирующихся генов в инфицированных вирусом клещевого энцефалита клетках человека - [50]

Описание метода SSH- [50]

Селективная амплификация обогащенной фракции - [53]

Вычитающая гибридизация. Создание и анализ обогащенных кДНК библиотек - [56]

Идентификация и подтверждение дифференциальной экспрессии транскриптов генов IFI-54KMIFI-56K- [60]

Поздняя индукция генов IFI-54K и IFI-56K - [64]

Разработка метода дифференциального скрининга полученных после супрессионной вычитающей гибридизации библиотек кДНК и создание высокообогащенных или упрощенных библиотек на их основе - [67]

Описание модельной системы — [68]

Исследование кинетики ренатурации фрагментов кДНК вычтенной библиотеки с целью определения условий, необходимых для удаления фоновых молекул - [68]

Подход с использованием экзонуклеазы ЕхоШ- [70]

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ - [76]

Оборудование и расходные материалы - [76]

Среды и растворы - [78]

Клетки и вирусы - [81]

Получение РНК- [81]

Электрофорез в агарозном геле - [81]

Очистка олигонуклеотидных праймеров - [82]

PCR ампплификация - [82]

Структура праймеров, используемых в PCR-амплификациях - [83]

Очистка фрагмента ДНК в агарозном геле - [84]

Southern- Dot- и Northern-блот гибридизация - [84]

Создание упрощенных/высокобогощенных зондов и вычтенных библиотек - [84]

Трансформация Е. Coli - [87]

Вычитающая гибридизация — [87]

Определение первичной структуры ДНК— [89]

СПИСОК ЛИТЕРАТУРЫ - [91]

Введение к работе

Вирусные инфекции являются одной из основных причин заболеваемости и смертности. Потенциальная возможность появления новых опасных вирусных инфекций наряду с несовершенными противовирусными препаратами, которые имеются в современном арсенале медицины, требует создания новых эффективных средств защиты.

Для создания таких средств, необходимо глубокое понимание механизмов взаимодействия вирусов с клеткой, как основой организма, и выявление основных компонентов противовирусных защитных систем клетки и организма. Такие исследования служат основой для выработки новых подходов к профилактике и лечению вирусных заболеваний.

Следует отметить, что клетки человека все шире используются для решения такого рода задач. Культура изолированных соматических клеток человека открывает возможность изучения болезней человека "в пробирке". Микромасштаб исследований позволяет изучать "следы" и "проявления" болезни в стерильной посуде, содержащей 105-10б клеток. Оказалось, что многие болезни человека имеют специфичные клеточные изменения (болезни репродуктивной системы, эндокринная патология, старение, вирусные, нейрогенные, сердечно-сосудистые заболевания). Начались испытания органотропных лекарств на культуре клеток органов человека. Скрининг органотропных препаратов идет эффективнее и быстрее в микромасштабе культуры по сравнению с соответствующими испытаниями на животных. Многие фирмы используют культуры клеток человека для экспресс-скрининга лекарств, поскольку такие испытания более экономичны, оперативны и информативны.

Первичные культуры соматических клеток человека широко используются для опытов по генной и олигонуклеотидной терапии, подбора векторов для переноса информационных молекул в клетки, а также для создания устойчивых стандартизированных клеточных линий с постоянными характеристиками. В дальнейшем такие линии, по-видимому, станут важным инструментом в лечении болезней человека и будут распространяться клеточными банками по медицинским учреждениям [Сухих, 1998; Репин и др., 1998].

Изменение экспрессии клеточных генов при вирусной инфекции может вызываться как непосредственно, путем воздействием вирусных продуктов на регуляторные системы клетки, так и опосредованно путем, воздействия на эти системы клеточными же продуктами, индуцированными предварительно вирусами.

В свою очередь хозяйские гены участвуют в регуляции экспрессии вируса и продуктивная экспрессия генов у некоторых вирусов зависит, например, от факторов, регулирующих экспрессию генов интерферона первого типа (как это имеет место, например, при инфекции вирусом иммунодефицита человека) [Thornton et al., 1996]. Клеточные гены, индуцируемые вирусами, могут быть существенными для вирусной репликации [Wasylyk et al., 1988].

Основой в понимании этих механизмов на клеточном уровне, является понимание динамики картины экспрессии генов и ее регуляции, в ходе вирусной инфекции. Однако в большинстве случаев спектры генов клетки-хозяина, меняющих экспрессию, изучены недостаточно. Это связано с одной стороны с недостаточной информацией о генной структуре геномов, особенно о функциональной роли различных генов, а с другой стороны с трудностью анализа изменений экспрессии на полногеномном уровне. Это в полной мере относится к исследованиям флавивирусов, в частности вирусу клещевого энцефалита, которому посвящена данная работа. Подходы, используемые для идентификации клеточных генов, изменяющих свою экспрессию при заражении клетки вирусом, рассматриваются в этом обзоре.

Олигонуклеотидные микрочипы. Метод SAGE

Современные ДНК-матрицы являются высокочувствительным и точным аналитическим инструментом для научного исследования различных аспектов биологии клеток. Технология ДНК-матриц находит все более широкое применение в фундаментальных и прикладных исследованиях и может использоваться в диагностике.

Основной задачей постгеномной эры исследований является использование информации о структуре генома для анализа биологических процессов в масштабах всего генома, а также поиска, установления и уточнения функций различных генов. Хотя молекулярная биология традиционно использует редукционный подход для решения биологических задач, давно известно, что экспрессия генов осуществляется путем их взаимодействия друг с другом, причем характерной особенностью процессов взаимодействия является их частая пространственная и временная разделенность. Для полного понимания биологии этих процессов молекулярные взаимодействия необходимо изучать через структуру всего генома. Современные биологические ДНК-матрицы являются высокочувствительным и точным аналитическим инструментом получения и обработки большого количества информации с тем преимуществом, что одновременно и быстро анализируется огромное количество образцов различного биологического материала. Благодаря своим особенностям технология ДНК-матриц все чаще применяется в фундаментальных и прикладных исследованиях, а также может быть использована в диагностических целях. Так, применение ДНК-матриц в научных исследованиях различных аспектов биологии клеток позволяет проводить мониторинг экспрессии всех генов одновременно. Такой метод обеспечивает более целостный подход к изучению клеточной физиологии, тем самым дополняя традиционный "gene-by-gene"подход.

Теоретическая основа для создания биологических матриц появилась достаточно давно. Вскоре после того, как Джеймс Уотсон и Френсис Крик впервые сделали описание двойной спирали ДНК, было показано, что ДНК при нагревании или после обработки щелочью денатурируется, т.е. двойная спираль расплетается с образованием двух одноцепочечных фрагментов ДНК. Обратный процесс, лежащий в основе всех методов, включающих в себя ренатурацию и молекулярную гибридизацию, впервые был описан в 1961 году, когда было показано, что две последовательности ДНК, вовлеченные в образование дуплекса, должны обладать свойством комплементарности, и стабильность образованного дуплекса напрямую зависит от степени комплементарности образовавших его последовательностей. Благодаря открытию принципа комплементарной гибридизации нуклеиновых кислот представилась возможность анализировать степень сродства (гомологии) различных нуклеиновых кислот, стали быстро развиваться и использоваться для решения различных биологических задач методы, основанные на молекулярной гибридизации.
Одним из таких методов является технология ДНК-матриц, в основе которой лежит принцип специфической гибридизации фрагментов ДНК. Суть метода заключается в параллельной гибридизации смеси меченых нуклеиновых кислот (мишеней) с тысячами специфичных фрагментов нуклеиновых кислот (зондами), индентифицируемых пространственным положением в отдельных ячейках на матрице, в одном эксперименте. С помощью ДНК-матриц возможно получение полной и точной картины экспрессии генов в анализируемых образцах. В среднем в клетке постоянно используется только часть генов, в то время как оставшиеся репрессируются на транскрипционном или, что менее вероятно, на трансляционном уровне. Транскрипционный анализ, осуществляемый посредством экспрессионного профилирования на ДНК-матрицах, позволяет судить о процессах, происходящих в клетке, включая каскады биохимических реакций, различные регуляторные механизмы, а также механизмы патогенности (рис.1).
В течение последних лет были разработаны разнообразные методы детекции и количественного определения уровня экспрессии генов, такие как Northern Blotting,
S1-эндонуклеазный анализ гетеродуплексов, Differential Display RT-PCR, тотальное кДНК-секвенирование, серийный анализ экспрессии генов (SAGE), среди которых и два метода на основе матриц – ДНК и олигонуклеотидных. Каждая из перечисленных технологий имеет свои преимущества и ограничения. Однако ДНК-матрицы обеспечивают наиболее эффективный способ сравнения уровнейэкспрессии тысяч генов при исследовании несколькихобразцов.
ДНК-матрицы представляют собой упорядоченную систему фрагментов нуклеиновых кислот, соответствующих определенным генам и находящихся в определенной позиции на матрице, которой может служить нейлоновая мембрана, стеклянная подложка или силикон. ДНК-микроматрицы содержат десятки тысяч элементов размером ~100 мкм в диаметре на стеклянной поверхности площадью в несколько квадратных сантиметров. Плотность нейлоновых матриц чуть меньше: тысячи ген-специфичных фрагментов ДНК (зондов) размещаются на поверхности, по площади не намного превосходящей стеклянные чипы.
В настоящее время в экспрессионном профилировании широко применяются 3 типа ДНК-матриц. Первый тип – это ДНК-матрицы, в которых пробы синтезируются in situ, то есть непосредственно на поверхности чипа. В двух других типах матриц пробы синтезируются независимо и затем наносятся на химически модифицированные стеклянные поверхности чипов. Природа проб позволяет их классифицировать, как двуцепочечные ДНК-матрицы (второй тип) и олигонуклеотидные ДНК-матрицы (третий тип).
Наиболее известными ДНК-матрицами, в изготовлении которых используется in situ-технология, являются матрицы GeneChip, выпускаемые компанией Affymetrix. Химический синтез олигонуклеотидных проб осуществляется на поверхности кварцевого стекла. Эта технология обеспечивает высокоплотное размещение проб – порядка 500 000 на одной ДНК-матрице размером 1,28х1,28 см. Для изготовления матриц GeneChip используется комбинация уникального метода фотолитографии (аналогичный метод используется для производства структур в микроэлектронике) и методов комбинаторной химии. Так как25-мерные последовательности слишком короткие для ген-специфичной гибридизации, каждая проба (match) сопровождается отрицательным контролем с одним отличным основанием в центре 25-мерной нуклеотидной цепи (mismatch). Такая пара проб используется для детекции и предотвращения кросс-гибридизации. Сеть олигонуклеотидов из 11-15 проб (перфектов) и такого же числа парных олигонуклеотидов с заменами (мисматчей) представляют один ген. Высокая плотность размещения проб на такой матрице позволяет иметь большое количество контролей. Автоматизированный процесс изготовления матриц GeneChip гарантирует высокую воспроизводимость результатов и позволяет варьировать условия проведения каждого эксперимента, тогда как обычно ДНК-матрицы гибридизируются с двумя различными флуоресцентно-мечеными мишенями (в качестве метки используется пара Cy-3/Cy-5), чипы Affymetrix – с одной меченой мишенью. Это позволяет использовать различные методы для мечения ДНК-мишеней, упрощает исследования и статистическую обработку результатов.
Для независимого синтеза ДНК-зондов, среди которых выделяют двухцепочечные фрагменты ДНК и олигонуклеотиды, используются различные методы. Один из них – полимеразная цепная реакция – позволяет получить ген-специфичные ампликоны размером от нескольких сотен до нескольких тысяч пар оснований. Обычно, используя специфические праймеры, амплифицируют открытые рамки считывания, представляющие собой потенциальные белок-кодирующие последовательности. Оптимальная длина ампликонов для иммобилизации на ДНК-матрицах составляет 200-800 пар оснований, хотя фрагменты длиной до 1,3 тысяч пар оснований также используются. В таких матрицах каждый ДНК-зонд соответствует одному гену.
Двухнитевые фрагменты ДНК наносятся на положительно заряженную поверхность ДНК-матриц. Для модификации поверхности матриц обычно используется полилизин (poly-L-lysin) или 3-аминопропил-триметоксисилан (APS). Иммобилизация фрагментов ДНК на поверхности матрицы осуществляется благодаря электростатическому взаимодействию отрицательно заряженного фосфатного остова нуклеиновой кислоты и положительно заряженной поверхности матрицы, а также за счет образования ковалентных связей между остатками тимина и аминогруппами, расположенными на поверхности матрицы, при облучении ультрафиолетом. Среди преимуществ изготовленных таким образом матриц следует отметить высокую специфичность при гибридизации, высокую чувствительность и их низкую стоимость. В качестве альтернативы некоторые коммерческие поставщики предлагают большие коллекции 50-80-мерных олигонуклеотидов, синтезированных фосфорамидным методом. И в том, и в другом случае автоматическая локализация ДНК-зондов, находящихся в специальном буфере, на химически модифицированную поверхность матрицы осуществляется механическими роботами. Существуют две технологии нанесения: контактная и бесконтактная. Контактные роботы-принтеры наносят ДНК-зонды на поверхность матриц пинами различной формы (рис. 2), которые погружаются в раствор и переносят маленькие капельки специфических ДНК-зондов на поверхность матрицы. Размер локализованных таким образом ДНК-зондов составляет всего 150 мкм в диаметре. Бесконтактные принтеры используют технологию типа струйного принтера. Основное преимущество таких матриц – их стандартные размеры, что обеспечивает широкий выбор роботов-принтеров, оборудования для проведения гибридизации, лазерных сканеров и программного обеспечения для обработки результатов эксперимента. Исторически первым было изготовление ДНК-матрицы на предметном стекле, поэтому размер матриц 25x75 мм и толщина 1,0-1,2 мм не изменились. Однако плотность размещения ДНК-зондов на таких матрицах ниже по сравнению с матрицами Affymetrix – порядка 10 000-30 000 ДНК-зондов.
Для проведения эксперимента по транскрипционному профилированию готовые ДНК-матрицы гибридизируются со смесью меченой кДНК, полученной в результате реакции обратной транскрипции из мРНК изучаемых образцов. Каждый образец метится либо флуоресцентной (обычно используется пара Cy-3/Cy-5), либо радиоактивной меткой. Если мишени метятся радиоактивным методом, то можно провести только одну гибридизацию в эксперименте. Однако существует проблема подобного "одноканального" эксперимента – вариации в интенсивностях сигналов в пределах одного эксперимента влияют на конечную относительную экспрессионную картину. Эта проблема была решена с появлением "двухканальных" экспериментов, где два исследуемых образца РНК, один из которых, например, выступает в качестве контрольного, флуоресцентно метятся и одновременно гибридизируются с одной матрицей (рис.3). Для двухканального эксперимента мРНК выделяется из двух типов клеток, и один образец метится Сy-3, другой – Cy-5. Можно отметить, что наиболее распространено прямое мечение, когда метка является частью нуклеозид-трифосфата, например, Cy-3 диоксицитозин трифосфат (Cy-3 dCTP) или Cy-3 диоксиуридин трифосфат (Cy-3 dCTP). В случае радиоактивного мечения используются нуклеотиды, содержащие радиоактивный фосфатный остаток (обычно P33). Таким образом, мечение осуществляется путем встраивания нуклеотидов в кДНК в процессе ее синтеза.
Локализуясь в ходе гибридизации на матрице, анализируемые кДНК формируют детектируемые ген-специфичные сигналы – паттерны гибридизации, которые считываются конфокальным лазерным сканером. Для возбуждения поверхности гибридизированных ДНК-матриц в большинстве сканеров используются лазеры с разрешающей способностью в несколько микрон. Разрешающая способность сканера (устройство для сканирования показано на рис. 4) должна превышать величину, равную 10% от размеров локализации ДНК-зонда на матрице, то есть в случае зонда диаметром 150 мкм разрешение при сканировании должно быть, по крайней мере, 15 мкм. В результате сканирования получается изображение в формате TIFF для каждого канала (Cy-3/Cy-5) или GEL (при радиоактивном мечении).
Использование экспрессионных ДНК-матриц для анализа экспрессии всех генов становится все более актуальным в связи с появлением все большего числа полных геномных последовательностей для различных микроорганизмов, поскольку позволяет выявлять закономерности в экспрессии генов. Кроме того, несмотря на то, что ДНК-матрицы широко применяются при мониторинге экспрессии генов для определения их функции и состояния клеток, их также используют для определения числа копий ДНК, генетических мутации и детекции однонуклеотидных полиморфизмов.
В заключение можно привести несколько примеров успешного использования ДНК-матриц для фундаментальных и практических работ. В 2005 г. в журнале Science группой исследователей из компании Perlegen были опубликованы результаты генотипирования 1586383 полиморфизмов единичного нуклеотида (SNP) среди американцев, африканцев и азиатов. Было показано, что помимо общих SNPs (порядка 1200000), для каждой популяции можно выделить группу уникальных полиморфизмов, встречающихся только в определенной популяции. Полученные данные позволяют понять, почему те или иные заболевания встречаются только в определенных популяциях.
Для проведения анализа были сконструированы 49 высокоплотных олигонуклеотидных матриц, каждая из которых была предназначена для выявления 48 000 SNP. Работа была проведена в течение 1 месяца, в то время как использование традиционных методов определения полиморфизма единичных нуклеотидов заняло бы не менее 8 месяцев. В настоящее время компаниями Solexa и Helicos Biosciences предприняты попытки создания технологий на основе ДНК-матриц для определения нуклеотидной последовательности генома человека (порядка 3 млрд. нуклеотидов). Предполагается, что данные технологии позволят снизить стоимость определения генома человека с 15 млн. долл. (исследование занимает 6 месяцев) до 10 тыс. долл. в 2008 году и до 1000 долл. в 2010 году (исследование будет занимать одну неделю).
Одним из интересных направлений исследований является использования ДНК-матриц для открытия новых биологических маркеров различных заболеваний. Например, остро стоит проблема поиска ранних маркеров отторжения пересаженного органа. К сожалению, доступные на сегодняшний день методы (например, иммуногистохимия биопсий трансплантанта) позволяет зафиксировать признаки отторжения на поздних стадиях, что требует значительной иммуносупрессивной терапии. Технология ДНК-матриц является одним из методов выбора, позволяющих найти прогностические маркеры, с помощью которых можно достаточно точно оценить состояние трансплантанта в начальной стадии изменений, и, таким образом, своевременно провести корректировку трансплантанта с помощью незначительной терапии. С помощью этой технологии определен список потенциальных маркеров для ряда заболеваний, которые могут быть использованы в клинической практике.
Перспективы многопараметрического анализа на основе ДНК-матриц в настоящее время связаны с бурным развитием в области нанотехнологий. Прогресс в исследовании геномов обеспечивает значительное увеличение информации относительно механизмов заболеваний, роли целевых генов и белков в патогенезе, а, следовательно, приводит к тому, что все больше дополнительной информации (генов) должно добавляться к индивидуальным ДНК-матрицам. Это может быть достигнуто за счет уменьшения размеров ген-специфических фрагментов ДНК (зондов) до одного микрона или меньше. Обычные системы нанесения ДНК на матрицу позволяют формировать ДНК-матрицу, состоящую из элементов (зондов) размером 100 мкм, в то время как на коммерческих фотолитографических установках можно получать элементы размером до 20 мкм. Недавно NanoInk продемонстрировал DPN (Dip Pen Nanolithography) технологию, с помощью которой можно формировать элементы размером один микрон и меньше.
Известно, что затраты производства микроэлектронных компонентов при использовании фотолитографического процесса растут экспоненциально с уменьшением размеров элементов. Прямое изготовление ДНК-матриц с помощью DPN-технологии позволяет снизить эти производственные затраты и увеличить гибкость дизайна ДНК-матриц.
В настоящее время разработаны методы мягкой литографии, позволяющие иммобилизовать единичные молекулы ДНК на подложку, что делает возможным создание ДНК-наноматриц размером меньше 100 мкм (рис. 5). Потенциально, небольшие количества биологических материалов, как известно, имеют более быструю кинетику и более высокую чувствительность. Вероятно, что нанотехнологии будут использоваться для создания ДНК-чипов следующего поколения.

Читайте также: