Добыча сырья для создания молекулярных маркеров

автор: Михаил БУДЫЛИН, к.б.н., заместитель генерального директора по молекулярной диагностике и биотехнологии

Маркер-ориентированная селекция (MAS) является эффективным инструментом ведения современной селекции, позволяя целенаправленно создавать высокотехнологичные и конкурентоспособные F1 гибриды, группируя несколько признаков интереса в одном генотипе. 

Постоянно изменяющиеся потребности потребителей делают этот процесс динамичным не только со стороны создания новых гибридов, но и со стороны создания новых маркеров для MAS. Регулярно появляются новые признаки интереса как, например, гены устойчивости к новым заболеваниям. Они заставляют селекционно-семеноводческие компании находить новых доноров устойчивости и осуществлять картирование новых генетических детерминант. Именно благодаря этой особой группе подходов, складывающихся в картирование признаков, ученые получают информацию, необходимую для создания новых молекулярных маркеров.

Практика картирования и генотипирования широко распространена в западных странах. Однако наша страна сильно отстает в данном направлении от зарубежных производителей семенной продукции. И с каждым годом это отставание увеличивается в силу таких факторов, как коммерческая тайна. Научные статьи сменяются патентами, а крупные научные работы в данной области спонсируются коммерческими компаниями, что приводит к конфиденциальности полученных данных. Для того, чтобы гарантировать конкурентоспособность отечественной семенной продукции в будущем, необходимо уже сейчас осваивать полный технологический цикл создания молекулярного маркера от поиска доноров устойчивости до кодоминантного маркера, пригодного для MAS.

Именно поэтому селекционно-семеноводческая компания «ГАВРИШ» в содружестве со Сколтехом, Генотеком и при поддержке Высшей Школы Экономики развивает пилотный проект по картированию новых признаков в геномах томата и огурца.

Процесс картирования невероятно сложен и трудоемок. На первом этапе необходимо определить доноров гермплазмы с признаком интереса. В случае генов устойчивости, это создание искусственного инфекционного фона и эффективная фенотипическая оценка дикорастущих видов и староместных сортов. Как правило, у анализируемых образцов должен присутствовать высокий уровень гомозиготности. После успешного определения доноров устойчивости проводится серия скрещиваний между контрастными по признаку интереса формами, чтобы получить картируемую популяцию. Данная популяция считается ключевым ресурсом для картирования, так как используется для идентификации генетических локусов, которые влияют на экспрессию фенотипов, и для определения рекомбинационного расстояния между локусами. Вторым этапом является генотипирование. Этот подход основан на создании большого количества молекулярных маркеров, которые равномерно покрывают каждую хромосому кариотипа. Когда маркеры распределены с достаточной плотностью, как минимум два из них, по теории вероятности, окажутся в непосредственной близости от локуса, сопряженного с признаком интереса. Это будет означать, что во время рекомбинации, маркеры будет наследоваться сцеплено с признаком интереса. Именно на этом и основано картирование признака. 

Современные технологии высокопроизводительного секвенирования следующего поколения (NGS) и доступные сборки аннотированных геномов позволяют производить майнинг полиморфизмов (однонуклеотидный полиморфизм (SNP) / вставка или удаление нескольких нуклеотидов (InDels)) и генерацию маркеров в необходимых масштабах. Маркеры для генотипирования должны быть ко-доминантными. Это позволяет отслеживать аллели из гомозиготных контрастных форм в расщепляющемся поколении и оценивать события рекомбинации. Одновременно с генотипированием расщепляющегося поколения проводится его фитопатологическая оценка. На третьем этапе генотип образцов из расщепляющегося поколения сравнивается с фенотипом. В идеале, как минимум, два маркера должны достоверно коррелировать с фенотипической оценкой. При этом маркеры с отсутствием корреляции отбраковываются. Через частоту рекомбинаций определяется расстояние между маркером и признаком интереса.

Для моногенных признаков корреляция определяется сравнительно легко. Для полигенного наследования используются специализированные программы, такие как Tassel. Это определяет дальнейшую стратегию исследования. Чаще всего для каждого признака интереса или же локуса, отвечающего за значимую дисперсию признака, определяются два маркера, расположенных вверх и вниз по течению гена/QTL. Говоря другими словами, фиксируется локус, в котором генетическая детерминанта признака интереса расположена между двумя маркерами. Это может быть достаточно большой фрагмент хромосомы в миллионы пар оснований. Однако необходимо понимать, что благодаря этому исследователь понимает в какой хромосоме и в каком плече расположен признак интереса. Это позволяет приступить к точному картированию. Если маркер находится физически далеко от локуса интереса, то частота рекомбинаций (соответствие между генотипом и фенотипом) будет высокой. Точное картирование заключается в насыщении фиксированного локуса дополнительными маркерами, чтобы повысить степень сцепления с признаком интереса и понизить частоту рекомбинации. Одновременно с этим длина локуса уменьшается в сотни раз, предоставляя исследователю возможность применить подходы позиционного клонирования и/или, так называемой, прогулки по хромосоме. Зная, где физически расположен маркер, исследователь проверяет все гены и полиморфизмы, расположенные в фиксированном локусе. На данном этапе важно понимать, что признак интереса формируется не только за счет SNP и InDels, расположенных в кодирующих областях генов.

Многие исследования и наш личный опыт показывают, что довольно часто изменения в некодирующих областях 5’UTR, включая промотор, интроны и 3’UTR, также оказывают значительное влияние на синтез и накопление транскриптов, что, в свою очередь, изменяет экспрессию признака. Учитывая все потенциально значимые полиморфизмы при помощи биоинформатического анализа, создается еще один пул маркеров. Определяются маркеры с наивысшей степенью корреляции между генотипическим и фенотипическим статусом образцов из расщепляющегося поколения. 

Заключительным этапом является валидация маркера. Валидация проводится на другом расщепляющемся поколении, чтобы гарантировать отсутствие сортоспецифичности маркера. Затем, если есть необходимость неопровержимого доказательства причинного полиморфизма, применятся подходы генной инженерии. К примеру, можно произвести трансформацию неустойчивого растения аллелью из устойчивого или произвести РНК глушение или нокаут гена устойчивости. Если фенотипический статус признака интереса изменится это будет доказательством того, что ген-кандидат является причинным геном.

Как отмечалось выше, наиболее критическим этапом картирования признака является создание картируемой популяции. 

На базе селекционно-семеноводческой компании «Гавриш» были выведены подходящие расщепляющиеся популяции томата и огурца, которые можно использовать для картирования новых признаков интереса. Для огурца нами были разработаны контрастные чистые линии и получены популяции F2 и F3. В данном случае F3 был необходим для качественной фитопатологической оценки, которая проводилась одновременно на два патогена (вирус зеленой крапчатой мозаики огурца и настоящая мучнистая роса огурца). Говоря другими словами, фитопатологическая оценка проводилась не по одному растению, а по десяти растениям F3. Считалось, что если все 10 растений из F3 проявляют один и тот же статус устойчивости, то F2 от которого они получены является гомозиготным по данному признаку. Для определения локуса устойчивости к настоящей мучнистой росе томата нами были получены 7 RILs с депонированным локусом интереса в четырех образцах.

Последующее полногеномное секвенирование огурца будет производиться двумя пулами по 25 растений из поколения F2 контрастных по двум признакам устойчивости. Для каждой из 7 линий томата будет применено генотипирование при помощи технологии GBS. Подход GBS основан на секвенировании 1% от общего размера генома. Однако рандомные фрагменты длиной до 500 п.н. равномерно распределены по хромосомам в локусах, одинаковых для всех образцов. При помощи GBS мы рассчитываем обнаружить кластеризацию полиморфных фрагментов в локусах интрогрессии (бинах), которые несут в себе устойчивость к мучнистой росе внутри генома культурного томата. Что же до полногеномного секвенирования огурца, то дизайн исследования, использующий два контрастных пула по 25 растений в каждом, позволит определить причинный полиморфизм с высокой вероятностью успеха за счет биоинформатической фильтрации полиморфизма.

Результаты данного пилотного проекта, направленного на освоение полного технологического цикла картирования новых признаков интереса, позволят разработать и отработать алгоритм для поиска новых признаков в различных сельскохозяйственных культурах. В результат освоения данного подхода будут заложены основы продовольственной безопасности страны и конкурентоспособности отечественной семенной продукции на отечественном и международных рынках семян овощных культур.