0 Пользователей и 1 Гость просматривают эту тему.
Снип (SNP) -это одиночный нуклеотидный полиморфизм, в генетической систематике относящийся к группе бинарных мутаций UeP (unique event polymorphism, т.е уникальных полиморфных событий).Почему уникальных? Потому что, шанс случайного совпадения аллеля снипа у людей, несвязанных между собой общим происхождением, мал. Правда, существуют отдельные снипы, которые выявлены сразу у нескольких гаплогрупп. Однако эти волатильные снипы не используются для филогенетической классификации ISOGG-дерева Y. Существует отличие и от понятия SNV (single nucleotide variant), но это понятие носит сугубо статистический характер, cнип определяется не просто как вариант, а как полиморфизм в том случае если он встречается у более чем 1% народонаселения.
из 59 Mb н.о. более половины (30 Mb) составляет конститутивный гетерохроматин (в q плече). Кроме того, центромера - 3 Mb, теломеры - 2650 kb и 330 kb. В итоге остается около 23 Mb участков, пригодных для генеалогических целей в практическом плане. Поэтому анонсированные FTDNA 10 Mb - это почти половина того, что возможно. Научные статьи 2013 года, которые выявили общую структуру генеалогического дерева Y-хромосомы человека, изучали снипы сравнимого размера: Poznik et al. (2013) - 9.99 Mb, Francalacci et al. (2013) и Wei et al. (2013) - 8.97 Mb, Yan et al. (2013) - 3.90 Mb.
Y-хромосома не является однородной по своей структуре. Как я понял из научных статей, исследователи стремятся избегать читать повторяющиеся в разных местах последовательности (из-за сложностей в последующей локализации?). А такие участки в Y-хромосоме преобладают! Вот что пишут Wei et al. (2013):We identified unique regions within the male-specific part ofthe Y chromosome reference sequence (GRCh37 http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/human/) where weexpected read mapping and variant detection to escape complicationsintroduced by repeated sequences. This was achieved byexcluding the pseudoautosomal, heterochromatic, X-transposed,and ampliconic segments (Skaletsky et al. 2003), leaving nineseparate regions (Fig. 1; Supplemental Table S1). Together, thesespanned 8.97 Mb. All analyses in this study were restricted tothese regions or to subsets of them.По сути, авторы оставили для исследования только уникальные последовательности, представленными X-degenerate участками. А это и есть 8.97 Mbp. Первооткрыватели, Skaletsky et al. (2003), относили к X-degenerate участкам Y-хромосомы около 8.6 Mbp.
С момента открытия трех укрупненных видов последовательностей внутри вышеуказанных 23 Mb прошло всего 10 лет (Skaletsky et al., 2003). Эухроматин Y-хромосомы состоит из нуклеотидных последовательностей следующих видов:1) X-transposed,2) X-degenerate,3) ampliconic.Я затрудняюсь дать адекватный перевод на русский язык. Пусть так и остается для последующего изложения. В настоящее время никто толком и не понимает, как надежно будут считываться эти участки при секвенировании машинами нового поколения (next generation sequencing). Рассмотрим один крайне упрощенный пример. Пусть мы исследуем участок длиной в 10 Mb в гипотетической Y-хромосоме. Внутри этого участка находится относительно небольшой отрезок последовательности ТАТАТАТАТАТА....ТАТАТАТАТА длиной, допустим, 10 kb. Это всего 0.1 % изучаемого участка. При этом мы знаем, в каком месте прямой последовательности эти повторяющиеся нуклеотиды начинаются и где они заканчиваются. Предположим, где-то внутри отрезка ТАТАТАТАТАТА....ТАТАТАТАТА поизошла однонуклеотидная мутация T > C. Если мы измеряем сразу по 10 тыс. оснований, то тогда мы можем определить координату этой мутации. Совсем другая картина будет, если мы измеряем по 100 оснований. Тогда понять, где именно произошла мутация, будет невозможно. А если местонахождение мутации неизвестно, то как сравнивать с другими гаплотипами? Если наша машина считывает по 100 bp, то лучше обходить такие отрезки. Именно поэтому у ученых вызывают сомнение X-transposed и ampliconic участки. Согласно Skaletsky et al. (2003) последовательности X-transposed на 99 % совпадают с последовательностями в Х-хромосоме. Есть вполне обоснованное подозрение, что часть обнаруженных полиморфизмов внутри таких участков на самом деле локализуются в Х-хромосоме. Общая длина этих последовательностей около 3.4 Mb. Во всех опубликованных работах по сплошному секвенированию Y-хромосомы (Wei et al., Francalacci et al., Poznik et al., Yan et al., все - 2013) X-transposed участки были исключены из анализа.Другой вид последовательностей - X-degenerate, - представляет в первом приближении уникальную последовательность нуклеотидов, в которой легко ориентироваться и трудно заблудиться, даже если считывать по 100 оснований. Именно эти участки (общей длиной около 9 Mb) и являются основным предметом изучения для ученых. Обнаруживаемые полиморфизмы легко локализуются и интерпертируются.Оставшиеся последовательности эухроматина Y-хромосомы человека составляют третий класс - ampliconic. Они по определению не могут быть уникальными, так как все уникальные последовательности уже зачислены в класс X-degenerate. Поэтому ampliconic участки представляют собой последовательности длиной в десятки и сотни тысяч оснований, вплоть до 99.9 % совпадающие с последовательностями в X-transposed и X-degenerate участках. Можно сказать, что в ampliconic участках содержатся довольно точные копии последовательностей с других участков. Думаю, что это наименее четко определенный класс. Что он может дать в практическом плане построения генеалогий по мутациям - не совсем понятно. В отличие от других исследователей, авторы Poznik et al. (2013) включили в свой анализ и небольшие (в целом около 1 Mb) ampliconic участки. В целом ampliconic последовательности составляют около 10.2 Mb. Можно предположить, что в них все-таки содержится определенный потенциал для изучения разнообразия Y-хромосомы человека, но требующий повышенных затрат.Из всего изложенного можно сделать вывод о том, что с наименьшими затратами можно измерять около 9 Mb информации, содержащейся в X-degenerate участках. Достаточно ли этого для разного сорта поставленных генеалогических задач - это другой вопрос.