АвторТема: Терминология в ДНК-генеалогии  (Прочитано 7933 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Терминология в ДНК-генеалогии
« : 15 Сентябрь 2012, 22:09:34 »
А

Аллель

ALU-инсерция или ALU-повтор

Б

Бутылочное горлышко


Г

Гаплотип

Гаплогруппы
См. также: Схема филогенетического дерева Y и мито- гаплогрупп
См. также: Y-хромосомные гаплогруппы в этнических группах
Гаплогруппа - это группа гаплотипов, которые делят полиморфизм одного нуклеотида.
Таким образом, в строго научном определении даже у мужских представителей отдельной семьи уже своя гаплогруппа (если конечно нашли, а не просто предполагают общий единый для них только SNP).
В ISOGG принято считать, что гаплогруппа - это только тот SNP который найден у представителей разных семейных линий и не имеет документального пересечения между теми кто делит полиморфизм одного нуклеотида ОНП. Т.е. в какой-то династии, например Гедиминовичей общий SNP L551 уже будет династический снип, а не гаплогруппа. Но это условно и по факту, но одно время некоторые активные члены ISOGG высказывались поменять, чтобы любой SNP мог быть размещен на древе.

(С) Eugene

Д

Дрейф генов

Л

Локус


С

СТР-маркёр или STR-marker

Снип или SNP
Цитировать
Снип (SNP) -это одиночный нуклеотидный полиморфизм, в генетической систематике относящийся к группе бинарных мутаций UeP (unique event polymorphism, т.е уникальных полиморфных событий).Почему уникальных? Потому что, шанс случайного совпадения аллеля снипа у людей, несвязанных между собой общим происхождением, мал. Правда, существуют отдельные снипы, которые выявлены сразу у нескольких гаплогрупп. Однако эти волатильные снипы не используются для филогенетической классификации ISOGG-дерева Y. Существует отличие и от понятия SNV (single nucleotide variant), но это понятие носит сугубо статистический характер, cнип определяется не просто как вариант, а как полиморфизм в том случае если он встречается у более чем 1% народонаселения.
by V.Verenich

Э

Эволюционная биология

Эффект основателя




Тег "Генетическая генеалогия"

Тег" Популяционная генетика"
« Последнее редактирование: 13 Ноябрь 2013, 14:35:01 от Шад »

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Терминология в ДНК-генеалогии
« Ответ #1 : 06 Январь 2013, 18:49:00 »
Подробно и популярно про SNP генотипирование.
http://en.wikipedia.org/wiki/SNP_genotyping
На английском языке.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Терминология в ДНК-генеалогии
« Ответ #3 : 07 Февраль 2013, 20:04:00 »
Прекрасный ответ про расчет TMRCA
http://forum.molgen.org/index.php/topic,15.msg171424.html#msg171424

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Терминология в ДНК-генеалогии
« Ответ #4 : 13 Ноябрь 2013, 14:26:03 »
RecLOH
http://forum.molgen.org/index.php/topic,6265.msg208056/topicseen.html#msg208056

Структура Y-хромосомы
Цитировать
из 59 Mb н.о. более половины (30 Mb) составляет конститутивный гетерохроматин (в q плече). Кроме того, центромера - 3 Mb, теломеры - 2650 kb и 330 kb. В итоге остается около 23 Mb участков, пригодных для генеалогических целей в практическом плане. Поэтому анонсированные FTDNA 10 Mb - это почти половина того, что возможно. Научные статьи 2013 года, которые выявили общую структуру генеалогического дерева Y-хромосомы человека, изучали снипы сравнимого размера: Poznik et al. (2013) - 9.99 Mb, Francalacci et al. (2013) и Wei et al. (2013) - 8.97 Mb, Yan et al. (2013) - 3.90 Mb.

http://forum.molgen.org/index.php/topic,6255.msg207477.html#msg207477

Y-хромосома не является однородной по своей структуре. Как я понял из научных статей, исследователи стремятся избегать читать повторяющиеся в разных местах последовательности (из-за сложностей в последующей локализации?). А такие участки в Y-хромосоме преобладают! Вот что пишут Wei et al. (2013):
We identified unique regions within the male-specific part of
the Y chromosome reference sequence (GRCh37 http://www.ncbi.
nlm.nih.gov/projects/genome/assembly/grc/human/) where we
expected read mapping and variant detection to escape complications
introduced by repeated sequences. This was achieved by
excluding the pseudoautosomal, heterochromatic, X-transposed,
and ampliconic segments
(Skaletsky et al. 2003), leaving nine
separate regions (Fig. 1; Supplemental Table S1). Together, these
spanned 8.97 Mb. All analyses in this study were restricted to
these regions or to subsets of them.

По сути, авторы оставили для исследования только уникальные последовательности, представленными X-degenerate участками. А это и есть 8.97 Mbp. Первооткрыватели, Skaletsky et al. (2003), относили к X-degenerate участкам Y-хромосомы около 8.6 Mbp.

Цитировать
С момента открытия трех укрупненных видов последовательностей внутри вышеуказанных 23 Mb прошло всего 10 лет (Skaletsky et al., 2003). Эухроматин Y-хромосомы состоит из нуклеотидных последовательностей следующих видов:
1) X-transposed,
2) X-degenerate,
3) ampliconic.
Я затрудняюсь дать адекватный перевод на русский язык. Пусть так и остается для последующего изложения. В настоящее время никто толком и не понимает, как надежно будут считываться эти участки при секвенировании машинами нового поколения (next generation sequencing). Рассмотрим один крайне упрощенный пример. Пусть мы исследуем участок длиной в 10 Mb в гипотетической Y-хромосоме. Внутри этого участка находится относительно небольшой отрезок последовательности ТАТАТАТАТАТА....ТАТАТАТАТА длиной, допустим, 10 kb. Это всего 0.1 % изучаемого участка. При этом мы знаем, в каком месте прямой последовательности эти повторяющиеся нуклеотиды начинаются и где они заканчиваются. Предположим, где-то внутри отрезка ТАТАТАТАТАТА....ТАТАТАТАТА поизошла однонуклеотидная мутация T > C. Если мы измеряем сразу по 10 тыс. оснований, то тогда мы можем определить координату этой мутации. Совсем другая картина будет, если мы измеряем по 100 оснований. Тогда понять, где именно произошла мутация, будет невозможно. А если местонахождение мутации неизвестно, то как сравнивать с другими гаплотипами? Если наша машина считывает по 100 bp, то лучше обходить такие отрезки. Именно поэтому у ученых вызывают сомнение X-transposed и ampliconic участки.


Согласно Skaletsky et al. (2003) последовательности X-transposed на 99 % совпадают с последовательностями в Х-хромосоме. Есть вполне обоснованное подозрение, что часть обнаруженных полиморфизмов внутри таких участков на самом деле локализуются в Х-хромосоме. Общая длина этих последовательностей около 3.4 Mb. Во всех опубликованных работах по сплошному секвенированию Y-хромосомы (Wei et al., Francalacci et al., Poznik et al., Yan et al., все - 2013) X-transposed участки были исключены из анализа.
Другой вид последовательностей - X-degenerate, - представляет в первом приближении уникальную последовательность нуклеотидов, в которой легко ориентироваться и трудно заблудиться, даже если считывать по 100 оснований. Именно эти участки (общей длиной около 9 Mb) и являются основным предметом изучения для ученых. Обнаруживаемые полиморфизмы легко локализуются и интерпертируются.


Оставшиеся последовательности эухроматина Y-хромосомы человека составляют третий класс - ampliconic. Они по определению не могут быть уникальными, так как все уникальные последовательности уже зачислены в класс X-degenerate. Поэтому ampliconic участки представляют собой последовательности длиной в десятки и сотни тысяч оснований, вплоть до 99.9 % совпадающие с последовательностями в X-transposed и X-degenerate участках. Можно сказать, что в ampliconic участках содержатся довольно точные копии последовательностей с других участков. Думаю, что это наименее четко определенный класс. Что он может дать в практическом плане построения генеалогий по мутациям - не совсем понятно. В отличие от других исследователей, авторы Poznik et al. (2013) включили в свой анализ и небольшие (в целом около 1 Mb) ampliconic участки. В целом ampliconic последовательности составляют около 10.2 Mb. Можно предположить, что в них все-таки содержится определенный потенциал для изучения разнообразия Y-хромосомы человека, но требующий повышенных затрат.
Из всего изложенного можно сделать вывод о том, что с наименьшими затратами можно измерять около 9 Mb информации, содержащейся в X-degenerate участках. Достаточно ли этого для разного сорта поставленных генеалогических задач - это другой вопрос.



Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Терминология в ДНК-генеалогии
« Ответ #5 : 13 Ноябрь 2013, 14:37:58 »
DNA srtand
DNA Strand  – это одна из цепочек ДНК (которая комплиментарна по отношению к другой). Обозначается как strand+ и strand-.

Некоторые интересные моменты по терминологии и не только по ссылке.


 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.