АвторТема: Semargl.me: он-лайн сервис для анализа данных по Y-ДНК  (Прочитано 163116 раз)

0 Пользователей и 4 Гостей просматривают эту тему.

Оффлайн Pre Slav

  • Где начало того конца которым оканчивается начало?
  • Сообщений: 1674
  • Страна: 00
  • Рейтинг +123/-111
Этот инструмент позволяет, используя всю доступную информацию (в вашем случае - STRы), свести ее на n-мерное (в вашем случае - 2мерное) пространство.
По обеим осям находятся безразмерные величины, отражающие удаленность образцов друг от друга.
Судя по графику - близкой родни нет.
МГК (PCA) не всегда эффективен.
он и не может быть эффективен в случае одноглаплогрупных STR... МГК (PCA, разложение на главные компоненты) инструмент анализирующий смеси чего либо (популяций, аутосом, и т.д.), а здесь нет никаких смесей, поэтому нет никаких компонентов, здесь чисто древовидный случай отношения предок-потомок... применения его к гаплогруппе одного человека с конкретной уже определенной гаплогруппой вообще бессмысленно... так, красивая картинка...


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Разве "одногаплогруппный" означает вертикаль "предок-потомок"?
А если подумать?
Всё тот же горизонтальный однопоколенный (с естественными перекосами) срез.

Не являюсь поклонником метода, но то что выдал Пре Слав - обычная его глупость, обычно же не заслуживающая внимания.

*** Включил секундомер (10:27 по местному времени).

Оффлайн Yaroslav

  • Сообщений: 18704
  • Страна: ru
  • Рейтинг +4679/-14
  • 76% East Europe + 17% Finland
  • Y-ДНК: J1a2b1a ZS3067, ЖМ: I2a1a2b1a1a1a1 FT37540, МЖМ: G2a2b1a1a1a2b2a FT159945
  • мтДНК: K1b1a1 T199C, МЖ: H13a1a1d
*** Включил секундомер (10:27 по местному времени).

Ожидаете юбилейный тридцатый? ;)

Оффлайн Pre Slav

  • Где начало того конца которым оканчивается начало?
  • Сообщений: 1674
  • Страна: 00
  • Рейтинг +123/-111
Разве "одногаплогруппный" означает вертикаль "предок-потомок"?
А если подумать?
Всё тот же горизонтальный однопоколенный (с естественными перекосами) срез.

Не являюсь поклонником метода, но то что выдал Пре Слав - обычная его глупость, обычно же не заслуживающая внимания.
это самое пишите вы во всех своих сообщениях, всегда... а то что я написал то правильно, но видимо понятно только умным людям...
еще раз для умных, у STR у Y-хромосомы одного человека нету компонентов, поэтому что предок всегда один... а значит разложение на компоненты бессмысленно...


Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5993
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Этот инструмент позволяет, используя всю доступную информацию (в вашем случае - STRы), свести ее на n-мерное (в вашем случае - 2мерное) пространство.
По обеим осям находятся безразмерные величины, отражающие удаленность образцов друг от друга.
Судя по графику - близкой родни нет.
МГК (PCA) не всегда эффективен.
он и не может быть эффективен в случае одноглаплогрупных STR... МГК (PCA, разложение на главные компоненты) инструмент анализирующий смеси чего либо (популяций, аутосом, и т.д.), а здесь нет никаких смесей, поэтому нет никаких компонентов, здесь чисто древовидный случай отношения предок-потомок... применения его к гаплогруппе одного человека с конкретной уже определенной гаплогруппой вообще бессмысленно... так, красивая картинка...
;D
Нечего прибавить.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
а значит разложение на компоненты бессмысленно...

Как насчёт того, что имеем иную форму представления?
Если филогенетическое делает попытку (одну из огромного множества!) представить возможный вариант происхождения от одного предка, то данный инструмент можно использовать для оценки степени похожести-непохожести заданного множества гаплотипов.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Дам аналогию.

Дерево. Обычное такое дерево с ветвями и листочками.

Филогенетическое дерево - это как бы вид сбоку. Сделали горизонтальный срез и посмотрели сбоку.

А ругаемое Вами представление - это вид сверху. Сделали вертикальный срез и посмотрели сверху.


:)

Оффлайн Pre Slav

  • Где начало того конца которым оканчивается начало?
  • Сообщений: 1674
  • Страна: 00
  • Рейтинг +123/-111
Этот инструмент позволяет, используя всю доступную информацию (в вашем случае - STRы), свести ее на n-мерное (в вашем случае - 2мерное) пространство.
По обеим осям находятся безразмерные величины, отражающие удаленность образцов друг от друга.
Судя по графику - близкой родни нет.
МГК (PCA) не всегда эффективен.
он и не может быть эффективен в случае одноглаплогрупных STR... МГК (PCA, разложение на главные компоненты) инструмент анализирующий смеси чего либо (популяций, аутосом, и т.д.), а здесь нет никаких смесей, поэтому нет никаких компонентов, здесь чисто древовидный случай отношения предок-потомок... применения его к гаплогруппе одного человека с конкретной уже определенной гаплогруппой вообще бессмысленно... так, красивая картинка...
;D
Нечего прибавить.
конечно, стры же это принципиально одномерные данные... что анализирует мгк??? он берет многомерные данные, принципиально многомерные, и редуцирует их на меньшую размерность...
да, конечно, любые одномерные данные можно объявить многомерными, взять любое число, например, 123, и объявить что здесь три размерности со значением 1,2,3 и так их проанализировать в мгк - но что это будет значить??? ровным счетом ничего!!! осмысленной сущности за этими действиями нету...
так же и стр, это число записанное не в десятичной системе счисления, а скажем, в стоичной системе, но это одно число, принципиально одна размерность... и анализ его мгк методом имеет осмысленность равную нулю... просто расстояние хэмминга, которое и используется в стр-анализе, намного более осмысленно...

Оффлайн Terenga

  • Сообщений: 18
  • Страна: ru
  • Рейтинг +3/-0
  • Y-ДНК: I-FGC21611
  • мтДНК: H
Здравствуйте все.

Мне FTDNA в матчах по BigY в самом верху списка выдал соваденца с
Known SNP Difference =0
Shared Novel Variants = 14
Non-Matchning Known SNPs = пусто
Matching SNPs = 26,326

Как я понимаю, это самый близкий совпаденец?
Построил дверо в semargl'е - получается что MCRA жил 1876 лет назад... Возможно ли такое? Что-то уж слишком давно при таком совпадении всего остального.

Кстати, после того как я сделал BigY (но еще не делал yfull), есть ли чему обновляться в семаргле и происходит ли это автоматически?

Спасибо.

« Последнее редактирование: 21 Май 2017, 11:51:38 от Terenga »

Оффлайн AlexanderK

  • Сообщений: 1936
  • Страна: ru
  • Рейтинг +357/-1
  • Y-ДНК: J1-PF7257
  • мтДНК: H11a1

Построил дверо в semargl'е - получается что TMCRA жил 1876 лет назад... Возможно ли такое? Что-то уж слишком давно при таком совпадении всего остального.

Это нормально. Ведь написано Known SNP Difference =0 - то есть это по ранее известным снипам нет различий. А еще куча приватных, по которым разница. Ждите YFull - там понятней будет...

Оффлайн Terenga

  • Сообщений: 18
  • Страна: ru
  • Рейтинг +3/-0
  • Y-ДНК: I-FGC21611
  • мтДНК: H
Спасибо, Александр.

а после того как я сделал BigY (но еще не делал yfull), есть ли чему обновляться в семаргле и происходит ли это автоматически?

Спасибо еще раз.

Оффлайн AlexanderK

  • Сообщений: 1936
  • Страна: ru
  • Рейтинг +357/-1
  • Y-ДНК: J1-PF7257
  • мтДНК: H11a1
Спасибо, Александр.

а после того как я сделал BigY (но еще не делал yfull), есть ли чему обновляться в семаргле и происходит ли это автоматически?

У меня  все проверенные Бигом снипы добавились автоматически http://www.semargl.me/kit/71085/

Оффлайн Terenga

  • Сообщений: 18
  • Страна: ru
  • Рейтинг +3/-0
  • Y-ДНК: I-FGC21611
  • мтДНК: H
Спасибо. Я посмотрел - у меня пока не обновилось....
Подожду покамест. Буду упражнять своё терпение.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Коллеги, есть интересные данные по Трансоксиане.
Может кому будет интересно Сапламентари

https://static-content.springer.com/esm/art%3A10.1038%2Fs41598-017-03176-z/MediaObjects/41598_2017_3176_MOESM1_ESM.xls

https://static-content.springer.com/esm/art%3A10.1038%2Fs41598-017-03176-z/MediaObjects/41598_2017_3176_MOESM2_ESM.pdf
Большой объем.
В принципе, путь конвертации описан выше, но жалко времени на рутинную работу. Так как вопрос касается не только меня, но и всего сообщества, хотел узнать - кто-нибудь сможет доработать макрос уважаемого Фарруха чтобы на выходе была текстовая строка, адекватно воспринимаемая semargl.me (форма для автоматического ввода данных)?
Для тех, кто не сталкивался с этой формой: она воспринимает данные в формате FTDNA в таком вот виде (пример для 111 маркёров):
13   22   13   10   14-16   12   12   12   13   15   29   17   9-9   11   11   25   14   19   29   14-15-15-16   10   9   19-19   15   14   17   16   33-38   13   11   12   8   15-19   8   11   10   8   12   11   0   22-22   16   11   12   12   16   8   12   24   16   14   13   11   13   10   12   13   13   38   15   9   15   11   27   28   18   11   12   12   11   11   9   11   11   10   11   11   32   12   14   0   15   11   9   21   15   22   12   25   16   12   16   25   12   22   17   12   15   17   9   12   11

Базу можно скачать здесь.

Y-GATA-H4 уменьшена на единицу. DYS385 в одном столбце (вместо двух). Справа после DYS435 в отдельном столбце данные по DYS19-2 для некоторых участников, имеющих данную мутацию, так как в базе Семаргл DYS19-2 нужно добавлять вручную. Вместо отсутствующих значений - нули, выделенные красным цветом, так как именно в таком формате нужно добавлять в базу Семаргл.



Хотел бы уточнить у разработчиков - нули действительно обсчитываются алгоримом как отсутствие данных ("пробел")? Или возникают какие-то флуктуации?

Оффлайн Yaroslav

  • Сообщений: 18704
  • Страна: ru
  • Рейтинг +4679/-14
  • 76% East Europe + 17% Finland
  • Y-ДНК: J1a2b1a ZS3067, ЖМ: I2a1a2b1a1a1a1 FT37540, МЖМ: G2a2b1a1a1a2b2a FT159945
  • мтДНК: K1b1a1 T199C, МЖ: H13a1a1d
Хотел бы уточнить у разработчиков - нули действительно обсчитываются алгоримом как отсутствие данных ("пробел")? Или возникают какие-то флуктуации?

Кстати, вводил в базу данных вручную один гаплотип из интересующей нас обоих публикации. Получилось, что Семаргл хочет сравнивать только 11 маркеров http://forum.molgen.org/index.php/topic,7031.msg382416.html#msg382416
« Последнее редактирование: 12 Июнь 2017, 09:45:29 от Yaroslav »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.