Тема: 23andme в Беларусь (Прочитано 9747 раз)

Mich Glitch · « **Ответ #30 :** 24 Январь 2020, 19:09:19 »

Да, проработка моего дерева неполная. Но неизвестны линии крепостных крестьян. Из рязанской глубинки. Вряд ли там затесались ирландцы-шотландцы.

FELIX · « **Ответ #31 :** 24 Январь 2020, 19:29:43 »

Цитата: Mich Glitch от 24 Январь 2020, 18:51:23

Смотрим по регионам.
По России должна быть Рязанская губерния(область). С глубины 6 поколений, Новгородская.

Имеем же вот что:

У меня Рязань под №4. Интересно, что сильно выражено: Татарстан, Башкортостан, Свердловск, Алтай, Омск, Новосибирск...

FELIX · « **Ответ #32 :** 24 Январь 2020, 19:36:23 »

Цитата: Mich Glitch от 24 Январь 2020, 18:54:23

По Украине должна быть Винницкая область.
Имею:

Хмельницкая №3, Винницкая №4. Нормально.
Вместо Черниговской - Киевская №1 и Полтавская №7.
Ивано-Франковск - тоже радует. Хотя эта линия у меня только в "семейных легендах".

Mich Glitch · « **Ответ #33 :** 24 Январь 2020, 19:47:01 »

Цитата: FELIX от 24 Январь 2020, 19:36:23

Хотя эта линия у меня только в "семейных легендах".

Об этом и говорю.

Допустим, копаем мы документальные линии, да и заходим в тупик.
Или же волнуемся, а не было ли где НДБО.

Делаем для прояснения генетический тест.

А он не проясняет. Не даёт дополнительную информацию. Наоборот, выводит на ложные следы.

Именно в этом смысле, ФТДНА - инструмент надёжный. А 23эндМи - не вполне. (МН - вообще шлак.)

Alexey_V.B. · « **Ответ #34 :** 24 Январь 2020, 20:03:43 »

Цитата: pandamba от 24 Январь 2020, 19:03:47

Я пробовала в MH искать совпаденцев по фамилии бабушки. Нашла предположительных родственников, фамилия достаточно редкая и в Беларуси встречается только в одном районе, поэтому я почти уверена. Но к сожалению я не могу посмотреть нужную мне для понимания степени родства инфу, так как у меня нет подписки. Брать подписку ради того, чтобы посмотреть одно древо я не хочу, а больше инфы у меня особо и нет. Покупать подписку с тестом - уже как бы на уровне цены 23andme. Я новичок, я чего-то, возможно, не понимаю, поэтому все равно жду Вашего мнения, возможно чего-то не догоняю)

"сколько людей - столько мнений", так что https://youtu.be/3DM6wTIt6us
ко мне обращаются в личку с просьбами посмотреть что-то или написать кому-то на MyHeritage.

R1a-Stolin · « **Ответ #35 :** 24 Январь 2020, 21:23:45 »

Интересно узнать базовые гаплогруппы по самой дешёвой цене? Тогда бегом в 23andme.

Говоря про точность по странам, у меня отец из Брестской области по национальности беларус и есть родословная до начала XVIII века ... и что же я вижу после последнего апдейта?

"Мы не обнаружили достаточных свидетельств недавнего происхождения из Беларуси, Чехии, Эстонии, Венгрии, Латвии, Литвы, Словакии или Словении."

Mich Glitch · « **Ответ #36 :** 24 Январь 2020, 21:49:44 »

Надо всё-таки сделать наоборот:

1. Сначала выделить генетически сходные группы.

2. Попытаться увязать полученные кластеры с этносом, или регионом.

Mich Glitch · « **Ответ #37 :** 24 Январь 2020, 21:54:18 »

Всё надеюсь Сергея всподвигнуть на такой подвиг.

Но понимаю, легко может быть, что задача по сложности превышает возможности одного человека.

Авторы калькуляторов чаще всего работают с уже готовыми референсами.

А тут предлагается, не меняя калькуляторов, переформатировать имеющиеся сэмплы в новые референтные группы.

Srkz · « **Ответ #38 :** 25 Январь 2020, 08:00:06 »

Цитата: Mich Glitch от 24 Январь 2020, 21:49:44

Надо всё-таки сделать наоборот:

1. Сначала выделить генетически сходные группы.

2. Попытаться увязать полученные кластеры с этносом, или регионом.

Так тоже стараются делать. Сложность в том, чтобы найти хороший способ выделения внутренних кластеров для крупных общностей наподобие славянских, германских, романских народов. Важный момент - выделение должно работать и для людей смешанного происхождения. Поэтому отпадает подход оракулов Gedmatch. Если просто делить геномы по общему сходству, то в Европе уверенно видны лишь кластеры высокого уровня - восточноевропейский, средиземноморский, и кластеры маленьких, хорошо выделенных популяций - как финны, ашкенази, марийцы, баски.

На другом конце шкалы (самые мелкие кластеры) можно уверенно видеть родство с людьми из какой-нибудь очень хорошо охваченной тестами деревни. Но таких деревень у нас в стране раз-два и обчёлся

Однако это показывает, что поиск общих сегментов действительно в теории способен решить проблему. Дело упирается в объём выборок. На моих выборках удаётся уверенно выделять внутри восточных славян только северных русских, с учётом оговорки о необходимости видеть и смешанное происхождение. Так-то и более мелкое деление проявляется, но для индивидуального разнесения миксов это ненадёжно. Полагаю, используемые 23andme IBD-выборки на несколько порядков больше, однако на уровне областей у них, действительно, в большинстве случаев пока что выходит ерунда. На уровне стран - что-то начинает получаться, но тоже далеко не всегда.

Не исключено, что они-то как раз и могли бы найти эти объективные кластеры среднего уровня внутри восточнославянских популяций, если не привязываться к границам современных стран. Но вот пока что не делают этого

А может быть, это и для 23andme сейчас недоступно - ведь в идеале надо учитывать только коренное сельское население, без смешанного городского и мигрантов XX века. Примешивание этих людей затрудняет задачу. В любом случае, рост выборок должен постепенно-понемногу улучшать результаты 23andme.

Mich Glitch · « **Ответ #39 :** 25 Январь 2020, 09:14:24 »

Цитата: Srkz от 25 Январь 2020, 08:00:06

Так тоже стараются делать. Сложность в том, чтобы найти хороший способ выделения внутренних кластеров для крупных общностей наподобие славянских, германских, романских народов.

Моё предложение - полное абстрагирование.

То есть, сначала идёт группировка по генетическому сходству.

А уже потом полученную ГОМОГЕННУЮ группу пытаться как-то атрибутировать. (Для начала пойдут номера.)

Mich Glitch · « **Ответ #40 :** 25 Январь 2020, 09:20:42 »

Можно было бы использовать старый добрый пузырьковый алгоритм.

Описание примерно такое:

1. Имеется массив геномов. Скажем 10 тысяч штук.

2. Предполагается разбить их на 100 групп.

3. Берётся произвольный геном.

4. Просчитываются дистанции от него для всего массива.

5. Отбирается 99 ближайших гаплотипа.

6. Берётся первый гаплотип 2 * максимальную дистанцию (от 1-го до 100-го первой выборки).

7. Повторяются пп.4-6 для 10000 - 100.

Коряво. Но это в качестве иллюстрации хода мысли.

Mich Glitch · « **Ответ #41 :** 25 Январь 2020, 09:22:13 »

Группы (кластеры) предложил сделать одинаковыми, с целью упрощения процесса.

Логично же создать такой алгоритм разбиения, которые выделял подгруппы с дистанциями, не превышающими заданную.

R1a-Stolin · « **Ответ #42 :** 25 Январь 2020, 09:59:57 »

Цитата: Srkz от 25 Январь 2020, 08:00:06

Не исключено, что они-то как раз и могли бы найти эти объективные кластеры среднего уровня внутри восточнославянских популяций, если не привязываться к границам современных стран. Но вот пока что не делают этого

Хочется быть оптимистом, однако пока 23andme увольняет сотрудников - в этот четверг уволили 100 человек или 14% всех сотрудников за плохие продажи:
https://www.cnbc.com/2020/01/23/23andme-lays-off-100-people-ceo-anne-wojcicki-explains-why.html

Mich Glitch · « **Ответ #43 :** 25 Январь 2020, 10:09:12 »

Ерунду написал в паре предыдущих постов.
Второпях.
Спросонья.
Не подумав.

Задача состоит в разбиении массива данных на кластеры таким образом, чтобы дистанция любой произвольной пары - не превышала заданный порог. Точнее, для каждой пары.

А потом эти подмножества попытаться атрибутировать. Подвязать к регионам или этносам. По наиболее часто встречающимся среди членов группы.

Srkz · « **Ответ #44 :** 25 Январь 2020, 10:20:22 »

Mich Glitch

Я понимаю. Дело в том, что если мы просто сравниваем геномы по общим снипам, то нужное множество более-менее однородных небольших или средних кластеров не выделяется. Мы видим в первую очередь кластеры верхнего уровня и распределённые между ними геномы. Если, например, на PCA какие-то геномы оказываются рядом, то это вызвано тем, что их сходство с макрокластерами находится на близком уровне, а не тем, что эти геномы схожи между собой сами по себе.
То есть для нужной картины необходимо найти метод сравнения геномов, который бы исключал это сходство верхнего уровня и вылавливал исключительно сигналы меньших кластеров. В этом вся проблема.

upd Забыл написать. Частично ситуация вызвана тем, что при разработке чипов специально отсеивались редкие снипы. А значит, специфические для какого-то кластера среднего уровня признаки оттуда могут быть просто удалены. Здесь может заметно помочь массовое распространение полногеномных сиквенсов.

АвторТема: 23andme в Беларусь (Прочитано 9747 раз)

Mich Glitch

Re: 23andme в Беларусь

FELIX

Re: 23andme в Беларусь

FELIX

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

Alexey_V.B.

Re: 23andme в Беларусь

R1a-Stolin

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

Srkz

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

R1a-Stolin

Re: 23andme в Беларусь

Mich Glitch

Re: 23andme в Беларусь

Srkz

Re: 23andme в Беларусь