АвторТема: Semargl.me: он-лайн сервис для анализа данных по Y-ДНК  (Прочитано 163188 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Я бы изобразил Темниковский и Елатомский уезды, а как создавать карты, вы где-то писали, но я уже не помню где?
Постараюсь написать небольшую инструкцию.
А пока очень кратко. Есть три основных метода составления карты:
1) Можно создать "примитивную", простейшую карту - http://www.semargl.me/ru/dna/ydna/create-map/
Рисуем полигон, замыкаем контур, нажимаем кнопку "Show Path", копируем получившиеся цифры и отправляем их мне.

2) Скачиваем бесплатную программу от Гугла - Google Earth http://www.google.com/intl/ru/earth/index.html
Жмем кнопку - "нарисовать полигон". Рисуем. Сохраняем в формат kml и отправляем мне.

3) Наиотличнейшее решение - свободная программа QGIS. Она посложней, но предоставляет полный контроль над картой. Тонкая привязка координат и тп. Если потерять немного времени и разобраться с интерфейсом этой программы, то это будет лучшим решением для составления карты. И если честно, то в конечном итоге в ней рисовать легче.

Карта пшеворской культуры нарисована в QGIS.

Цитировать
А как Вы считаете, может быть было бы лцчше не карта снипов а карта с гаплогрупп со снипами, как в "Общая карта гаплогрупп и их субкладов (ветвей)"
Будет реализовано в самое ближайшее время.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Цитировать
А как Вы считаете, может быть было бы лцчше не карта снипов а карта с гаплогрупп со снипами, как в "Общая карта гаплогрупп и их субкладов (ветвей)"
Будет реализовано в самое ближайшее время.
Готово. "Рюшечки" добавлю чуть позже.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Исправлен и доработан модуль сравнения гаплотипов.
Добавлено отображение:
- количества маркеров участвующих в сравнении
- расстояния в маркерах
- генетического расстояния
Генетическое расстояние в DYS389 рассчитывается по формуле: Genetic Distance = [differences in DYS389i values] + [differences in (DYS389ii value - DYS389i value)]

Каждое проведенное сравнение имеет свой уникальный адрес, то есть теперь можно давать ссылки на какое либо сравнение гаплотипов.
Например так.

UPD
Результирующая таблица может быть отсортирована при клике на заголовке.
« Последнее редактирование: 24 Январь 2012, 09:24:48 от Тунец »

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Доработан модуль прямых запросов к базе.
Добавлено формирование таблицы с расширенными возможностями (сортировка, фильтр, цветовая схема)
На данный момент есть ограничение на вывод - максимум 500 гаплотипов.

Внесены небольшие изменения в модули поиска совпаденцев.
Теперь полученный результат можно сортировать по клику на заголовке столбца и фильтровать по строкам с помощью "живого поика".

Благодаря Евгению, добавлены карты:
1) Днепро-Двинская Культура
2) Культура штрихованной керамики
3) Прага, Пеньковка, Колочин

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 9628
  • Страна: ru
  • Рейтинг +2923/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK06+)
Здорово!
Спасибо Владимиру и Евгению!

Оффлайн eugene-march

  • Сообщений: 268
  • Рейтинг +42/-2
  • Y-ДНК: R1a1a
  • мтДНК: К1b2a
Ядро Ясторф-Культур:
http://maps.google.ru/maps/ms?msa=0&msid=210048461939092112949.0004b76c00da53a1ae5cc

VI-II вв. до н.э.

Одна из самых древних культур "германского" мира, уходящая корнями еще в эпоху бронзы. Немецкие исследователи различают Ясторф-Культур в узком смысле термина, ее ядро, и Ясторф-Культур в широком смысле- тот ареал различных по своему облику культурных групп, которые  ядро окружают. Территория ядра лесисто-болотистые равнины Шлезвиг-Гольштинии, Ганновера, Западного Мекленбурга и Бранденбурга, т.е. в основном правобережье нижнего течения Эльбы.

Интересно какие субклады будут преобладать в ядре?

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Интересно какие субклады будут преобладать в ядре?
Разместил карту.
Никакие субклады R1a не преобладают на территории Ясторфской культуры. Я бы сказал, что все R1a старательно обходят стороной эту культуру. Даже Z284 и L664, старательно избегают ее. Есть только небольшое присутствие M458.

Очень интересно. Евгений, спасибо за карту.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
А можно ли предусмотреть в поле для ввода данных формат Y-Filer? Я понимаю, что 17 маркеров как бы не приветствуются. Но в этом формате есть много научных образцов. Думаю, что их наличие в проекте задавало бы ориентиры в тех случаях, когда данные коммерческого тестирования по некоторых регионам или этническим группам отсутствуют или фрагментарны.
А ещё лучше бы найти возможность натравить робота Вертнера на YHRD. И потырить всё что нужно оттуда в автоматическом режиме:)

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Есть предложение - в поиске по номеру закрепить порядок цифр. Например при вводе номера кита 51 выдаются все номера содержащие подряд эти две цифры. Что, на мой взгляд, неправильно.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
С 17-ти маркерными гаплотипами, пока, торпиться не будем. Дело в том что при наличии таких гаплотипов, возникают определенные трудности с поиском приближенцев. Короткие гаплотипы забивают всех других приближенцев. Зашел в логический тупик, надо придумать обходной путь, а много времени уделить приложению, сейчас не могу. Пока не решу эту проблему, придется ограничить ввод коротких гаплотипов.

Насчет введения поиска по строгому соответствию с условием.
Я специально делал поиск, такой какой он сейчас есть. Ведь представим ситуацию, пользователь помнит всего несколько цифр из номера кита, но не весь номер. В таком случае введя всего несколько известных ему цифр в поле поиска, пользователь найдет то что искал, по нестрогому соответствию.

А от коротких номеров гаплотипов надо уходить, дело в том что могут быть несколько разных гаплотипов с одинаковым коротким номером. Если такое будет, то робот будет при каждом обновлении переписывать гаплотип, и в результате мы получим страшный микс из разных данных.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
А от коротких номеров гаплотипов надо уходить, дело в том что могут быть несколько разных гаплотипов с одинаковым коротким номером. Если такое будет, то робот будет при каждом обновлении переписывать гаплотип, и в результате мы получим страшный микс из разных данных.

Разве такое может быть? Ведь ФТДНА делает последовательную нумерацию. Просто в моем случае это был мистер Шульц - счастливый обладатель приватного снипа L315 и кита № 51 на ФТДНА.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
С 17-ти маркерными гаплотипами, пока, торпиться не будем. Дело в том что при наличии таких гаплотипов, возникают определенные трудности с поиском приближенцев. Короткие гаплотипы забивают всех других приближенцев. Зашел в логический тупик, надо придумать обходной путь, а много времени уделить приложению, сейчас не могу. Пока не решу эту проблему, придется ограничить ввод коротких гаплотипов.

ОК. Пока воздержимся. Но вижу, как минимум, одно простое решение. Программно ограничить "участие" коротких гаплотипов (<67) в тех выдачах данных, где они могут негативно повлиять на результат. Оставить без ограничения только опции по снипам. Просто очень много глубоко проснипованных, но "коротких" гаплотипов как в коммерческих базах, так и в научных работах.
Понятно что 100 ашкеназов Q1b с 37 маркерами в базе вообще не нужны. Достаточно их и с 67 маркерами. А вот брахманов Сарасвати или обских карагасов можно взять и с 17 маркерами. Просто нужно сформировать политику в этой области обязательную для администраторов гаплогрупп. Все люди разумные, полагаю, что перегибов не будет.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Может.
Раньше робот скачивал гаплотипы по номерам из проектов. Насколько я понял, в каждом отдельном проекте, гаплотипы нумеровались от единицы и далее по возрастающей. Поэтому один и тот же гаплотип, в разных проектах, мог иметь разные номера. Мы с уважаемым Вадимом, решили обойти эту проблему, добавив к коротким номерам уникальный, сгенерированый ID.
В любом случае, независимо от причин появления разных гаплотипов с короткими номерами, мне они принесли несколько неприятных моментов, когда я разгребал полученные миксы.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4192/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
С 17-ти маркерными гаплотипами, пока, торпиться не будем. Дело в том что при наличии таких гаплотипов, возникают определенные трудности с поиском приближенцев. Короткие гаплотипы забивают всех других приближенцев. Зашел в логический тупик, надо придумать обходной путь, а много времени уделить приложению, сейчас не могу. Пока не решу эту проблему, придется ограничить ввод коротких гаплотипов.

ОК. Пока воздержимся. Но вижу, как минимум, одно простое решение. Программно ограничить "участие" коротких гаплотипов (<67) в тех выдачах данных, где они могут негативно повлиять на результат. Оставить без ограничения только опции по снипам. Просто очень много глубоко проснипованных, но "коротких" гаплотипов как в коммерческих базах, так и в научных работах.
Понятно что 100 ашкеназов Q1b с 37 маркерами в базе вообще не нужны. Достаточно их и с 67 маркерами. А вот брахманов Сарасвати или обских карагасов можно взять и с 17 маркерами. Просто нужно сформировать политику в этой области обязательную для администраторов гаплогрупп. Все люди разумные, полагаю, что перегибов не будет.

Согласен. Я как раз сейчас пытаюсь понять, как гибко ограничить, по длине, данные идущие в модуль поиска совпаденцев. И при этом не поломать существующий функционал.На данном этапе, это логическая дилемма.  Хорошо бы посоветоваться с хорошим математиком-теоретиком. :)
« Последнее редактирование: 29 Январь 2012, 21:33:23 от Тунец »

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Насколько я понял, в каждом отдельном проекте, гаплотипы нумеровались от единицы и далее по возрастающей. Поэтому один и тот же гаплотип, в разных проектах, мог иметь разные номера. Мы с уважаемым Вадимом, решили обойти эту проблему, добавив к коротким номерам уникальный, сгенерированый ID.

ФТДНА имеет сквозную нумерацию образцов. Не по проектам. Даже если добавляются образцы от проекта Genographics или от присоединенных фирм со своей нумерацией они получают в ФТДНА уникальный ID, начинающийся с буквы.
Проблема могла быть с гаплотипами из отдельных проектов, например из WF. По моей гаплогруппе только эти гаплотипы имели двузначные номера, которые теоретически могут пересекаться с первыми клиентами ФТДНА.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.