АвторТема: Semargl.me: он-лайн сервис для анализа данных по Y-ДНК  (Прочитано 113288 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5238
  • Страна: hr
  • Рейтинг +2504/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Возможно такое следует сделать для всех полиндромных DYS.
Согласен.

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 10074
  • Страна: ru
  • Рейтинг +566/-2
чем вас так всех эти локусы не устроили?

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5238
  • Страна: hr
  • Рейтинг +2504/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
чем вас так всех эти локусы не устроили?
При построении деревьев они могут сильно искажать результат.
При поиске совпаденцев, в некоторых случаях (в основном это касается DYS464 и 19b), ломается алгоритм поиска.
В результате мы не найдем ни одного совпаденца, а если найдем, то они будут из других ветвей.
Все это недостатки используемого мной алгоритма, но я не придумал как преодолеть эту багу.
Логичное решение - предоставить пользователю возможность отключать поиск по палиндромным маркерам.

Оффлайн kaa76

  • Сообщений: 663
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
чем вас так всех эти локусы не устроили?
При построении деревьев они могут сильно искажать результат.
При поиске совпаденцев, в некоторых случаях (в основном это касается DYS464 и 19b), ломается алгоритм поиска.
В результате мы не найдем ни одного совпаденца, а если найдем, то они будут из других ветвей.
Все это недостатки используемого мной алгоритма, но я не придумал как преодолеть эту багу.
Логичное решение - предоставить пользователю возможность отключать поиск по палиндромным маркерам.
Проблема в SQL? Тогда можно хранить для отсутствия значения -1, а не NULL.
Не?

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5238
  • Страна: hr
  • Рейтинг +2504/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
чем вас так всех эти локусы не устроили?
При построении деревьев они могут сильно искажать результат.
При поиске совпаденцев, в некоторых случаях (в основном это касается DYS464 и 19b), ломается алгоритм поиска.
В результате мы не найдем ни одного совпаденца, а если найдем, то они будут из других ветвей.
Все это недостатки используемого мной алгоритма, но я не придумал как преодолеть эту багу.
Логичное решение - предоставить пользователю возможность отключать поиск по палиндромным маркерам.
Проблема в SQL? Тогда можно хранить для отсутствия значения -1, а не NULL.
Не?
Проблема не в SQL'e.
Для поиска сопаденцев я использую k-d деревья: http://en.wikipedia.org/wiki/K-d_tree
Для подготовки данных, гаплотипы выгружаются в двумерную матрицу, которая преобразуется в k-d дерево.
Проблема в том, что в матрице не может быть значения null. Если же мы ставим любое число, то отсчет дистанции будет вестись от него. В этом случае приближенцы, с отсутствующим значением какого либо маркера, не будут найдены.
Слышал, вышли новые версии, используемых мной библиотек, но их надо заново рассматривать, тк слишком много кардинальных изменений.

Есть еще пара структурных затыков, которые не так просто обойти.
- Например, кто ближе к тебе, 12-ти маркерный гаплотип с ГД=1 или 37-ми маркерный с ГД=3? =)
- каким образом сравниивать гаплотипы разной длины? Про матрицу см. выше :)
и тд и тп

Дойдут руки - займусь. Может во время холодных зимних вечеров)))
« Последнее редактирование: 04 Октябрь 2012, 14:53:36 от Semargl »

Оффлайн wbull

  • Сообщений: 421
  • Страна: ru
  • Рейтинг +44/-0
    • Rickman Surname Project
  • Y-ДНК: E1b1b1a1, Cluster : E-L618* , Geno 2.0: E-CTC10912
  • мтДНК: U5a1g
Подскажите пожалуйста, как правильно конвертировать файлы FF в файл RF.
FF состоит из двух файлов, а RF, как я понимаю, из одного. Конвертировать только аутосомный файл или надо как то его соединить с Х файлом?

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6246
  • Страна: ru
  • Рейтинг +1116/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Подскажите пожалуйста, как правильно конвертировать файлы FF в файл RF.
FF состоит из двух файлов, а RF, как я понимаю, из одного. Конвертировать только аутосомный файл или надо как то его соединить с Х файлом?

Конвертируется только аутосомный файл.

Оффлайн napobo3

  • Сообщений: 1336
  • Страна: il
  • Рейтинг +337/-2
  • קַח-נָא אֶת-בִּנְךָ אֶת-יְחִידְךָ אֲשֶׁר-אָהַבְתָּ, אֶת-יִצְחָק
  • Y-ДНК: J-FGC5231
  • мтДНК: N1b2
Подскажите пожалуйста, как правильно конвертировать файлы FF в файл RF.
FF состоит из двух файлов, а RF, как я понимаю, из одного. Конвертировать только аутосомный файл или надо как то его соединить с Х файлом?
А почему Вам потребовалось его конвертировать?

Оффлайн wbull

  • Сообщений: 421
  • Страна: ru
  • Рейтинг +44/-0
    • Rickman Surname Project
  • Y-ДНК: E1b1b1a1, Cluster : E-L618* , Geno 2.0: E-CTC10912
  • мтДНК: U5a1g

Подскажите пожалуйста, как правильно конвертировать файлы FF в файл RF.
FF состоит из двух файлов, а RF, как я понимаю, из одного. Конвертировать только аутосомный файл или надо как то его соединить с Х файлом?
А почему Вам потребовалось его конвертировать?
Чтобы воспользоваться интерпретомом.

Оффлайн napobo3

  • Сообщений: 1336
  • Страна: il
  • Рейтинг +337/-2
  • קַח-נָא אֶת-בִּנְךָ אֶת-יְחִידְךָ אֲשֶׁר-אָהַבְתָּ, אֶת-יִצְחָק
  • Y-ДНК: J-FGC5231
  • мтДНК: N1b2

Подскажите пожалуйста, как правильно конвертировать файлы FF в файл RF.
FF состоит из двух файлов, а RF, как я понимаю, из одного. Конвертировать только аутосомный файл или надо как то его соединить с Х файлом?
А почему Вам потребовалось его конвертировать?
Чтобы воспользоваться интерпретомом.
Имейте в виду, что ФТДНА данные соответствуют 36-му билду, а 23ими - 37-му.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6246
  • Страна: ru
  • Рейтинг +1116/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Почему-то сайт http://www.semargl.me стал сильно подтормаживать...
Завис происходит (судя по информации в статусе браузера) на ссылках на внешние сайты: Facebook (лайк?) и Google (map).

Оффлайн wbull

  • Сообщений: 421
  • Страна: ru
  • Рейтинг +44/-0
    • Rickman Surname Project
  • Y-ДНК: E1b1b1a1, Cluster : E-L618* , Geno 2.0: E-CTC10912
  • мтДНК: U5a1g

Подскажите пожалуйста, как правильно конвертировать файлы FF в файл RF.
FF состоит из двух файлов, а RF, как я понимаю, из одного. Конвертировать только аутосомный файл или надо как то его соединить с Х файлом?
А почему Вам потребовалось его конвертировать?
Чтобы воспользоваться интерпретомом.
Имейте в виду, что ФТДНА данные соответствуют 36-му билду, а 23ими - 37-му.
А что это такое и как это надо практически учитывать?

Оффлайн JaG

  • Сообщений: 517
  • Страна: fm
  • Рейтинг +131/-0
  • Y-ДНК: J2a-L556 (Y13511+)
  • мтДНК: H5c2
http://forum.molgen.org/index.php/topic,5021.msg165750.html#msg165750

Ув. Semagl,
Нужно приводить результаты синонимичных названий снипов к единому, например: CTS2453, PF4806, Z2319 -> Z2319 или CTS2453/PF4806/Z2319.
Иначе автоматическая загрузка новых данных Роботом приведет к неразберихе.
До сих пор FTDNA пользовалась только одним из названий в подобных случаях, обычно из серии L.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5238
  • Страна: hr
  • Рейтинг +2504/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
http://forum.molgen.org/index.php/topic,5021.msg165750.html#msg165750

Ув. Semagl,
Нужно приводить результаты синонимичных названий снипов к единому, например: CTS2453, PF4806, Z2319 -> Z2319 или CTS2453/PF4806/Z2319.
Иначе автоматическая загрузка новых данных Роботом приведет к неразберихе.
До сих пор FTDNA пользовалась только одним из названий в подобных случаях, обычно из серии L.
Согласен с вами.
Проект гено2 принес мне много головной боли)
проблема не только с синонимами, а с ошибками в определении некоторых снипов.
С синонимами буду разбираться в любом случае, рано или поздно.
А вот с ошибочно определенными снипами, а также с обратными мутациями уже есть идеи как бороться, но необходимо свободное время для реализации алгоритма.
Спасибо что обратили мое внимание на эту проблему.

Оффлайн JaG

  • Сообщений: 517
  • Страна: fm
  • Рейтинг +131/-0
  • Y-ДНК: J2a-L556 (Y13511+)
  • мтДНК: H5c2
Начали появляться давно обещанные результаты с микроаллелями, в формате "[округленное значение] (точное значение)": 33 (33.2)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100