АвторТема: Обсуждение статьи С.Каржавина "Математический анализ возможности определения..."  (Прочитано 46203 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн АнТюр

  • Сообщений: 535
  • Рейтинг +50/-131
Животовский проводил "калибровку" скоростей Форстера по полинезийским популяциям и цыганам. Повторяю свой вопрос - при чем здесь ДНК-генеалогия, да еще и израелитов? Этим вопросом занимался АК, за что и получил почетную грамотку и медалъ (c).

Вам придется потерпеть до конца сентября.

Вы бы дали мне ссылку на работу А. Клесова, в которой он критически рассматривает скорости по Ж. За одно я и ее расмотрел бы.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
В первом или втором Вестник ДНК. Его теперь можно бесплатно скачать по известному Вам адресу. И в связи с скоростями Животовского Клесов ничего "критически не рассматривал", он просто написал, что их нельзя применять и все.

Животовский проводил "калибровку" скоростей Форстера по полинезийским популяциям и цыганам. Повторяю свой вопрос - при чем здесь ДНК-генеалогия, да еще и израелитов? Этим вопросом занимался АК, за что и получил почетную грамотку и медалъ (c).

Вам придется потерпеть до конца сентября.

Вы бы дали мне ссылку на работу А. Клесова, в которой он критически рассматривает скорости по Ж. За одно я и ее расмотрел бы.

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Уважаемый АнТюр, давайте никого  не будем хватать за руки. Это занятие, хоть и будоражит кровь, но отнимает кучу времени (как рецензирование и разбор чужих статей). Давайте лучше вместе сосредоточимся на проведении новых калибровок. Конечно, если Вы увидели какие-то важные методологические особенности, неприменимые для задач ДНК-генеалогии, то такой разбор будет полезен.
Здесь хочу заметить, что уважаемый Анатолий Алексеевич проделал очень важную работу, а именно, вычислил усредненные скорости мутаций для 6-ти, 12-ти, 25-ти, 37-и и 67-ми маркерных гаплотипов. Замечу, что такой подход абсолютно правомерен, исходя из независимости фактов мутирования в маркерах, т.е., суммарный поток мутаций в гаплотипе представлен в виде суперпозиции парциальных (маркерных) потоков. Несмотря на кажущуюся ТЕПЕРЬ очевидность, изначально это было ясно да-а-а-леко не каждому. Эта работа открыла возможность проведения большого количества исследований по датировкам различных гаплогрупп и их субкладов.
Ввиду "общенародной" значимости констант Анатолия Алексеевича народ, в общем то, имеет право потребовать выложить все исходные данные и как они использовались в процессе калибровки. Хотя, я лично требовать этого, конечно, не буду, поскольку полностью доверяю автору и знаю его корректность в вычислениях. Дело в том, что время идет, добавляются новые данные, которые надо учитывать, а, следовательно, и проводить периодически перекалибровку данных, увы...
Но здесь есть и серьезная проблема: указанные маркерные совокупности и, соответственно, скорости мутаций жестко зафиксированы, и если вы имеете дело с каким-то нестандартным набором маркеров, то вы его должны или усекать до одного из вышеуказанных стандартов или ... А вот что делать, если "или" - непонятно. Очевидно, что необходимо иметь скорость мутаций ПО КАЖДОМУ маркеру, чтобы в каждом конкретном случае комбинировать необходимый набор. Но решение такой задачи под силу лишь коллективу заинтересованных лиц, о чем я и писал чуть ранее.
« Последнее редактирование: 02 Сентябрь 2009, 22:21:55 от Каржавин »

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Это очевидно. В принципе у иностранных "коллег" (назовем их так) много наработок именно по нестандартным наборам маркеров (напомню, что АК использует стандартные "панельные" маркерные наборы маркеров FTDNA). Тот же Чандлер и его последователи рассчитали и "откалибровали", например скорости маркеров для нестандартных наборов SMFG (идентичный набору Relative Genetics, а теперь - Ancestry) и Genebase.

Очевидно, что необходимо иметь скорость мутаций ПО КАЖДОМУ маркеру, чтобы в каждом конкретном случае комбинировать необходимый набор. Но решение такой задачи под силу лишь коллективу заинтересованных лиц, о чем я и писал чуть ранее.

Оффлайн АнТюр

  • Сообщений: 535
  • Рейтинг +50/-131
Уважаемый АнТюр, давайте никого  не будем хватать за руки. Это занятие, хоть и будоражит кровь, но отнимает кучу времени (как рецензирование и разбор чужих статей). Давайте лучше вместе сосредоточимся на проведении новых калибровок. Конечно, если Вы увидели какие-то важные методологические особенности, неприменимые для задач ДНК-генеалогии, то такой разбор будет полезен.
Здесь хочу заметить, что уважаемый Анатолий Алексеевич проделал очень важную работу, а именно, вычислил усредненные скорости мутаций для 6-ти, 12-ти, 25-ти, 37-и и 67-ми маркерных гаплотипов. Замечу, что такой подход абсолютно правомерен, исходя из независимости фактов мутирования в маркерах, т.е., суммарный поток мутаций в гаплотипе представлен в виде суперпозиции парциальных (маркерных) потоков. Несмотря на кажущуюся ТЕПЕРЬ очевидность, изначально это было ясно да-а-а-леко не каждому. Эта работа открыла возможность проведения большого количества исследований по датировкам различных гаплогрупп и их субкладов.
Ввиду "общенародной" значимости констант Анатолия Алексеевича народ, в общем то, имеет право потребовать выложить все исходные данные и как они использовались в процессе калибровки. Хотя, я лично требовать этого, конечно, не буду, поскольку полностью доверяю автору и знаю его корректность в вычислениях. Дело в том, что время идет, добавляются новые данные, которые надо учитывать, а, следовательно, и проводить периодически перекалибровку данных, увы...
Но здесь есть и серьезная проблема: указанные маркерные совокупности и, соответственно, скорости мутаций жестко зафиксированы, и если вы имеете дело с каким-то нестандартным набором маркеров, то вы его должны или усекать до одного из вышеуказанных стандартов или ... А вот что делать, если "или" - непонятно. Очевидно, что необходимо иметь скорость мутаций ПО КАЖДОМУ маркеру, чтобы в каждом конкретном случае комбинировать необходимый набор. Но решение такой задачи под силу лишь коллективу заинтересованных лиц, о чем я и писал чуть ранее.

Да я не против того, что бы каждый зинимался тем, чем считает нужным заниматься. Никакими формальными рамками мы не связаны. Сосредотачивайтесь на новых калибровках. Я не против. Но я ими заниматься не буду. Мне интересны другие аспекты способов оценки скоростей мутаций.


Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Уважаемый коллеги,

Несколько соображений. Во-первых, отрадно читать, что участников в основном интересует ДЕЛО, а не "ловить кого-то за руки". Это - чистой воды паранойя, далекая от науки. Я отнюдь не разделяю подход Л.А. Животовского и перенос примитивных методов попгенетики в ДНК-генеалогию, но ни за что не буду подозревать его в подгонке, тем более в подгонке под библейские параметры, как некто здесь постоянно муссирует.  Люди имеют право на ошибку, и у Л. Животовского - честная ошибка. Он применяет идеальную математическую модель, которая серьезно отклоняется от реалий, и в этом его ошибка. Ошибка Л. Животовского и в том, что он не разработал четких критериев, когда надо применять "популяционную модель" (ее вообще применять не надо), и когда "генеалогическую". Ип оэтому внес раздрай в расчеты. К сожалению, люди, ничего гне понимающие в математике и в динамике мутаций, бездумно схватились за его метод, и этим нанесон огромный ущерб в развитии этой области науки.     

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Продолжаю. Во-вторых, обращаю внимание на то, что некоторые высказывающиеся не в курсе вопроса, и тем не менее высказываются. Вот - типичный пример:

В принципе у иностранных "коллег" (назовем их так) много наработок именно по нестандартным наборам маркеров (напомню, что АК использует стандартные "панельные" маркерные наборы маркеров FTDNA). Тот же Чандлер и его последователи рассчитали и "откалибровали", например скорости маркеров для нестандартных наборов

Я понимаю, что ВВ просто не может знать, что в печати находится моя статья, в которой приведены скорости мутаций для 26 разных форматов гаплотипов. Но и в Вестнике №5 за 2008 год приведены средние скорости мутаций для 11 форматов гаплотипов.

Далее, особенность математиков в том, что они рассуждают в общих категориях, типа "надо провести калибровки". Так кто мешает? Я и провожу. Милости просим и других. Только это тупиковый путь. Будет бесконечное подправление в десятых и сотых долях. А надо иметь принципиальный результат. Он - есть.





Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Продолжаю. О подходе Нортведта. Ничего там принципиально отличающего нет. Я с ним постоянно на связи, и сравниваем расчеты. Примерно то же самое.

В недавней серии статей с Д. Адамовым мы показали, что как ни считать - если считать правильно, получается одно и то же. Что линейным методом, что логарифмическим, что "квадратичным", что пермутационным. Да ничего другого получиться и не может. Формулы разные, а суть одна.

Теперь о методе Животовского. Это - идеализированная модель для бесконечного числа общих предков. Для расчетов в ДНК-генеалогии она обычно неприменима. Хотя если считать для, например, гаплогруппы А, где десяток ветвей, уходящих в древность, и если взять гаплотипов триста (чего нет), и считать для всех чохом, то прием Животовского может и сработать. Иначе говоря, подход Животовского работает для "бесконечного" разнообразия гаплотипов и гаплогрупп.  Он в статье и моделировал свой подход для 10 тысяч (!) гаплогрупп.     

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Резюмирую. Не надо стараться быть святее папы и стараться разработать некий идеальный подход к расчету времен до общего предка. Его не будет. Надо иметь некий стандартный подход, который дает разумные данные. Он есть. Он работает на всех известных генеалогиях. Он дает разумные данные. Уже хорошо.

Теперь надо эти данные сверять с историей, археологией, лингвистикой. Делать оптимизацию понятий. Вырабатывать методологию сопоставления. Стыковать терминологию. Делать открытия в этих направлениях. Вот где приоритет.

Мой подход - строить деревья гаплотипов, выделять и идентифицировать ветви, анализировать каждую ветвь отдельно, а затем сопоставлять базовые гаплотипы для всех ветвей и находить возрасть пра-предка. При этом получаются часто совершенно новые вещи. Техника счета - дело десятое, она уже отработана и выверена. 

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Завершаю. Скорости мутаций - это уже пройденный (для меня) этап. Времена общих предков - тоже не самоцель. Цель - построение основ "молекулярной истории". Создание методологии реконструкции истории на основе данные ДНК-генеалогии, создание системы интерпретации данных ДНК-генеалогии. Расчет гаплотипов - это здесь просто инструмент. 

К сожалению, современная академическая наука здесь - это свод басней и небылиц, базирующихся на принципиально неверной методологии. В частности, на "методе Животовского". Вот здесь предстоит тяжелая борьба с устоявшейся (уже) догмой. Именно поэтому я бросил перчатку "звездам" - Хаммеру, Скорецкому, Карафет, Бехару, Животовскому. К моему удивлению, Human Genetics статью моментально приняли. Через пару недель выйдет, вместе с ответом "звезд". Вот такого пока в ДНК-генеалогии не было. Так что посмотрим за развитием событий.   

Оффлайн АнТюр

  • Сообщений: 535
  • Рейтинг +50/-131
Завершаю. Скорости мутаций - это уже пройденный (для меня) этап. Времена общих предков - тоже не самоцель. Цель - построение основ "молекулярной истории". Создание методологии реконструкции истории на основе данные ДНК-генеалогии, создание системы интерпретации данных ДНК-генеалогии. Расчет гаплотипов - это здесь просто инструмент. 

В общем это так. Мне, например, тоже нужно пройти через анализ способов оценки скоростей мутаций. После того, как это будет сделано, я смогу написать "это уже пройденный этап". Но каждый, кто хочет заниматься "построеним основ "молекулярной истории"" должен его пройти, причем, своим путем. Залипать на этом этапе смысла не имеет. И, конечно, "Расчет гаплотипов - это здесь просто инструмент". Оценочные критерии возможностей ДНК-генетики будут находится именно в области построения моделей прошлого Человечества. В ближайшее время они будут частными. Это понятно.

При этом нам нет необходимости приходить к общему мнению, например, по скорости по Ж. Я считаю, что эта скорость "сконструирована" целенаправлено для согласования ДНК-данных по евреям с их Библейской историей. А. Клесов может считать, что это неосознанная ошибка. Могут быть и другие мнения. Это нормально.

P.S. Я был бы очарован текстами ув. aklyosov'a в этой теме, если бы не был знаком с его реальными способами работы с фактическими ДНК-данными. 
« Последнее редактирование: 03 Сентябрь 2009, 08:40:06 от АнТюр »

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Продолжаю. О подходе Нортведта. Ничего там принципиально отличающего нет. Я с ним постоянно на связи, и сравниваем расчеты. Примерно то же самое.
В недавней серии статей с Д. Адамовым мы показали, что как ни считать - если считать правильно, получается одно и то же. Что линейным методом, что логарифмическим, что "квадратичным", что пермутационным. Да ничего другого получиться и не может. Формулы разные, а суть одна.
Уважаемый Анатолий Алексеевич, в общих я с Вами согласен. Но меня несколько насторожил один случай пару месяцев назад, когда я обрабатывал совокупность из 373 гаплотипов субклада, по-моему, E1b1... В модальном гаплотипе у меня получилось расхождение аж в 3-х маркерах по сравнению с общепринятыми методами. Это было обнаружено благодаря уважаемому Вадиму Вереничу. Я обратил внимание, что расхождение получилось у тех маркеров, у которых гистограммы аллелей были сильно перекошены. А на симметричных гистограммах все методы одинаково хорошо работают. Так что, в 80% (цифра. конечно, очень приблизительная) все методы дадут одинаково правильные результаты, а вот в 20% может получиться весьма сильное различие.
Теперь что касается обработки отдельных гаплотипов, например, полученных из дДНК, то здесь вообще отдельный разговор.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Уточняю, это были R1b1b2.  :)

Продолжаю. О подходе Нортведта. Ничего там принципиально отличающего нет. Я с ним постоянно на связи, и сравниваем расчеты. Примерно то же самое.
В недавней серии статей с Д. Адамовым мы показали, что как ни считать - если считать правильно, получается одно и то же. Что линейным методом, что логарифмическим, что "квадратичным", что пермутационным. Да ничего другого получиться и не может. Формулы разные, а суть одна.
Уважаемый Анатолий Алексеевич, в общих я с Вами согласен. Но меня несколько насторожил один случай пару месяцев назад, когда я обрабатывал совокупность из 373 гаплотипов субклада, по-моему, E1b1... В модальном гаплотипе у меня получилось расхождение аж в 3-х маркерах по сравнению с общепринятыми методами. Это было обнаружено благодаря уважаемому Вадиму Вереничу. Я обратил внимание, что расхождение получилось у тех маркеров, у которых гистограммы аллелей были сильно перекошены. А на симметричных гистограммах все методы одинаково хорошо работают. Так что, в 80% (цифра. конечно, очень приблизительная) все методы дадут одинаково правильные результаты, а вот в 20% может получиться весьма сильное различие.
Теперь что касается обработки отдельных гаплотипов, например, полученных из дДНК, то здесь вообще отдельный разговор.

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Уточняю, это были R1b1b2.  :)
М-да...

Да, я еще вот что хотел добавить. Когда мы имеем дело с малой выборкой гаплотипов (5-10), то для оценки дисперсии и параметров, с ней связанных, статистики маловато. Именно здесь алгоритмы, опирающиеся на вычисление дисперсии и другие моменты распределения аллелей, начнут сильно ошибаться. Конечно, и, например, метод максимального правдоподобия при малой статистике тоже теряет точность, но в меньшей степени в силу его оптимальности.
Конечно, в некоторой степени это академический спор, поскольку объемы совокупностей гаплотипов растут со временем, и все меньше будет коротких выборок.
А вот проблема перекоса гистограмм аллелей и его влияние на оценку количества мутаций дисперсионными методами останется всегда.
« Последнее редактирование: 03 Сентябрь 2009, 16:14:33 от Каржавин »

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Чуть не забыл. Рано я сам собственную статью начал критиковать "в хвост и в гриву". Что касается процедур максимального правдоподобия для анализа отдельно взятого гаплотипа, то представление многомерной плотности вероятности в виде произведения одномерных плотностей корректно, поскольку в качестве отдельных измерений используются значения аллелей в маркерах данного гаплотипа, а они стохастически независимы друг от друга. Таким образом, оба варианта поиска максимально правдоподобной оценки для отдельно взятого гаплотипа в рамках двух рассмотренных моделей построены правильно.
На самом деле, с точки зрения качества оценки для отдельного гаплотипа я вообще не вижу альтернатив методу максимального правдоподобия среди всех существующих в настоящее время методов.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.