Перейти к содержанию
asan-kaygy

Генетическая криминалистика

Рекомендуемые сообщения

Цитата

Натолкнулся на такую интересную статью или обзор.

Investigative genetic genealogy: Current methods, knowledge and practice
Daniel Kling, Christopher Phillips, Debbie Kennett, Andreas Tillmar.
https://www.fsigenetics.com/article/S1872-4973(21)00013-2/fulltext#secsect0010

IGG – Investigative Genetic Genealogy – кримниналистическая (следственная) генетическая генеалогия.

Криминалистическая (следственная) генетическая генеалогия: современные методы, теория и практика.

Краткое содержание
Криминалистическая генетическая генеалогия возникла как новая и быстроразвивающаяся область криминалистической науки. Мы опишем процесс анализа плотных СНИП-данных, обычно составляющихх более полумиллиона маркеров, для определения дальнего родства. Под дальним родством вы подразумеваем степени родстава далее двоюродных братьев и сестер. В этом обзоре мы опишем как методы определения родства и нализа снипов применяются в широком маштабе в криминалистике для определения подозреваемого в криминалистическом расследовании или пропавшего человека. В современной генетической криминалистике есть необходимость понимания используемых моделей для определения родства, а также для более полного использования технологий ДНК и данных используемых в КГГ (IGG). В данном обзоре освящяется много тем, исследуются эффективность и практические границы методов и предлагаются будущие направления их криминалистического подтверждения. Мы также изучили методы, используемые крупными компаниями, предлагающими генеалогические тесты для потребителей. Для этого мы выслали анкеты поставщикам криминалистической генетической генеалогии для краткого описания их методов и услуг. Хотя в большинстве компаний, предлагающих ДНК-тесты, и в целом в генетической генеалогии, применяются собственные нераскрытые алгоритмы мы опишем текущее положение, где информация обсуждалась или была опубликована.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

- В 2018 году было продано больше ДНК-тестов, чем в сумме за все предыдущие годы.
- 36 миллионов ДНК-тестов к августу 2020.

- Арест Йозефа ДиАнджело в 2018 привлек всемирное внимание в использованию генетической генеалогии в криминалистических расследованиях. С тех пор методы были применены в расследованиях почти 200 ”глухарей”. Часто применяется полногеномное секвенирование для создания набора снипов для будущего сравнения. Большинство методов основано на сравнении длинных последовательностей, сегментов, но есть и другие методы сравнения.

- Ancestry использует алгоритм BEAGLE для фазирования коротких участков ДНК и далее использует фазированные гаплотипы как ”затравку” для поиска. Частота гаплотипа учитывается при поиске сегментов и меньший вес придается участкам с необычно высокими совпадениями. Применяется вероятностная модель для определения участков короче 4-5 сМ – это работает лучше, но требует вычислительных мощностей.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

Ограничения
- Для определения двоюродных братьев и сестер, требуется чип с минимум 56 000 снипов.
- Необходимо учитывать неравновесное сцепление генов, при панелях более 30 000 снипов, особенно в некоторых популяциях. В цитированной статье отмечается, что особенно для финнов высока вероятность ложных совпадений – включение совпаденца при отсутствии близкого/ожидаемого родства.
- Вычисленные сегменты в 1-2 сМ на самом деле результат слияния мелких сегментов от 0,2 сМ и более.
- Ancestry показала, что и более длинные сегменты, даже до 50 сМ, могут наследоваться от общей популяции.
- Ancestry показала, что вычисленные сегменты в тройках мать-отец-ребенок могут не совпадать до 30 сМ, несовпадение с вероятностью 50% при длине 6 сМ.

- Теоретическая вероятность несовпадения ДНК для четвероюродных братьев и сестер – 2%, для пятиюродных – 30%. На практике – из анализа данных в 23andme удалось определить 90% четвероюродных и 46% пятиюродных.
- Использование полногеномного секвенирования может улучшить предсказания степени родства. Возможно увеличение на 5-15% в определении дальних роственников. Девятиюродные и десятиюродные родственники могут быть определены по редким генетическим вариантам, снипам, в результатах полногогеномного секвенирования.

- Предсказание степени родства осложняется эндогамией и редукцей предков. Все европецы связаны между собой в пределах 1000 лет. Два европейца из близких популяций разделяют от 2 до 12 генетических предков за последние 1500 лет и более 100 генетических предков за последнюю 1000 лет, с существенными региональными отличиями в степении разделения. Для единичного сегмента в 10 сМ сложно оценить возраст и определить степень родства. У евреев-ашкенази существенное разделение сегментов более 3 сМ и 5 сМ. Высокая степень разделения сегментов была обнаружена и у якутов.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

Генеалогические исследования
- Чтобы раскрыть дело генеалогам в пилотном исследовании понадобилось 3 часа в случае совпадения ”Прямой родственник” (Immediate Relative) (родители, дети, братья, сестры) и 50-100 часов для четвероюродный и пятиюродных родственников.
- Процесс КГГ начинается с загрузки на сайты GEDmatch, FTDNA и DNASolves.
- Дело стоит расследовать в случае совпадения четвероюроный или ближе. Успех поиска зависит от возможности идентификации совпаденцев по имени, имени пользователя, адреса электронной почты и семейного дерева. Поиск осложняется, если совпаденец из страны с ограниченным доступом к генеалогическим записям и где доступ к данным о живых людях ограничен.
- Более дальние совпаденцы (пятиюродные и далее) всеже могут помочь, но часто требуется направленное тестирование людей более близких к подозреваемому. В таком случае просят о помощи в расследовании – сделать ДНК-тест и загрузить его в какую-либо базу данных.
- Эрлих, MyHeritage (1,3 миллиона профилей на момент исследования) – 60% вероятность найти человека европейского происхождения со степенью родства четвероюродный или ближе и 100 сМ и более, 15% - 300 сМ и более. 75% в базе данных MyHeritage имеют северо-европейское происхождение.
- Количество профилей в FTDNA и GEDmatch уже скоро может достичь критической массы и почти каждый житель США европейского происхождения может быть идентифицирован.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

Компании, предлагающие потребительские ДНК-тесты
4 крупных компании – AncestryDNA, 23andme, MyHeritage, FTDNA.
- 20% совпаденцев – ложные совпаденцы из-за ограничений в чиповой технологии.
- Упоминется полногеномное секвенирование в Dante Laboratories, Full Genomes Corporation, Nebula Genomics, YSEQ. FTDNA не принимает данные WGS, но теоретически пользователи могут использовать схожий формат данных с каким-либо чипом и загрузить свои данные. Пока нет баз данных для работы с полногеномными данными.

Ancestry
- 20 миллионов профилей
- Использует OmniExpress с 637 000 снипов (версия 2, 2016).
- Не использует Х-хромосому для сравнений
- Y и мито тесты прекратились в 2014 году.
- Хотя доступ служб к ДНК-данным ограничен, генеалогические записи и семейные деревья широко используются в криминалогическом генеалогическом поиске.
- В некоторых случаях, направленное тестирование делают сперва в Ancestry, а затем данные загружают в базы, доступные службам.

23andme
- 12 миллионов профилей (январь 2021)
- 80%участвуют в исследованиях
- GSA чип, ранее четыре версии OmniExpress.
- Единственная компания, которая полностью использует Х-хромосому в поиске совпаденцев
- Пользователи сообщают о своих болезнях и чертах, что помогает в криминалистическом фенотипировании.
- Не предоставляет никакого доступа службам, утверждают, что будут любой ценой боротся за отказ службам в доступе к данным.
- На май 2020 года было получено 7 запросов, все от служб США, и во всех случаях в доступе было отказано.

MyHeritage
- 4,5 миллиона профилей
- Принимает данные 23and, AncestryDNA, FTDNA, LivingDNA
- чип GSA с 2019, ранее OmniExpress
- Тест по здоровью с июня 2019, чип GSA модифицирован
- Данные по Х-хромосоме доступны, но не используются.
-  База MyHeritage невольно позволила разрешить случай Йозефа ДиАнджело. Условия договора были после этого изменены и  компания запрещает службам использовать их ДНК-услуги.
- Несмотря на запрет, незаконный доступ служб к данным всеже возможен т.к. компания принимает сторонние данные.
- Новый алгоритм поиска совпаденцев, сравнимый с Ancestry – короткие фазированные сегменты удлиненные нефазироваными данными.

FTDNA
- 1,4 миллиона профилей
- Изначально Y- и мито тесты. Аутосомные тесты с 2010.
-  Чип GSA с весны 2019, ранее OmniExpress с 2011, а еще ранее чип Affymetrix Axiom
- Минимальное совпадение должно быть 9 сМ и 500 SNP.
- Большинство коротких сегментов – или ложные совпадения из-за отсутствия фазирования данных или не представляют генеалогического интереса.
- Х-хромосома не включается в длину разделенных сМ и совпадение по Х-хромосоме отмечается только в случае аутосомного совпадения. Рассчитывается до 1сМ. Высокий уровень ложных совпадений, так как на чипах мало снипов в Х-хромосоме. Большая разница в Х-совпаденцах у мужчин и женщин.
- Принимает данные от других компаний. С марта 2018 сотрудничают с BC Platforms и решают совместимость данных от разных чипов и историческую совместимость данных. Детали неизвестны.
- Прием данных других компаний неизбежно привел к незаконному использованию базы данных службами. В январе 2019 ФБР проникло в базу данных FTDNA и компании пришлось согласиться на сотрудничество с ФБР.
- с марта 2019 пользователи могут согласиться с использованием их ДНК службами для поиска совпаденцев.
- в декабре 2020 стало ясно, что FTDNA сделала тест в деле Йозефа ДиАнджело и позовлила залить его в свою базу данных в ходе скрытой операции. ФБР закрыла доступ ко всем деталям этой работы.
- тесты, загружаемые службами, не видны остальным пользователям. Службы получают более ограниченный список совпаденцев по сравнению с обычными пользователями.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

Другие сервисы
GEDmatch, DNASolves, а также упоминаются DNA.Land, Geneanet, Geni.

GEDmatch
- организован энтузиастами-генеалогами в 2010, куплен компанией Verogen в декабре 2019
- позволяет делать сравнения между тестами из разных компаний
- принимает данные от разных компаний и данные полногеномного секвенирования
- позволяет загружать данные древней ДНК и после тестирования предметов умерших людей
- позволяет при оплате создать супер-набор из тестов ДНК в нескольких компаниях
- есть специальный портал для служб GEDmatch Pro с декабря 2020
- с января 2021 позволяет службам загружать набор для идентификации неидентифицированных человеческих остатков
- неясно как они могут предотвращать незаконное использование сайта
- при обработке данных убираются снипы, связанные со здоровьем или непрочитанные снипы, но некоторые данные по фенотипу всеже доступны
- загрузка криминалистических данных плохого качества и с выской степенью расчетов приводит к большому количеству ложных совпадений, до 25%.
- Взлом в июле 2020 – все наборы, включая и наборы служб, попали в сравнение и были видны всем пользователям.

DNASolves
- база для доступа службам, с декабря 2019
- принимает данные от 4 компаний, а также BAM/SAM, FASTQ и VCF.
- пользователи передают свои ДНК-данные и личные/семейные данные для помощи в раскрытии преступлений.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

Импутация (вычисление) генотипа
- компании и ученые используют много разных чипов, которые со временем меняются
- OmniExpress и GSA имеют менее 200 000 общих снипов
- возможное решение проблемы – вычисление, импутация, отсутствующих снипов
- принцип – даже не родственники имеют общие короткие сегменты ДНК, унаследованные от далекого общего предка. Неравновесное сцепление генов и низкая вероятность рекомбинации на коротком участке сохраняет гаплотип в течение многих поколений
- из таких сегментов можно извлечь недостающие снипы
- высока степень ошибки для редких вариантов, требуется большая референсная группа для увеличения точности расчета
- для генеалогических чипов ожидаеная степень ошибок 1% или менее, большие базы в компаниях могут помочь им сделать более надежный расчет
- несколько компаний используют процесс импутации, но детали неизвестны. MyHeritage описала свой процесс.

 

Ссылка на комментарий
Поделиться на другие сайты

Цитата

"Теоретическая вероятность несовпадения ДНК для четвероюродных братьев и сестер – 2%, для пятиюродных – 30%."

То есть, четвероюродные брат и сестра в 98 процентах случаев увидят себя в аутосомных кузенах при тестировании.  Это 1840-1870 года рождения общих предков.  Прапрабабушка/дедушка.

Пятиюродные видят друг друга в 70% процентов случаев.  Общие предки родились в 1810-1850х.  Прапрапрабабушки/дедушки.

95 процентов матчей у наших образцов - общеевропейская крупа, значит.  Четвероюродные известные друг другу родственники (не через днк или генеалогию, а лично) у меня 1.2-0.8% общих имеют. 

Четвероюродный через одно поколение (дядя/тетя): от 0.8 до 0.3 (самый большой кусок 17сМ).   То есть на этом уровне уже невозможно определить без общего древа.  Настоящее родство или случайно сложившаяся в кусок общеевропейская крошка.

 

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйте новый аккаунт в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти


×
×
  • Создать...