Замысел. Как ДНК делает нас теми, кто мы есть, стр. 69
126 559 человек идентифицируют генетические варианты, связанные с уровнем образования», Science , 340 (2013): 1467-71. doi : 10.1126/science.1235488. Чтобы создать мои полигенные оценки, мы использовали новый подход, называемый LDpred , который корректирует корреляцию (неравновесие по сцеплению) между SNP, чтобы избежать «двойного подсчета» коррелирующих SNP. LDpred также оптимизирует информацию обо всех SNP, а не только о SNP, наиболее тесно связанных с признаком: Bjami J. Vilhjalmsson et al., «Моделирование неравновесия по сцеплению повышает точность показателей полигенного риска», American Journal of Human Genetics, 97 (2015 г. ) . ): 576-92.
doi:10.1016/j.ajhg.2015.09.001.
' Чтобы дать ощущение взрыва GWA исследований за последнее десятилетие, основное хранилище этих результатов включает сводную статистику GWA по 173 признакам, основанную на 1,5 миллионах индивидуумов и 1,4 миллиардах ассоциаций SNP-признаков»: Zheng et al., «LD Hub: Централизованная база данных и веб-интерфейс для выполнения Регрессия оценки LD, которая максимизирует потенциал данных GWAS суммарного уровня для анализа наследуемости SNP и генетической корреляции», Bioinformatics , 33 (2017): 272-9. doi: 10.1093/биоинформатика/btw613.
« В оставшейся части этой главы я поделюсь своими полигенными показателями роста и веса, чтобы исследовать некоторые общие вопросы, поднятые этими показателями» : Моя команда и я собрали мою ДНК из слюны и выделили ДНК, как описано ранее. Затем мы генотипировали мою ДНК по сотням тысяч SNP на SNP-чипе. Мы использовали SNP-чип Illumina Infinium OmniExpress SNP, который генотипирует 600 000 SNP в геноме. После скрининга контроля качества мы получили 562 199 генотипированных SNP. Как обычно, мы использовали эти измеренные SNP для определения ближайших SNP на основе эталонных панелей с данными полногеномного секвенирования большого числа людей. Вменение включает в себя вывод SNP из эталонных панелей, которые сильно коррелируют (т. е. находятся в неравновесии по сцеплению) с нашими измеренными SNP. Мы добавили 7 323 859 предполагаемых SNP, которые использовались вместе с измеренными SNP для построения моих полигенных оценок по результатам исследований GWA.
После генотипирования ДНК на SNP-чипе необходимо проделать большую работу, чтобы разобраться в необработанных данных SNP. Это начинается с серии анализов контроля качества, которые отсеивают ошибки SNP. Конечным продуктом является создание сотен тысяч генотипов SNP для каждого человека. Эти анализы утомительны, но теперь, после десятилетия работы с чипами SNP, стали обычным делом. Еще не рутинным является создание полигенных оценок, которые стали широко использоваться только в последние два года. Сводная статистика для каждого из сотен тысяч SNP из большого исследования GWA для определенного признака необходима для обеспечения весов для получения полигенных оценок для этого признака. Для улучшения показателей полигенности изобретается множество ухищрений, например учет того факта, что SNP, расположенные близко друг к другу на хромосоме, коррелируют.
« Наиболее прогностической полигенной оценкой на данный момент является рост, который объясняет 17% вариаций роста взрослых » Архитектура роста взрослого человека», Nature Genetics, 46 (2014): 1173-86. doi: 10.1038/ng.3097. На главные ассоциации SNP для роста приходится в среднем 0,07% дисперсии, что соответствует эффекту 0,05 см.
« Этот разрыв [между предсказанием признака по полигенной шкале и наследуемостью признака] называется отсутствующей наследственностью» : Брендан Махер, «Персональные геномы: случай отсутствующей наследственности», Nature , 456 (2008): 18–21. . дои: 10.1038/456018a . Отсутствие наследуемости является ключевой проблемой для всех сложных признаков в науках о жизни . Отсутствие наследственности называют «темной материей» полногеномной ассоциации, потому что, хотя она определенно существует, мы не можем ее увидеть. Этот недостающий разрыв в наследуемости будет сокращаться по мере того, как исследования GWA будут расширяться и улучшаться. Используя современные технологии, мы должны быть в состоянии более чем удвоить прогностическую силу полигенных оценок с большими выборками GWA. Еще одна причина для оптимизма заключается в том, что чипы SNP, используемые в исследованиях GWA, в основном включают общие SNP, но большинство различий ДНК не являются общими. Было подсчитано, что современные чипы SNP составляют лишь около половины всей генетической изменчивости генома. Тери А. Манолио и др., «Поиск недостающей наследственности комплексного заболевания», Nature , 461 (2009): 747-53. дои: 10.1038/nature08494. Фрэнк Дадбридж, «Мощность и точность прогнозирования показателей полигенного риска», PLoS Genetics , 9 (2013): doi: 10.1371/journal.pgen.1003348.
Поскольку полногеномное секвенирование фиксирует все унаследованные различия ДНК, а не только общие SNP, оно может удвоить прогностическую силу полигенных оценок. Этот вывод подтверждается новым методом оценки наследуемости, называемым наследуемостью SNP , поскольку он основан на прямом измерении SNP ДНК. Наследуемость SNP оценивает корреляцию между SNP и сходством признаков для неродственных людей среди сотен тысяч SNP на чипе SNP. Хотя в настоящее время существует несколько способов оценки наследуемости SNP, первый метод назывался Анализ комплексных признаков всего генома ( GCTA ): Jian Yang et al., 'Common SNPs Explain a Large Proportion of the Heritability for Human Height', Nature Genetics , 42 (2010): 565-9. doi: 10.1038/ng.608. Цзянь Ян и др., «Разделение генома генетической изменчивости для сложных признаков с использованием
Общие SNP, Nature Genetics, 43 (2011): 519-25. дои: 10.1038/ng.823.
Для сложных признаков наследуемость SNP обычно составляет половину величины наследуемости близнецов, что может быть связано с тем фактом, что современные чипы SNP оценивают только общие SNP, тогда как большинство различий ДНК в геноме не являются общими. Было подсчитано, что современные чипы SNP помечают только около половины генетической изменчивости: Peter M. Visscher et al., «Evidence-based Psychiatric Genetics, aka the False Dichotomy between Common and Rare Variant Hypotheses», Molecular Psychiatry, 17 (2012 ) . ): 474-85. doi: 10.1038/м.
Имеются некоторые свидетельства того, что различия в ДНК, не относящиеся к SNP, редкие различия в ДНК и неаддитивные генетические эффекты способствуют отсутствию наследуемости. Что касается различий в ДНК, не связанных с SNP, варианты числа копий были предложены в качестве основного источника отсутствия наследуемости: Эрик Р. Гамазон, Нэнси Дж. Кокс и Леа К. Дэвис, «Структурная архитектура эффектов SNP на сложные признаки», Американский журнал генетики человека , 95 (2014): 477-89. doi: 10.1016/j.ajhg.2014.09.009.
Что касается редких вариантов, редкие варианты с частотами аллелей менее 5 процентов добавляют 2 процента к наследуемости роста SNP: Eirini Marouli et al., 'Rare and Low-frequency Coding Variants Alter Human Adult Height', Nature , 542 (2016): 186–190. дои: 10.1038/nature21039. Неаддитивная генетическая изменчивость также была предложена некоторыми в качестве основного источника отсутствия наследуемости: Or Zuk et al., «The Mystery of Missing Heritability: Genetic Interactions Create Phantom Heritability», Proceedings of the National Academy of Sciences USA, 109 (2012 ) . ): 1193 8. doi: 10.1073/pnas.1119675109.
Было показано, что редкие различия в ДНК способствуют риску шизофрении, аутизма и умственной отсталости: Fatima Torres, Mafalda Barbosa and Patricia Maciel, «Рекуррентные вариации количества копий как факторы риска нарушений развития нервной системы: критический обзор и анализ клинических последствий», Journal of Медицинская генетика , 53 (2016): 73-90. doi: 10.1136/jmedgenet-2015-103366.
