Замысел. Как ДНК делает нас теми, кто мы есть, стр. 65

Одной из проблем подхода «ген-кандидат» являются чрезмерно упрощенные истории о функции генов, используемые для оправдания выбора определенного гена в качестве «кандидата». Каждый ген выполняет много разных функций, поэтому легко рассказать историю о том, почему такой ген, как COMT , является хорошим геном-кандидатом. Но эти истории часто ошибочны. Почти любой ген может быть признан кандидатом психологических черт, потому что три четверти всех генов экспрессируются в головном мозге.

Другая проблема заключается в том, что исследования генов-кандидатов рассматривают только традиционные гены, 2 процента генома, которые кодируют белки. Как указывалось ранее, различия в ДНК, определяющие психологические черты, обычно не связаны с традиционными «генами». Таким образом, исследования генов-кандидатов пропустили большую часть генетического действия.

COMT SNP был включен в сотни исследований когнитивных способностей и еще больше исследований тревожности. Двадцать пять лет назад в одном из первых исследований генов-кандидатов я решил сравнить 100 генов, включая COMT, у людей с низким и высоким IQ в двух независимых исследованиях. Несмотря на то, что в первом исследовании были обнаружены некоторые важные результаты, во втором исследовании был воспроизведен только один, чего можно было бы ожидать только случайно при значении P , равном 0,05. Таким образом, единственными значимыми результатами оказались ложноположительные результаты, и я остался с пустыми руками: Роберт Пломин и др., «Аллельные ассоциации между 100 ДНК-маркерами и высоким или низким IQ», Intelligence, 21 (1995): 31–48. . doi: 10.1016/0160-2896(95)90037-3.

Схема, которую я использовал, позволяла обнаруживать ассоциации, на долю которых приходилось более 2 % дисперсии интеллекта. Что-то здесь было не так. Возможно, мы искали не те гены-кандидаты. Поскольку у нас была возможность обнаружить только ассоциации, которые составляли более 2 % дисперсии, еще одна неприятная возможность заключалась в том, что эффекты были меньше 2 %. Оказывается, ответ был и тем, и другим.

Несмотря на это раннее предупреждение об отрицательных результатах для генов-кандидатов, более 200 последующих исследований сообщили об ассоциации между генами-кандидатами и интеллектом. Однако в большинстве из них участвовали небольшие выборки, и не было попыток воспроизвести результаты. В 2012 г. при систематической попытке воспроизвести основные SNP в двенадцати генах-кандидатах в трех больших выборках не удалось воспроизвести ни одного SNP: Christopher F. Chabris et al., «Большинство известных генетических ассоциаций с общим интеллектом, вероятно, являются ложноположительными», Psychological Наука, 23 (2012): 1314-23. дои: 10.1177/0956797611435528.

Неспособность воспроизвести отчеты о генах-кандидатах является проблемой не только для исследований интеллекта. Подход везде провалился. Например, для шизофрении более 1000 статей сообщили о результатах поиска генов-кандидатов для более чем 700 генов. Метаанализ двадцати четырех лучших генов-кандидатов, проведенный в 2015 году, показал, что ни один из них не реплицировался: Manillas S. Farrell et al., «Оценка исторических генов-кандидатов для шизофрении», Molecular Psychiatry , 20 (2015): 555-62. doi: 10.1038/mp.2015.16.

Как так много опубликованных статей могут так ошибаться? Ранее мы рассматривали кризис доверия к науке по поводу неудач в воспроизведении. Исследования генов-кандидатов стали жертвой всех описанных здесь ловушек. Две основные ловушки заключались в том, что эти исследования были недостаточно мощными и гонялись за значениями P.

Что касается ловушки мощности, средний размер выборки исследований генов-кандидатов составлял 200. Если бы ассоциации составляли 5 процентов дисперсии, выборка размером 200 имела бы достаточную мощность для их обнаружения. Но теперь мы знаем, что нет ни одного эффекта, близкого к 5 процентам. Самые большие эффекты составляют менее 1 процента. Для обнаружения таких небольших эффектов требуется размер выборки более тысячи.

По этой причине эти ранние исследования генов-кандидатов рисковали сообщить о статистически значимых результатах, которые не соответствуют действительности или ложноположительны. Научные журналы не любят публиковать отрицательные результаты, поэтому единственными результатами, которые могли быть опубликованы, были сообщения о положительных результатах, которые оказались ложноположительными.

Второй ловушкой была погоня за значениями P , что значительно увеличивает риск сообщения о ложноположительных результатах. Есть несколько способов, которыми ученые, как правило, невольно гоняются за значениями P. Они рассматривают несколько генов, несколько психологических черт или несколько способов анализа данных, но сообщают только те результаты, которые лучше всего рассказывают историю. Легко стать жертвой этого типа мошенничества, потому что мы все хотим рассказывать хорошие истории, и это вызывает искушение замести осложнения под ковер. Для публикации хорошей истории требуется, чтобы результаты соответствовали общепринятому 5-процентному значению P. Но погоня за этим значением P означает, что законы P (вероятности) нарушены. Погоня заканчивается тем, что выявляются только ложноположительные результаты.

Нет ничего плохого в том, чтобы попытаться рассказать хорошую историю, если она правдива. Проблема с сотнями историй о генах-кандидатах в том, что они не соответствовали действительности, но привели к сотням сообщений в СМИ о «гене интеллекта» или «гене шизофрении». Хотя исследования генов-кандидатов продолжают публиковаться и сегодня, большинство журналов теперь требуют, чтобы статьи, сообщающие об ассоциациях генов-кандидатов, перед публикацией включали доказательства репликации в независимых образцах. Ложноположительные результаты не повторяются. Сотни отчетов об ассоциациях генов-кандидатов с интеллектом и шизофренией не подтвердились.

Боль от этого фальстарта исследований генов-кандидатов была смягчена успехом нового подхода, появившегося на рубеже веков, когда стало ясно, что исследования генов-кандидатов потерпели неудачу. Новым подходом была полногеномная ассоциация (GWA), которая противоположна подходу гена-кандидата.

« Мечта заключалась в том, чтобы систематически искать по всему геному, а не выбирать несколько произвольно выбранных генов-кандидатов» : Neil Risch and Kathleen Merikangas, «The Future of Genetic Studies of Complex Human Diseases», Science, 273 (1996): 1516-17 . doi: 10.1126/наука.

273.5281.1516 . Я не описывал более старый подход к поиску генов в геноме, называемый анализом сцепления. Как и полногеномная ассоциация, сцепление представляет собой систематическую полногеномную стратегию охоты за генами. Он использует всего несколько сотен ДНК-маркеров в геноме для определения хромосомной локализации основных эффектов генов путем изучения косегрегации в семейных родословных между ДНК-маркером и заболеванием. Однако сцепление недостаточно эффективно для обнаружения меньших эффектов генов. Сцепление может указывать на хромосомное соседство, но не может указать точное местоположение. Я решил не обсуждать сцепление, так как сейчас оно редко используется, потому что оно способно обнаруживать только эффекты основных генов, в то время как большинство эффектов крошечные.

« В 1998 году я решил провести скрининг генома, генотипируя различия ДНК одно за другим, чтобы найти различия ДНК, связанные с интеллектом» : Роберт Пломин и др., «Полногеномное сканирование 1842 ДНК-маркеров для

Аллельные ассоциации с общей когнитивной способностью: пятиэтапный дизайн с использованием объединения ДНК и экстремально выбранных групп, Behavior Genetics , 31 (2001): 497-509. дои: 10.1023/A:1013385125887. Я сократил затраты времени и денег, объединив ДНК для групп людей, а не генотипируя каждого человека отдельно. Это называется объединением ДНК ; генотипирование 100 особей стоит не больше, чем генотипирование одной особи, потому что вы объединяете ДНК 100 особей и генотипируете объединенную ДНК: Lee M. Butcher et al., 'Genotyping Pooled DNA on Microarrays: A Systematic Genome Screen of Thousands of SNPs in Большие выборки для обнаружения QTL для комплексных признаков», Behavior Genetics , 34 (2004): 549-55. doi: 10.1023/b%3abege.0000038493.26202.d3.