предметів

реферат

Ми досліджували ген-генні взаємодії (епістаз) в індексі людського тіла (ІМТ) у чотирьох європейських популяціях (n 5000). Ми прийшли до висновку, що аналіз епістазу у багатьох популяціях геному є ефективним підходом до отримання нових уявлень про генетичну регуляцію ІМТ, але вимагає подальших зусиль для підтвердження результатів.

індексі

Індекс маси тіла (ІМТ) є найбільш часто використовуваним антропометричним методом для визначення ожиріння людини. ІМТ є складною ознакою, на яку впливають багато середовища (наприклад, дієта, вік, фізична активність) та генетичні фактори, оцінка спадковості коливається від 40 до 80% у повторних дослідженнях, від 20 до 50% у сімейних дослідженнях та від 20 до 60% у сімейні дослідження. навчання в групі. навчання. 1 Нещодавні дослідження з великою асоціацією геномів (GWA) успішно виявили численні однонуклеотидні поліморфізми (SNP), які сильно пов'язані з особливостями ожиріння, включаючи ІМТ. 2, 3, 4 Вони проливають світло на біологічну основу ожиріння та пропонують роль нейрональних впливів у регуляції апетиту та/або енергетичному балансі. Однак генетичні варіанти, виявлені разом, пояснюють лише незначну частину варіацій ознаки і, отже, мають обмежену прогностичну цінність для ризику ожиріння. 5 Наприклад, у недавньому мета-аналізі (249 796 осіб) із 32 ідентифікованих та тиражованих ОНП було пояснено лише 1,45% варіації ІМТ між індивідами, де найсильніший ОНП представляв лише 0,34% дисперсії. 3 32 ІМТ SNP відображають 32 різних гени, надалі іменовані локусами ІМТ.

Взаємодії генів і генів (епістаз) вважаються потенційними джерелами незрозумілих генетичних варіацій, 6, 7, 8, але залишаються в значній мірі невивченими в дослідженнях GWA на сьогодні щодо ІМТ. Головною перешкодою для аналізу епістазів у дослідженнях GWA була відсутність швидких методів для обчислення мільярдів тестів взаємодії при повному парному скануванні геному для відображення різних типів епістазів (наприклад, з основними ефектами або без них) при збереженні хибнопозитивних значень. під контролем. 9, 10 Ще однією перешкодою для вивчення епістазу є відносно невеликий обсяг вибірки у багатьох існуючих когортах GWA, що може обмежити здатність виявляти та відтворювати епістазичні сигнали, якщо епістатичні ефекти, що підлягають виявленню, не є великими. Моделювання показало, що для досягнення 80% можливості виявлення епістазів із необхідним співвідношенням 3,0 при складних захворюваннях було потрібно понад 4000 пар випадків та контролів. Що стосується кількісних ознак, розміри зразків повинні бути значно (наприклад, на 45%) більшими, ніж фенотипи випадку та контролю випадків, щоб досягти подібної міцності. 14

З розвитком обчислювальних технологій основна перешкода поступово вивільняється, і повне парне сканування геному починає застосовуватися окремо до популяцій GWA. Мета-аналіз епістазу, як він використовувався в дослідженнях GWA 3, може бути хорошим способом подолати перешкоду обсягу вибірки, але вимагає нових методів для адаптації даних про генотип приписаних SNP. Різні підходи до зменшення простору пошуку (тобто, менш жорсткі пороги значущості через набагато меншу кількість тестів) можуть бути використані для поліпшення здатності виявляти епізади в окремих популяціях GWA. Тестові взаємодії, що включають значні локуси (граничні ефекти) з широким діапазоном геномів, з пороговим значенням, скоригованим для фактичної кількості тестів, були запропоновані 10, 17, 18 та успішно застосовані в останніх дослідженнях. 16, 19, 20, 21 Інший підхід полягає у відборі SNP на основі існуючих біологічних знань (наприклад, взаємодія білків і білків) та тестуванні взаємодії лише між ними. Однак слід дотримуватися обережності при виборі SNP 12, оскільки біологічні знання можуть не мати прямого відношення до ознаки, що вивчається, і будь-які упередження у попередньо визначених локусах можуть призвести до хибнопозитивних епістатичних сигналів.

Тут ми демонструємо інший підхід до використання цінності епістазу через аналіз великої популяції. Спочатку ми провели повне парне обстеження геному для епізодів ІМТ у чотирьох популяціях GWA, до яких ми мали прямий доступ: шотландські ORCADES, 24 CROATIA-Vis 25 та CROATIA-Korcula, 26, та італійські дослідницькі групи MICROS 27. Кожна з цих груп має порівняно невеликий обсяг вибірки та відбирається з різних європейських регіонів із дуже різним способом життя та дієтою. По-друге, ми визначили загальні та потенційно важливі взаємодії ген-ген за допомогою епістазних сигналів, виявлених у кожній когорті, та їх збагачення в онтології генів (GO) у популяціях. Крім того, ми також визначили набір взаємодій із залученням локусів ІМТ (як це було зроблено раніше) у різних когортах. По-третє, ми протестували виявлені взаємодії в кожній когорті реплікації, а потім відтворені сигнали в рідній когорті Північної Фінляндії 1966 (NFBC1966). 28 Наша мета полягає у вирішенні питання, чи є аналіз епістазу актуальним для дисекції генетичної регуляції ІМТ у цих досліджуваних групах.

Матеріали і методи

Навчальні групи та етичні висловлювання

Чотири дослідницькі групи були детально описані в інших місцях. 24, 25, 26, 27, 29 Коротше кажучи, шотландська група ORCADES була прийнята з підгрупи з 10 островів архіпелагу Оркнейські. Це дослідження було схвалено Комітетом з етики досліджень NHS Orkney і РЕК Півночі Шотландії. Когорти ХОРВАТІЯ-ВІС та ХОРВАТІЯ-Корчула були прийняті на острів Віс та на острів Корчула. Обидва дослідження були схвалені Комітетом з етики Медичного факультету, Університетом Загреба та Комітетом з етики полікультурних досліджень у Шотландії. Італійська група MICROS була отримана із сіл у ізольованій гірській місцевості Південного Тіролю. Дослідження було схвалено Комітетом з етики автономної провінції Больцано. Усі учасники надали письмову інформовану згоду та вимірювали кількість символів, включаючи вагу та зріст, з яких обчислювали значення ІМТ.

Стіл в натуральну величину

Статистичний аналіз

Вихідні дані ІМТ у кожній з чотирьох досліджуваних груп коригували за віком та статтю та нормалізували за допомогою функції перетворення, яка реалізована в пакеті GenABEL, який виконує нормалізацію квантильних залишків із узагальненого аналізу лінійних моделей. Потім нормалізовані залишки ІМТ аналізували за допомогою лінійної змішаної моделі для корекції полігенних ефектів через спорідненість з використанням полігенної функції в упаковці GenABEL, а отримані залишки навколишнього середовища (тобто pgresidualY у GenABEL) використовували як маркер для перевірки асоціації. Полігенне успадкування оцінювали на етапі змішаної моделі. Після первинного дослідження GWA, 28 пацієнтів групи NFBC1966 були виключені з вагітності та/або вимірювали ІМТ окремо, а вихідні значення ІМТ коригували для SexOCPG (розраховували за статтю, статусом оральної контрацепції та вагітністю), а потім нормалізували та виправлено на спорідненість, як зазначено вище.

Сканування GWA на основі SNP проводили в кожній популяції за допомогою методу оцінки балів (на основі адитивної моделі), реалізованого в функції mmscore в пакеті GenABEL. Поріг консенсусу GWA 7, 3 був використаний для ідентифікації значущих SNP GWA (−log 10 (5, 0E-08)). 32 Ми також провели повне парне геномне сканування, використовуючи регресійні моделі, описані нижче. Щодо пари SNP, позначених SNP 1 і SNP 2, для виявлення епізази використовувались наступні генетичні моделі, де в якості фіксованих факторів використовувались генотипи кожного SNP (тобто малий алель гомозигота, головний алель гомозигота та гетерозигота):

де y - ознака інтересу, μ - константа моделі, SNP 1 (або SNP 2) - фіксований коефіцієнт із трьома рівнями (класи генотипів), SNP 1 * SNP 2 - термін взаємодії, e - термін випадкової помилки. Тест співвідношення F для моделі 1 проти моделі 3 оцінює ефект всієї пари, включаючи взаємодію (тобто пара F, 8 ступенів свободи). Тест співвідношення F для моделі 1 проти моделі 2 оцінює взаємодію між двома SNP (тобто F int, 4 ступені свободи). Значення P були розраховані на основі розподілу F з відповідними ступенями свободи і перетворені в шкалу −log 10 (тобто −log 10 P пара для тесту пари F, −log 10 P int для тесту F int) . У цьому дослідженні ми зосередилися головним чином на тестах F int .

Значущі пороги в цілому геномі (всі за шкалою −log 10) були отримані на основі корекції Бонферроні для кількох тестів, тобто 5% номінального значення P, скорегованого за кількістю проведених тестів. Беручи до уваги 300 000 SNP, він виконує повну подвійну перевірку тестів асоціації геном 4, 5E + 10, і, таким чином, 5% геномна межа становить 11,95 (тобто −log 10 (0,05/4, 5E + 10)). Після кожного парного сканування геному результати оцінювали за допомогою заздалегідь визначеного порогу для виявлення значущих сигналів широкої взаємодії геному. Кожен SNP у результатах був анотований до найближчого гена у 20-кілограмовому вікні, що оточує SNP (на основі фізичної відстані від початку або кінця транскрипції гена; відстань вважається нульовою, якщо SNP знаходиться в гені).

Аналіз збагачення GO проводили для кожної когорти дослідження, використовуючи запущений режим "Два незв'язаних списки генів" у Gorilla 33 на основі стандартної гіпергеометричної статистики, де анотовані епістатичні гени використовувались як мішень із повним списком генів людини. як тло. Для простоти ми вирішили використовувати те саме значення -log 10 P, що і поріг консенсусу GWA (тобто -log 10 P int> 7.3), щоб вибрати пари SNP кожної когорти та використовувати їхні генні анотації як вхідні дані для аналізу збагачення GO., Збагачені терміни GO (P 7.3) у кожній досліджуваній групі також були визначені як потенційно важливі сигнали взаємодії для аналізів реплікації.

Значущі пари геному SNP та ті, які визначені як потенційно важливі взаємодії, тестувались на реплікацію у чотирьох дослідницьких групах. Повторені пари SNP додатково тестували на реплікацію в когорті NFBC1966. Кожен аналіз реплікації проводили на рівні SNP, а також у регіоні. На рівні SNP кожен реплікаційний SNP був точно таким же, як відповідний епістатичний SNP, і тому використовувався поріг 5% від номінальної значущості (тобто −log 10 (0,05) = 1,30), оскільки потрібен був лише один аналіз реплікації. На регіональному рівні взаємодія між кожним з 10 суміжних SNP (тобто, п’ятьма вище та п’ятьма нижчими за течією) першого епістатичного SNP та кожним другим епізатичним SNP тестувались для того, щоб відповідати ситуації, коли багато SNP можуть мітити одного і того ж мутанта-мутанта. ген. Перестановка була використана для отримання порогів значущості для реплікації кожної епістатичної пари на регіональному рівні, де були переставлені фенотипи, і були зафіксовані найвищі аналізи взаємодії 10 Pint 121 (тобто 11 × 11) у кожній з 1000 ітерацій. Повторені пари SNP об'єднали в повну модель для розрахунку частки фенотипової дисперсії, поясненої в кожній досліджуваній групі.

результат

Середній ІМТ був подібним у когортах ХОРВАТІЯ-Віс, ХОРВАТІЯ-Корчула та ORCADES, але нижчий у МІКРОС (Таблиця 1). Оцінки полігенного успадкування коливались від 0,356 (ХОРВАТІЯ-Віс) до 0,514 (ОРКАДИ). Звичайне сканування GWA не виявило значущих SNP у всьому геномі в жодній когорті. Коефіцієнт лямбда-інфляції (розрахований шляхом регресії спостережуваних значень асоціації P до очікуваної величини) кожного сканування GWA був дуже близьким до 1 (таблиця 1), що вказує на те, що родинна спорідненість у кожній когорті добре врахована. Лише 8 із 32 ІМТ ІМТ, які раніше були виявлені, були 3 генотипованими у чотирьох досліджуваних групах, і жоден з них не продемонстрував сильної зв'язку з ІМТ (Додаткова таблиця S1).

Повнопарове сканування геному виявило, що в жодній з чотирьох досліджуваних груп не було пар SNP, які переходили б широкий поріг геному (−log 10P int = 11, 95) (рис. 1). Через сигнали взаємодії з −log 10Pint> 7, 3, MICROS мав найменшу кількість пар SNP і, отже, найменшу кількість анотованих генів, тоді як решта три когорти мали відносно однакову кількість пар SNP та анотованих генів (Таблиця 2 ). П'ять з 32 локусів ІМТ (але не ІМТ ІНП) були задіяні в 7 епістатичних парах в ХОРВАТІЇ-ВІС: FTO, KCTD15, LRP1B, NEGR1 та PRKD1. Подібним чином три локуси ІМТ (NEGR1, NRXN3 та PRKD1) були задіяні в ХОРВАТІЇ-Корчула, два (FTO та MTCH2) в ORCADES та два (FTO та LRP1B) у MICROS.

Поєднайте епістатичні сигнали в кожній досліджуваній групі. a ) парні епістатичні сигнали в ХОРВАТІЇ-Vis. ( b ) парні епістатичні сигнали в ХОРВАТІЇ-Корчула. ( c ) парні епістатичні сигнали в ORCADES. ( d ) парні епістатичні сигнали в MICROS.

Повнорозмірне зображення

Стіл в натуральну величину

Терміни GO, збагачені епістатичними генами (−log 10Pint> 7.3) у кожній когорті, порівнювались (додаткова таблиця S2) та визначали 9 загальних для всіх чотирьох когорт (таблиця 3), що може вказувати на загальні регуляторні механізми (наприклад, GO: 0008038 - нейрони розпізнавання ). Серед епістатичних генів, які збагатили терміни 9 GO, ми виявили 19 епістатичних генів, спільних для чотирьох когорт, 15 з яких раніше були опубліковані локуси GWA (переважно не геномно значущі), пов'язані з різними фенотипами 34 (Додаткова таблиця S3). Більшість із 19 спільних епістатичних генів взаємодіяли між собою, хоча їх взаємодія була відносно слабкою (−log 10P int 35 та SORCS2 (сортування, пов’язане з VPS10). Рецептор, що містить рецептор 2), пов’язаний із циркулюючим інсуліноподібним фактором росту 1 та білком 3, що зв’язує фактор росту інсуліну-3, які важливі для антропометричних особливостей та ризику раку та серцево-судинних захворювань. 36

Стіл в натуральну величину

Стіл в натуральну величину

обговорення

Усвідомлюючи можливі шуми в цих потенційно важливих взаємодіях, ми використовували реплікацію для виявлення найбільш надійних епістатичних сигналів у дослідницьких групах. Вісім епістатичних пар, що містять або локуси ІМТ, або два загальні епістатичні гени показали реплікацію на рівні SNP принаймні в одній когорті (табл. 4). Вісім епістатичних пар разом могли б справді пояснити значну частину змін ІМТ у кожній окремій когорті. Проте рекомендується обережність, враховуючи потенційне завищення наслідків "прокляття переможців". 39 Крім того, жодна з восьми епістатичних пар не була відтворена у всіх чотирьох досліджуваних групах або в когорті реплікації NFBC1966. Додаткові аналізи реплікації в інших популяціях та/або функціональні аналізи корисні для підтвердження того, чи є це справжніми сигналами.

Статистична реплікація використовувалася як золоте правило, щоб уникнути повідомлення про помилкові спрацьовування в дослідженнях GWA. Однак, здається, це набагато складніше для епістатичних сигналів, ніж для окремих сигналів SNP, з причин, що включають продуктивність, зміну частоти меншого алеля та дисбаланс асоціації між епістатичним SNP та мутантом для обох локусів. Незначний −log 10 Значення піста епістатичних пар, перевірених на реплікацію, свідчать про те, що дисбаланс зв'язування між епістатичними SNP та мутантами не є високим, тому реплікація цих пар буде важкою. Крім того, різні середовища можуть спричинити різний розподіл фенотипів у когортах виявлення та реплікації. Відсутність реплікації в когорті NFBC1966 може бути зумовлена ​​двома важливими факторами навколишнього середовища ІМТ: віком 40 років (тобто 31 проти діапазону від 18 до 90 у досліджуваних групах) та дієтою. 29

Підхід, заснований на взаємодії генних генів у численних популяціях GWA, є ефективним рішенням проблеми обмеженої здатності виявляти епістаз. Це лише часткове рішення, оскільки деякі ігноровані взаємодії також можуть бути важливими. Порівняння значущих епістатичних сигналів у геномі може бути здійснено або на рівні SNP, або на рівні гена або шляху, і може виявитись більш плідним на рівні гена або шляху, ніж рівень SNP. Підхід може стати більш корисним, якщо до епізоду можна адаптувати кращі методи анотації (враховуючи лише сигнали GWA без взаємодії) 41. Наприклад, не всі епістатичні SNP були анотовані до генів у дослідженні, і тому не сприяли аналізу збагачення. Цей підхід, ймовірно, буде важливим навіть тоді, коли в наборах даних GWA доступні нові інструменти метааналізу епістазів для підвищення ефективності виявлення епістазів.