Предмети

Резюме

Показано, що рецесивне успадкування генів, що руйнують гени, або через специфічну гомозиготність, або складну гетерозиготність, лежить в основі багатьох хвороб Менделя та деяких складних психічних розладів. На основі даних секвенування екзомів при аутизмі було виявлено підвищене навантаження варіантів повної делеції (гомозиготних або складених гетерозиготних). Крім того, при використанні даних мікроматичності однонуклеотидного поліморфізму збільшення швидкості гомозиготності або аутозиготності потомства було пов’язане з ризиком шизофренії (SCZ). Тут, у великій шведській вибірці SCZ-контролю (11 244 особи, 5079 з яких мають доступні дані про послідовності екзоми), ми вивчаємо внесок як аутозиготності, так і повних нокаутів у ризик захворювання. Ми не виявили жодних доказів асоціації з SCZ як з цілого геному, так і з певних локусів. Однак ми розглядаємо можливий вплив обсягу вибірки та генетичних факторів популяції на можливість виявлення та кількісної оцінки будь-якого тягаря, який може існувати.

даних

Вступ

Шизофренія (SCZ) - це сильно успадковуваний виснажливий розлад (h 2

Хоча секвенування дозволяє безпосередньо виявити точні цілі генотипи, показники аутозиготності (гомозиготності за походженням) також можуть бути інформативними в рецесивних моделях. Попередні дослідження використовували мікрочипи SNP для виявлення декількох мегабазових циклів гомозиготності (ROH), що, ймовірно, відображає автозиготність, отриману від недавнього ступеня інбридингу. 13, 14 Дослідження з 9 388, переважно європейських випадків, випадків SCZ та 12 456 контрольних груп продемонструвало значущу позитивну кореляцію між ступенем ROH на людину та ризиком захворювання. 15 Однак вони не виявили жодного значущого окремого локусу.

Тут ми застосовуємо обидва підходи у великій шведській популяційній вибірці 8, 16 випадків SCZ і контролів: по-перше, ми протестуємо рецесивну модель опосередковано, порівнюючи вироблений SNP тягар ROH у випадках проти контролів, а по-друге, ми використовуємо послідовність екзомів Безпосередньо оцініть навантаження на всі варіанти елімінації.

Методи

Приклад аналізу та формування даних.

Зразки були отримані у національних реєстрах Швеції, випадки виявлені через Шведський реєстр виписок у лікарні, а органи контролю були обрані випадковим чином із реєстрів населення Швеції. Усі суб'єкти були належним чином згодні, і інституційні комітети суб'єктів-людей схвалили дослідження. Секвенування проводили в Інституті Брод, використовуючи машини Illumina (Сан-Дієго, Каліфорнія, США) GAII або HiSeq2000. Захоплення екзома проводили за допомогою версії 1 або версії 2 набору SureSelect Human All Exon від Agilent (Санта-Клара, Каліфорнія, США). Додаткові подробиці щодо аналізу зразків та формування даних послідовностей були раніше опубліковані. 8 файлів BAM та VCF доступні в дослідженні dbGaP phs000473.v1 (//www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000473.v1.p1).

Раси гомозиготності, які вони називають.

Ми використовували дані імпутації з 16 раніше опублікованих SNP з усього набору даних Швеції, які представляють надмножину осіб, які були секвентовані. Ми відбираємо

55 к SNP у приблизній рівновазі зв'язування високоякісних генотипів називали введеною дозою в 5001 випадку та 6243 контролі. Ми намагалися виявити ROH, використовуючи PLINK 17 з довжиною ROH> 1 Мб, параметри конфігурації, принаймні один SNP на 100 кб, і виділення однієї гетерозиготної події у вікні 50 SNP, розділяючи дзвінки, якщо вони охоплюють 500 кб без маркера . Цей метод та вибір параметрів представляють методи, запропоновані в літературі після ретельного порівняння 18, і дуже схожий на підхід, який застосовувався раніше для підмножини цих даних. п’ятнадцять

Складена гетерозиготна ідентифікація

Для оцінки функції елімінаційних повних варіантів у SCZ ми застосували метод ідентифікації цих варіантів у рамках статистичного пакету Plink/Seq (//research.mssm.edu/statgen/software.html). Метод аналізує кожну розшифровку незалежно, гарантуючи, що обидва порушувальні варіанти впливають на один і той же білок. Оскільки більшість пар варіантів не будуть знаходитися в межах необхідної відстані для фази (довжина зчитування послідовності), ми застосували раніше використовуваний статистичний фазовий підхід для ідентифікації складних гетерозиготних подій. 12 Ми визначаємо гетерозиготність сполук як особину, яка несе гетерозиготний генотип у кожній хромосомі в різних місцях в межах одного гена.

Оцінка значущості за допомогою перестановки

Значимість повних варіантів нокауту оцінювали шляхом перестановки окремих алелей незалежно від рівноваги Харді-Вайнберга (HWE). Перестановку проводили в 296 групах відповідних особин у IBS за даними GWAS для контролю тонкої субструктури популяції (середня кількість особин у групі = 17). Ми оцінюємо важливість наборів генів, додаючи кілька варіантів, припускаючи незалежність.

Результати

Між 5001 випадком та 6243 контролем ми виявили 4117 ROH у 2001 році; 16% осіб мали принаймні один ROH. Середня довжина ROH становила 8 Мб (середня довжина 6,8 Мб) і коливалась від 1,6 до 55,2 Мб. Ми також кількісно визначили ступінь гомозиготності в геномі кожної особини, використовуючи коефіцієнт Райта в інбридингу (F). Після включення перших 10 багатовимірних компонентів масштабування (MDS) для врахування походження, гомозиготність була подібною у випадках та контролях відповідно до кількості ROH (0,38 випадків, 0,32 контролю, P = 0, 60), загальної кілобази ROH (3123 kb) випадків, 2544 кб контролю, P = 0,88) або F (0,0026 випадків, 0,0029 контролю, P = 0,09, таблиця 1).

Повний розмір таблиці

Потім ми шукали повні варіанти видалення у підмножині з 2477 випадків та 2481 елементів управління, для яких були доступні дані послідовності екзома. 8 Ми ідентифікували 462 повних, рідкісних генотипів (частота незначних алелей 8). У 2546 генах у семи групах ми виявили 35 повних деструктивних генотипів або чоловічої Х-хромосоми, 19 у випадках та 16 у контролі (P = 0,38; Додаткова таблиця S3). набір генів, що несуть нерозривні алелі в SCZ, показав номінальне значення (4: 0, односторонній P = 0,027), це не виживає при корекції семи тестів. інтелектуальна інвалідність.19 Генотипи трьох випадків та п'ять контрольних генотипів були виявлені у 119 генах інтелектуальної інвалідності та один генотип випадків та нульових контрольних генотипів у 28 генах аутизму; жоден з тестів не досяг номінального значення (Р психічна інвалідність = 0,72, Р аутизм = 0,57).

Обговорення

Загалом, ми не спостерігали значного збагачення ROH у випадках SCZ. У більшій вибірці (21 844) Келлер та співавт. 15 повідомляють про значно вищий рівень навантаження ROH у випадках SCZ, що припускає, що поточне дослідження може бути недостатньо потужним. Зазначимо, що Келлер та ін. дослідження включало невелику частину шведських осіб, про які повідомлялося тут, хоча автори не знайшли доказів збільшення ROH у шведській підгрупі, що узгоджується з нашими результатами. Це свідчить про те, що генетичні та предкові ознаки популяції у вибірці можуть бути додатковим фактором, що визначає відносну роль рідкісних рецесивних варіантів у ризику SCZ.

Кількість нещодавніх інбридингів сприятиме зростанню гомозиготності в популяції. Наша вибірка була визначена у Швеції, але включає частку особин фінського походження. Використання популяцій із нещодавнім інбридингом збільшить частоту цих подій та здатність виявляти збагачення - підхід, який успішно застосовується для CNV. двадцять

На закінчення, ця вибірка не надає підтвердження важливої ​​ролі руйнівних рецесивних гетерозиготних або складених гетерозиготних варіантів ризику SCZ. Не було загального геномного навантаження ROH або повних варіантів нокауту екзоми, жодні конкретні геномні ділянки не були суттєво пов’язані, і жоден ген не досяг значущості після корекції. Ці результати в значній мірі відображають результати досліджень тріо SCO de novo (Fromer та співавт. 11), в яких немає значно вищого тягаря і дуже мало окремих генів однозначно причетних, хоча для мутацій de novo вони можуть бачити більш широкі ефекти серед функціонально пов'язані підмножини генів. Складені гетерозиготні та рецесивні рідкісні ділянки можуть зіграти певну роль у ризику захворювання, хоча можуть знадобитися більші зразки або різні аналітичні підходи.