дизайн

  • предметів
  • реферат
  • Головний
  • результат
  • Асамблея геному
  • Анотація геному
  • Еволюційний аналіз
  • Потенційний механізм визначення статі
  • Транскрипційний аналіз переходу до харчових звичок
  • обговорення
  • методи
  • Підготовка та секвенування бібліотеки ДНК.
  • Збірка послідовності.
  • Прогнозування білків, що кодують гени.
  • Переписування послідовностей.
  • Ідентифікація чоловічих контигів, розташованих на потенційній статевій хромосомі.
  • Підготовка зразків та ідентифікація диференційовано експресованих генів у експериментах FHT.
  • URL.
  • Коди доступу.
  • Історія змін
  • прирости
  • Первинні приєднання
  • Біопроект
  • Архів послідовностей послідовностей
  • Додаткова інформація
  • Файли PDF
  • Додатковий текст та зображення
  • Файли Excel
  • Додаткова таблиця 16
  • Додаткова таблиця 17
  • Додаткова таблиця 18
  • Додатковий набір даних

предметів

  • Секвенування ДНК
  • Помилка цієї статті була опублікована 29 липня 2015 року

Ця стаття оновлена

реферат

Білий короп - важлива риба, що вирощується на фермах, становить близько 16% світової прісноводної аквакультури та має вегетаріанське харчування. Тут ми представляємо концепцію геному 0,9 Гб дорослої гіногенетичної самки та геном 1,07 Гб дикого дорослого самця. Геномна анотація виявила 27 263 генних моделей, що кодують білки в жіночому геномі. Загалом 114 будівельних лісів, що складаються з 573 Мб, закріплені у 24 зв'язувальних групах. За підрахунками, відмінності між білим амуром та зеброю мали місце від 49 до 54 мільйонів років тому. Ми виявляємо хромосомне зрощення амура по відношенню до зебри та реєструємо часті переходи між трав'яними Х та Y хромосомами трави. Ми виявили, що транскрипційна активація шляху мевалонату та біосинтез стероїдів у печінці пов’язана з адаптацією білого амура від хижих до травоїдних дієт. Ми вважаємо, що геном коропової трави міг би послужити початковою платформою для розведення більш якісних риб із використанням геномного підходу.

Головний

a ) Зображення дорослого коропа. b ) Розподіл частоти 55 метрів. Розподіл K-вимірювальної частоти в показаннях було отримано з бібліотек з коротким розміром вставки (350 - 400 bp). Значення для K-полімерів будуються на основі частоти (вісь y) їх появи (вісь x). Найгірший усічений пік при низькій частоті (1-2) в основному був обумовлений випадковими фундаментальними помилками в початкових послідовностях. c ) Реконструйована філогенез 13 геномів хребетних. Співвідношення dN/dS кожної гілки позначено синім кольором. Цифри чорним кольором відповідають значенням підтримки початкової завантаження. Лампа використовується як група. Довжина гілки вимірюється в очікуваних заміщеннях на одну ділянку. d ) Діаграма Венна кластерів генів для п’яти вибраних геномів хребетних. Кожне число представляє кількість ортологічних сімейств генів, які поділяють згадані геноми.

Повнорозмірне зображення

  • Завантажте вихідні дані Excel

результат

Асамблея геному

Геном газону складається з 24 пар хромосом 18, 19 (2 n = 48). Після прийняття стратегії секвенування загального геному, ми створили приблизно 132 Гб послідовностей послідовностей Illumina на геномній ДНК, виділеній з крові гіногенетичного газону для дорослих коропів, і 136 Гб зчитувань у дикого, захопленого водою дорослого самця (Додаткова таблиця 1). та додаткова примітка). Ми побудували остаточні набори жіночих (0, 90 Гб) та чоловічих (1, 07 Гб) геномів за допомогою модифікованої збірної трубки de novo Phusion-meta, як описано раніше 20 (додаткова фігура 1 та додаткова таблиця 2). Геном жіночого дизайну був повністю анотований до моєї геномної інформації (рис. 1) і був використаний для закріплення ешафота на карті генетичного зв’язку, тоді як чоловічий геном використовувався для виявлення змін послідовності між чоловічими та жіночими геномами.

У зборі жіночого геному були ліси довжиною N50 понад 6,4 Мб, і 90% збірок складалися з 301 лісів, довжиною понад 179 кб (таблиця 1). Оцінка розміру геному за допомогою розподілу частоти K-mer показала, що жіночий геном складав приблизно 891 Мб у перерахунку на розмір файлу (Рисунок 1b та ​​Додаткова примітка). Ми оцінили точність геномної збірки, вирівнявши ліси з 3027 опублікованими UniGene entires 5 і 11 BAC 21 (додаткові малюнки 2 і 3 та додаткові таблиці 3), вказуючи, що покриття оригінальних контигів та лісів становило приблизно 95% і 97 % відповідно. Помилки послідовності були переважно вставками або видаленнями, введеними модулем короткого зчитування (Додаткова таблиця 3а).

Стіл в натуральну величину

Загалом ми виявили 644 817 гетерозиготних SNP і 66 101 коротка інделька (довжина 10 або менше нуклеотидів) в геномі жінки. Ми виявили 1465 819 SNP і 166 867 коротких індолів у чоловічому геномі. Розрахунковий загальний коефіцієнт гетерозиготності становив приблизно 0, 9 та 2,5 поліморфізмів на кілобазу у жіночих та чоловічих геномах (Додаткова таблиця 4). Зрозуміло, що дикий чоловічий геном мав набагато вищий ступінь гетерозиготності, що спричиняло бімодальність розподілу частоти К-метрів (рис. 1b) та меншу довжину для зібраних лісів.

Анотація геному

Ми перерахували загалом 27 263 гени, що кодують білок у жіночому геномі. Докази, використані при прогнозуванні генів, включали дані про секвенування РНК 27 Gb (РНК-послідовності) з 6 тканин (ембріон, печінка, селезінка, мозок, нирки та головна нирка), понад 3000 відомих записів UniGene та інформацію про гомологічні гени даніо (випуск Ensembl) 67, додатковий малюнок 4, додаткова таблиця 5 та додатковий набір даних). У нашій анотації некодуючих генів РНК (додаткові таблиці 6 та 7) та 467 783 одиничних послідовностей (додаткова таблиця) ми передбачили 1538 тРНК, 24 рРНК, 207 малих ядерних РНК (сноРНК), 136 малих ядерних РНК (снРНК) та 444 мікроРНК. 8). Повторна анотація de novo вказує на загальний вміст повторень 38% порівняно з 43% у BAC (додаткова таблиця 9). Ця частка становить менше 52,2% від повторного вмісту, який спостерігається у даніо 3. Ця різниця може бути зумовлена ​​виключенням повторюваних послідовностей, розташованих на відкритих просторах та на невеликих фрагментах (3 .

Використовуючи опубліковану карту генетичного зв’язування коропа 4, ми закріпили 114 риштування на 24 зв’язувальних групах (рис. 2а, Додаткова таблиця 10 та Додаткова примітка), покриваючи 573 Мб (64%) жіночої групи з 17 456 (64%). локалізовані анотовані гени. Синтез генів за допомогою якірних ешафотів показав, що більшість груп зв'язування білого амура мали значну колінеарність з відповідними хромосомами даніо (рис. 2б). Вирівнювання генів показало високий синтез білого амура та даніо, і до 24 018 генів білого амура (88% від загальної кількості 27 263 гени) було розташовано на синтетичних блоках (рис. 2в). Хоча цей результат був схожий на попередній звіт 4, ми виявили два механізми перехресних хромосом для груп зв'язування 22 і 24. Що примітно, група зв'язування 24, суміщена з хромосомами 22 і 10 данио, але не з жодною іншою групою, яка зв'язує коропа. Аналіз FISH хромосом білого амура показав, що два маркери амура, вирівняні з хромосомами даніо 10 і 22, дійсно були в одній зв'язуючій групі 24 (рис. 2г), що пояснює, чому хромосома номер 25 знаходиться в зебрі, а 24 у коропа.

a ) Ліси були закріплені на опублікованій консенсус-карті 4. Сині лінії позначають довжину кожного лінкера (LG), на який відображаються теги. Відстань на карті між маркерами відображається у масштабі KosMC cM. Помаранчеві смуги представляють закріплені риштування. Чорні лінії, що з’єднують маркери та риштування, вказують розташування маркерів на риштуваннях. Довжина кожного помосту показана щодо 5-мегабайтної колони. b ) Синтетичний взаємозв'язок між хромосомами зебри та групами зв'язування амура. Група зв’язування 22 вирівняна з хромосомами 2 і 15 даніо, а група 24 - хромосомами 10 і 22. c ) Колінеарність генів між зебрами і короповими травами. Хромосоми даніо представлені блакитними блоками (наприклад, DR01). Ліси для коропа (довжина> 50 кб) зображені оранжевими блоками. Вирівняні гени з'єднані зеленими лініями. Довжини хромосом і каркасів показані щодо 10-мегабайтної колонки. d ) Дослідження FISH linker 24. Жовтий маркер CID1435 знаходиться в області, суміщеній з хромосомою 10 даніо, а червоний маркер CID0538 вирівняний з хромосомою 22 даніо. Шкала, 5 мкм.

Повнорозмірне зображення

  • Завантажте вихідні дані Excel

Еволюційний аналіз

Для вивчення еволюції білого амура ми згрупували моделі генів білого амура з генами ще 12 геномів хребетних та використали 202 одиничні копії генів з різною відповідністю у різних геномах для реконструкції філогенетичного дерева (рис. 1в та додаткове). Примітка). Як вид сімейства Cyprinidae, білий амур мав найтісніші стосунки з зебрами. За даними бази даних TimeTree 22, час розбіжностей між зебрами та білим амуром оцінювався приблизно в 49-54 мільйони років (Додаткова таблиця 11). Більшість вибраних геномів телеостеїв демонстрували подібні тиски підбору відповідно до розрахованих значень dN/dS (відношення швидкості несинонімічної заміни до швидкості синонімічної заміни).

Всі гени були задіяні в GCSD або ZSD. Маршрути визначались за допомогою пошукової бази даних KEGG. Вісь х показує кількість генів, що беруть участь у кожному шляху. Синьо позначені шляхи виділяють метаболічні процеси, які потенційно важливі для розвитку або адаптації дієти.

Повнорозмірне зображення

  • Завантажте вихідні дані Excel

Потенційний механізм визначення статі

Порівнюючи набори для самця коропа та жіночої трави, ми виявили 206 контигів загальною довжиною 2,38 Мб, які несе дорослий самець, але не гіногенетична самка (Додаткова фігура 11 та додаткові таблиці 16 та 17). Кожен контиг був підтверджений методом ПЛР-секвенування. Ми також ампліфікували ці ділянки за допомогою ПЛР у розширеній групі з 24 чоловіків та 24 жінок, виявивши часті схрещування хромосом між X та Y хромосомами у коропа (Додаткова фігура 12). Стать у коропа не може бути визначена за цілою хромосомою, а за кількома критичними генами. Очевидно, ми ідентифікували зонд, специфічний для чоловічого геному, який зіставлений з одним із контигів (зонд 184 на додатковому малюнку 12). Ми не знайшли вирівнювання послідовності цієї області з будь-яким іншим геномом хребетних, що припускає його унікальне походження у коропа.

Транскрипційний аналіз переходу до харчових звичок

Трави коропа, як правило, травоїдні - риса, яка робить їх популярним типом розмноження. Питання про те, як білий амур ефективно поглинає поживні речовини з рослин для підтримки їх швидкого росту, - питання без відповіді 37. Білий амур завершує перехід від м’ясоїдної до рослиноїдної дієти, коли досягає довжини тіла від 3 до 5,5 см, приблизно через 1,5 місяця після вилуплення. Ми проаналізували РНК-послідовності. Похідне від кишечника, печінки та мозку для характеристики варіацій експресії генів до та після зміни (рис. 4а та онлайн-методи). Гени з диференціальною експресією значно збагачені шляхами, пов'язаними з циркадним ритмом в кишечнику та біосинтезом стероїдів, біосинтезом кістяка терпеноїдів та метаболізмом печінкових гліцерофосфоліпідів (DAVID Bioinformatics Resources 38; P

a ) Розробка експериментів FHT. Через 46 днів після вилуплення у риб, які не пройшли FHT (годували личинками хірономіду), брали проби "46 d". Між 46 і 116 днями після вилуплення рибу розділили на дві групи - одну годували зябрами, а іншу - личинками хірономідів - яких збирали через 116 днів після вилуплення як зразок "116 d - FHT" і зразок "116 d ". ( b ) Активація шляху мевалоната та біосинтез стероїдів. Сині та оранжеві стрілки по-різному позначають кроки реакції. Цифра в кожному прямокутнику вказує код ЕС ферменту, що каталізує цей перенос. Червоні коди вказують на ферментні гени зі значно підвищеною експресією після того, як FHT (q 45) показаний на гістограмах. Назви сполук наведені поруч із відповідними колами.

Повнорозмірне зображення

  • Завантажте вихідні дані Excel

Після зміни дієти дуже важливо, щоб амур підтримував безперервний ритм годування, щоб вони могли отримувати достатню кількість поживних речовин зі свого раціону. Аналіз даних печінкової РНК-послідовності виявив значну активацію шляху біосинтезу стероїдів до мевалоната в біосинтезі терпеноїдного відділу хребта, що відображається у середньому рівні експресії в 32 рази вищому, ніж до зміни дієти (значення q 39 39, 41) . що білий амур, що харчується блохами, має значно більший ріст, ніж капуста, яка харчується личинками хірономідів (риби, що перебувають перед переходом та непрохідні риби), з точки зору довжини тіла, довжини кишки, маси тіла та довжини кишечника/довжини тіла (дані не показано) Метаболічна адаптація цих шляхів, очевидно, сприяє ефективному використанню рослинних поживних речовин у коропа.

Крім того, у попередньому звіті зазначалося, що білий амур, що харчується рослинною дієтою, витрачає більше часу на годування 37. Ми також спостерігали, що білий амур, який отримував рослинну дієту, годувався майже безперервно протягом цілодобового періоду. Аналіз даних транскриптомів показав, що гени, що беруть участь у циркадному ритмічному шляху, активувались після проходження їжі (FHT), що включало гетеродимер годинника - bmal1 та гени ror та годинник (додаткова фігура 15а). Пов’язані гени демонструють високу схожість з генами даніо (такими як гени rorca 42 та clocka 43), за винятком деяких промоторних областей генів, що несуть різні елементи (додаткова фігура 15b). Хоча взаємозв'язок між генами, що беруть участь у циркадному ритмі, та безперервному годуванні незрозумілий, цей висновок міг би припустити, що частоту годування слід досліджувати під час зміни раціону коропа.

Ми досліджували показники не-білого коропа на потенційні мікробіоти в кишечнику, видаляючи всі показники РНК-seq кишечника, узгоджені зі збірками амура (додаткові таблиці 20 та 21 та додаткова примітка). Цей аналіз не виявив жодних генів, що кодують передбачувані ферменти, що перетравлюють целюлозу в кишечнику, припускаючи, що кишечник амура може не перетравлювати і не поглинати целюлозу, підсилюючи уявлення про те, що целюлоза може розвиватися як водна добавка для сприяння росту амура. 44. Однак, цілком ймовірно, що секвенування біоти кишечника буде сильнішим у розумінні того, як амур перетравлює рослинні матеріали.

обговорення

Ми створили два набори геномів білого амура - чоловічого та повністю анотованого жіночого. Порівняння великої кількості генних моделей та аналіз синтезу показали, що даніо та білий амур мають схожу історію геному. Однак хромосомне злиття, яке призводить до зв’язування 24 групи та виникнення GCSD, може бути причиною суттєвих відмінностей у розвитку (наприклад, розмір тіла) та інших характеристиках (наприклад, визначення статі) між амуром та зебрами. Характеристика транскриптів, пов’язаних зі зміною дієти, дала нову геномну інформацію про метаболічну адаптацію коропа до переходу на вегетаріанський раціон протягом його життя. Ці геномні послідовності також забезпечують поширення білого амура до геномної фази.

методи

Підготовка та секвенування бібліотеки ДНК.

Геномну ДНК виділяли з клітин крові дорослого гіногенетичного дорослого коропа та дикої трави дорослого коропа з використанням набору DNeasy Blood and Tissue Kit (Qiagen). Підхід 46 без ампліфікації був використаний для підготовки бібліотек послідовностей із короткими вставками від 350 до 450 bp для парних зчитувань згідно з протоколом виробника для Illumina. Протоколи Посібника з підготовки зразків Mate-Pair Library v2 (Illumina) та спарений кінець використовуються для складання бібліотек вставок 1, 3, 5 та 8-10 кб для парних зчитувань (додаткове зображення 16). Посібник з підготовки бібліотеки (Roche) був об’єднаний. Сирі дані генерували секвенсор Illumina HiSeq 2000 та секвенсор Illumina Genome Analyzer IIx.

Збірка послідовності.

Для складання коротких значень (додатковий малюнок 1) був розроблений конвеєр збірки de novo, який був модифікованою версією методу Phusion-meta, як згадувалося раніше 20. Коротко кажучи, коли парні кінці зчитувались для усунення поганих показників, що містять десять або більше унікальних K-полімерів, вони були згруповані в тисячі груп за допомогою Phusion2 з K -mer, встановленим на 51 bp. Показання, згруповані в кожному кластері, розташовувались паралельно у контиги ABYSS 47, fermi 48 та SOAPdenovo 49. Всі ці контиги були об’єднані для створення початкового дизайну контигу. Контисенсусні контиги були отримані шляхом вирівнювання всіх показань до чернеток контигів за допомогою інструменту управління збіркою GAP5 (посилання 50). Потім пари пар зчитування були ієрархічно та ітеративно об’єднані в contigs для побудови попередніх SOAPden-ешафотів (K -mer встановлений на 61 bp). Остаточне риштування було виконано за допомогою Spinner.

Прогнозування білків, що кодують гени.

Переписування послідовностей.

Шість тканин (ембріон, печінка, селезінка, мозок, нирки та голова) були зібрані у дорослих чоловіків, а отримані дані використані для моделювання генів. Всі ці зразки, а також зразки з експериментів FHT, були піддані виділенню РНК з використанням реагенту SV TRIzol (Invitrogen). Полі (А) + мРНК очищали за допомогою набору для очищення мРНК DynaBeads (Life Technologies). Парні бібліотеки кДНК були побудовані з використанням повного набору для підготовки бібліотек Sena NGS RNA RNA (Gnomegen). Отримані парні бібліотеки кДНК секвенували за допомогою системи Illumina HiSeq 2000.

Ідентифікація чоловічих контигів, розташованих на потенційній статевій хромосомі.

Чоловічі контиги (довжина> 500 bp) були вирівняні з жіночими contigs (довжина> 500 bp) за допомогою вирівнювача MUMmer 53 із параметрами за замовчуванням. Потім охоплення кожної чоловічої статі жінками оцінювали за допомогою порогу ідентичності> 95% і вимагаючи, щоб будь-який нерівномірний зазор у вирівняній області був довгим 54, використовувався для цифрового вимірювання диференціальної експресії в анотованих локусах. Коли експресія генів збільшилася або зменшилася за 116 д - FHT печінки більш ніж удвічі (значення q 39