Документи
Розшифровка виявлення точок зміни послідовностей мітохондріальних ДНК
Виявлення точок зміни
в послідовностях ДНК
Нора Мартнес Вільянуева
Магістр статистичних методів
Університет Віго
Виявлення точок зміни в послідовностях
Нора Мартнес Вільянуева
Дозвіл на доставку
Пан Хав’єр Рока Пардінас та Мігель Мендока Фонсека
Що проект назвав Виявлення точок зміни послідовностей міфу про ДНК-
хондріал був зроблений ДНК. Нора Мартнес Вільянуева, разом з D.N.I. 53179846-
М, під керівництвом пана Хав'єра Роки Пардінаса та пана Мігеля Мендоки Фонсеки.
Цей звіт являє собою документацію, яку з нашого дозволу ми надаємо
сказав студент як заключний магістерський проект.
Хав'єр Рока Пардінас Мігель М. Фонсека
Віго, 16 січня 2012 року
Визначення мутаційних процесів, які впливають на послідовності ДНК, є дуже важливим-
розумовий для кращого розуміння того, як розвиваються геноми. Механізм
реплікація, під час якої ланцюги піддаються сильним мутаційним пошкодженням-
Найкраще, це було описано як одне з основних джерел упередженості композиції
нуклеотидні ланцюги. У цій роботі представлений seq2R, пакет R, який
виявляє особливості у складі мітохондріальних геномів (mtDNA). Для
Тому були застосовані методи згладжування ядерного типу, які оцінюють показники
нуклеотиди та методи бутстрапа були застосовані при побудові інтервалів
впевненість у цих оцінках. Крім того, цей пакет дозволяє представляти graphi-
Отримано оцінку та зроблено висновок про точки зміни (або
особливості) інтересу.
1. Вступ 1
2. Статистична методологія 7
2.1. Алгоритм оцінки. . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Вибір вікна. . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3. Обчислювальні аспекти. . . . . . . . . . . . . . . . . . . . . . . . 10
2.4. Довірчі інтервали. . . . . . . . . . . . . . . . . . . . . . . . . . одинадцять
3. Розробка програмного забезпечення 13
3.1. Функція Read.genbank (). . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2. Функція Read.all (). . . . . . . . . . . . . . . . . . . . . . . . . . . п’ятнадцять
3.3. Функція Change.binary (). . . . . . . . . . . . . . . . . . . . . . . . 16
3.4. Функція Change.points (). . . . . . . . . . . . . . . . . . . . . . . . 17
3.5. Функція plot.change.points (). . . . . . . . . . . . . . . . . . . . . 19
3.6. Критична () функція. . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4. Дослідження мітохондріальної ДНК у Homo sapiens 23
Пакет seq2R 33
Більшість еукаріотичних організмів містять у своїх клітинах кілька
органели, які відомі під назвою мітохондрії. Зазначені органели - це есен-
клітинної активності, оскільки вони відповідають за перетворення калорій
що ми включаємо в раціон корисну енергію (аденозинтрифосфат, АТФ) через
процесу окисного фосфорилювання (Wallace, 1992). Однак цей процес цього не робить
це єдина, в яку втручаються мітохондрії. Наприклад, вони, як відомо, є
бере участь у біосинтезі інших клітинних метаболітів і в регуляції
запрограмована загибель або апоптоз клітин (Orrenius, 2004).
Ці органели складаються із зовнішньої мітохондріальної мембрани, простору
міжмембранна, внутрішня мітохондріальна мембрана (з інвагінаціями, що називаються
гребені) та мітохондріальний матрикс. Хоча більша частина ДНК у клітині є
У ядрі мітохондрія має власний геном - мітохондріальну ДНК (mtDNA,
1.1) (Bruces et al., 2007).
Кількість мітохондрій на клітину коливається в широких межах залежно від типу органу.-
нізму або тканини, і кожен, за оцінками, має 2-10 копій мтДНК
(Візнер та ін., 1992).
Геном мітохондрій знаходиться в матриксі мітохондрій і має
типово кругова структура, що складається з двох ланцюгів ДНК. Це є-
покладено переважно з чотирьох азотистих основ: аденін (а), тимін (т), гуанін
(g) та цитозин (c). З'єднання обох ланцюгів виробляється спарюванням
Ці основи, аденін і тимін, є взаємодоповнюючими, тоді як гуанін доповнює.
це з цитозином. Через їх біохімічний склад ці нитки різні, оскільки
що нуклеотидна послідовність однієї багата G (важка ланцюг або Н-ланцюг), а друга ланцюг бідна цією азотистою основою (легкий ланцюг або Lstrand) (Андерсон
2 Розділ 1. Вступ
та ін., 1981). Мітохондріальний геном кодує 13 білків, що беруть участь у ланцюзі
респіраторні, 2 рибосомні РНК і 22 переносні РНК, які пов’язані
з процесом транскрипції мтДНК (P. F. Chinnery, 2003). На малюнку 1.2
представлена схема людської мтДНК.
1.1: Структура мітохондрії (в центрі) еукаріотичної клітини (зліва). Зображення мікроскопа мітохондрії (праворуч) (http://bio1151b.nicerweb.com/Locked/media/ch06/mitochondrion.html).
Відкриття цього унікального геному в мітохондріях було дуже
важливо мати можливість проводити дослідження щодо походження та еволюції згаданих органел
(Мунолу та ін., 1966; Шац, 1963).
Мутація - це зміна одного нуклеотиду іншим. Генетична варіація
в мтДНК вона походить через мутації, які накопичуються в геномі.
середня швидкість мутації мтДНК у 10 разів перевищує ядерну ДНК.
Це пояснюється тим, що (i) мтДНК піддається окислювальному пошкодженню, спричиненому
реакції, що відбуваються в мітохондріях, (ii) ядерна ДНК є кращою
захищені та (iii) механізми відновлення пошкоджень ДНК не дуже ефективні
в мітохондріях. Оскільки мтДНК успадковується через матір (Давид і
Блеклер, 1972; 3rd Hutchison et al., 1974) і швидкість рекомбінації обмежена і
рідко породжує нові генетичні варіанти (Tsaousis et al., 2005), ці мутації
є головним чином джерелом змін у цьому геномі.
Рис. 1.2: Мітохондріальний геном Homo sapiens. Це невелика молекула 16 569 кб дволанцюжкової мДНК, яка кодує 13 основних компонентів дихального ланцюга: гени ND1-ND6, що кодують 7 субодиниць комплексу I, Cyt b кодує субодиницю комплексу III, CO I-III кодує три субодиниці комплексу IV, гени ATP6 і ATP8 кодують дві субодиниці комплексу V. Крім того, він містить 2 гени рибосомних РНК (12S і 16 S рРНК) і 22 гени переносу РНК. D-петля є некодуючою областю, що бере участь у регуляції важливих процесів, OH і OL, є джерелами реплікації важкої та легкої ланцюгів мтДНК. Абревіатури: ND1 - ND6, субодиниці 1-6 дегідрогенази NADH; Cyt b, субодиниця цитохрому b; COI-III, субодиниці оксидази цитохрому с; АТФ6 та АТР8, субодиниці АТФ-синтази. 12S і 16S рРНК; Гени тРНК позначаються буквою відповідної амінокислоти.
Коли мутагенні механізми і процес відбору однаково впливають
для обох ланцюгів ДНК частота нуклеотидів у кожному з них повинна бути
збалансоване правило другого паритету (Chargaff, 1950; Lobry, 1995). Тим не менше,
упередженість у складі ланцюгів можна визначити як відхилення в
цей взаємозв'язок, який передбачає існування асиметричних мутацій, похідних від різних-
різні механізми мутації, наприклад, зміни основи під час реплікації,
Транскрипція або відновлення ДНК (Frank and Lobry, 1999). Якщо ці мутації є-
Натомість під час реплікації ви можете очікувати великих змін у
4 Розділ 1. Вступ
нуклеотидний склад у джерела реплікації (у хребетних тварин-
два, що називаються OH і OL) і в кінці нових послідовностей
MtDNA (Touchon and Rocha, 2008).
Виходячи зі складу послідовностей та для того, щоб оцінити місце розташування
з двох джерел реплікації (OH та OL) Григор’єв (1998) використовував acu-
GC-муляція: метод, що складається з суми (G-C)/(G + C) від точки
довільний початок послідовності, поки вона не пройде її повністю. Я міг це спостерігати
Упередження GC зростає із наближенням до OH та OL. Однак це метод
як і багато інших, що використовувались до цього часу, йому бракує статистичної строгості.
У цьому проекті представлена нова статистична методологія, яка дозволяє-
виявляти зміни у складі геномних послідовностей за допомогою
регресія. Визначення цих точок перемикання корисно для придбання-