Рушійні зміни до цифрового світу
Звичайно, ви чули про геномне секвенування, але чи знаєте ви, яка технологія робить це можливим? Чи знаєте ви, скільки коштує секвенування геному? У цій статті ми даємо вам відповіді на ці та інші питання та аналізуємо найновіші дані щодо цієї технології.
Початок усього цього: генетичний код ДНК
Наш генетичний код та код усіх живих організмів, від найменшого вірусу до найбільшого з коли-небудь існували динозаврів, базується на алфавіті з чотирьох букв: A, C, G і T (по одному для кожного нуклеотиду або основи ДНК: аденин, гуанін, цитозин та тимін відповідно).
За допомогою цієї четвертинної мови записуються ланцюги ДНК. Сукупність усіх ланцюгів ДНК живої істоти - це її геном. Геном людини складається з 46 ланцюгів ДНК (46 хромосом) на загальну кількість більше 3 мільярдів літер. Кожна з наших клітин у своєму ядрі містить копію нашого геному. Однакова копія в кожній комірці. Цей геном буде оброблятися по-різному для кожного типу клітин, як ми пояснили в нашій нещодавній статті:
"Що таке генетичне успадкування пояснюється нотами фортепіано"
Геномні послідовності можна переглянути в загальнодоступних базах даних
Порядок написання чотирьох букв A, C, G і T в геномі - це те, що відоме як його послідовність. В даний час відома послідовність тисяч геномів; і ці послідовності зберігаються у величезних базах даних, багато з яких є загальнодоступними та у вільному доступі. Найважливішими загальнодоступними геномними базами даних є NCBI (Національний центр біотехнологічної інформації, США), ENA (Європейський архів нуклеотидів, Великобританія) та DDBJ (База даних ДНК Японії, Японія).
Усі проекти послідовності, що фінансуються за державні кошти, зобов'язані вільно призначати послідовності, отримані в ході розслідувань, до будь-якої з цих баз даних, щоб з ними можна було вільно отримувати консультації та використовувати.
Геном людини був повністю секвендований в 2001 році. І ця віха для молекулярної біології була одночасно опублікована науковими журналами Природа Y Наука.
Технології, які роблять можливим геномне секвенування
Але як ви читаєте нитки ДНК? Першим кроком у будь-якому проекті секвенування завжди є фрагментація ниток ДНК геному на менші шматочки, що полегшить командам секвенування їх читання. Після фрагментації геному для кожної бази ДНК будуть розміщені різні мітки, які змусять обладнання для секвенування розпізнати їх, перевести як A, C, G або T і надіслати цей переклад програмному забезпеченню, яке поверне зображення, схоже на це:
Ці програмні виходи називаються хроматограмами, на яких кожна база ДНК представлена різним кольором (зелений для A, синій для C, чорний для G і червоний для T). Це також вказує на якість кожного окремого базового показника, представленого вертикальною зеленою смужкою. Індекс якості послідовності ДНК обчислюється шляхом підсумовування індивідуальної якості кожної основи і служить для розрізнення послідовностей низької, середньої та доброякісної послідовності. Залежно від подальшого застосування послідовності ДНК можуть бути використані всі якості або лише найкраща якість.
Показання послідовності надсилаються до бази даних, яка після аналізу їх якості та іншої інформації, пов’язаної з проектом послідовності, присвоює їм ідентифікаційний код (унікальний для кожної послідовності ДНК у базі даних) та зберігає. Як користувачі цієї бази даних, під час завантаження послідовності нам буде повернутий файл у текстовому форматі, подібному до цього:
Перші два рядки файлу, розділені знаком>, містять унікальну інформацію цієї послідовності ДНК: її числовий код (у даному випадку 568815593), його ім'я (у цьому випадку NC_000005.10, що відповідає хромосомі людини номер 5) за яким слідує його точне розташування в цій хромосомі (: c151690947-151657201, послідовність знаходиться між цими початковим і кінцевим положеннями). Примітка: буква c вказує на те, що послідовність була зчитана в додатковому ланцюжку ДНК, отже, її початкове положення зчитування на число більше, ніж остаточне положення зчитування.
Джерело: https://www.genome.gov/27562862/breve-historia-del-proyecto-del-genoma-humano/
Існують різні технології секвенування
Метою цієї статті не є детальний аналіз кожної розробленої на сьогоднішній день технології секвенування, а представити глобальне бачення, яке допоможе нам зрозуміти причину зниження її вартості і, отже, демократизації її застосування. Для огляду різних технологій це хороший путівник іспанською мовою.
У 70-80-х роках минулого століття секвенування ДНК було стандартизовано у всіх лабораторіях молекулярної біології; Це було ручне секвенування, засноване на радіоактивному міченні основ ДНК. Зчитування 150-300 основ було досягнуто для кожної реакції секвенування, і до 10 незалежних реакцій можна було включити в кожен раунд. Його називали ручним, оскільки читання здійснював користувач на основі.
У середині 90-х перше автоматичне обладнання для секвенування стало продаватися, так зване, оскільки воно вже включало програмне забезпечення, яке «зчитувало» послідовність; Крім того, це був час, коли від радіоактивного маркування відмовились (з подальшим зменшенням професійних ризиків) для етикеток, заснованих на емісії флуоресценції, які і сьогодні продовжують залишатися основою деяких сучасних методів секвенування маси.
Справжня революція в технологіях секвенування починається з розробки мініатюризації пристроїв для завантаження зразків ДНК: спочатку з’явилися 96-лункові планшети (по 1 зразку ДНК поміщали в кожну лунку), потім їх потужність зросла в чотири рази - до 384 лунок на пластину і, нарешті, сьогодні, коли використовуються пластини, де одночасно поміщаються десятки тисяч зразків ДНК.
Якщо до того, що вже коментували, додати вдосконалення, зроблені в архітектурі обладнання, у виявленні маркувальних міток на базах ДНК та в використовуваних алгоритмах секвенування, все це означало поступове зменшення витрат на секвенування.
Але скільки коштує секвенування геному?
Ми склали графік розвитку вартості секвенування геному з 2001 по 2017 рік, використовуючи публічні дані NHGRI (Національний науково-дослідний інститут геному людини) США, одного з першопрохідців у секвенуванні геному людини і в даний час провідних сховищ проектів публічної послідовності у всьому світі. Тут можна ознайомитися з вихідними даними та методами, використовуваними для їх розрахунку.
Наведений вище графік відображає вартість геному (у тисячах доларів США) у порівнянні з минулим часом (з 2001 по 2017 рік). Щоб краще спостерігати знайдені величезні відмінності, вартість геному представлена в логарифмічному масштабі. У 2001 році секвенування геному коштувало близько 100 мільйонів доларів США, тоді як сьогодні це коштує лише 1000 доларів США. Протягом усіх цих 17 років спостерігались різні фази цього скорочення: до 2007 року спостерігалося зменшення на 10%, але станом на 2007 рік витрати на послідовність скорочувалися дуже прискореними темпами; Це було пов’язано із впровадженням вищевказаних удосконалень різними технологіями масового секвенування та жорсткою конкуренцією, яка існувала та існує між технологічними компаніями, які їх розробляли.
Важливість цих недорогих розробок вже перекладена на численні сфери застосування, зокрема на так звану персоналізовану медицину. Його мета - оптимізувати медичне лікування, а також рекомендації щодо охорони здоров’я на основі індивідуальних геномних характеристик кожного пацієнта.
Невдовзі наша геномна послідовність буде включена в нашу клінічну історію, і до неї приєднаються дані моніторингу в режимі реального часу, які ми отримуємо за допомогою наших мобільних додатків. Вони є трьома ногами того, що називали великими даними в галузі охорони здоров’я.
Будь-які технологічні зміни завжди передбачали протягом історії певний страх з боку суспільств, які бачили їх народження, але також було доведено, що правильне використання технологій, заснованих на адекватному та оновленому регулюванні, дозволило досягти людству важливих успіхів. Правильне регулювання використання наших геномних даних сприятиме розробці додатків, які, безсумнівно, покращать якість нашого життя.
Бібліографічні посилання, використані при підготовці цієї статті:
Мардіс Е. Десятирічна перспектива технології секвенування ДНК. Природа, 470: 198-203. 2011 рік.
Мецкер М. Технології секвенування - наступне покоління. Генетика природи, 11: 31-46. 2010 рік.
Геном людини в десять: послідовність вибуху. Природа, 464: 670-671. 2010 рік.
- Елегантність для схуднення - скільки це коштує і як працює
- Як діють антидепресанти, як довго їх можна приймати та які побічні ефекти
- Ми виявляємо готель, де живе Енріке Сан-Франциско, і скільки йому це коштує
- Найдорожча собака у світі, чи знаєте ви, скільки вона коштує
- Скільки насправді коштує отримання венесуельського паспорта за кордоном Papagayo News