предметів

реферат

Характеристика ієрархії клітин епітеліальних клітин молочної залози (МЕК) та їх регуляція під час розвитку дорослого є важливим для розуміння розвитку раку молочної залози. Тут ми повідомляємо про використання послідовності одноклітинної РНК для визначення профілю експресії гена MEC на чотирьох стадіях розвитку; нерожаючий, вагітність середнього віку, період лактації та після інволюції. Наш аналіз 23 184 клітин ідентифікує 15 кластерів, кілька з яких можна повністю охарактеризувати одним маркером. Натомість ми стверджуємо, що епітеліальні клітини - особливо в просвітному відділі - повинні бути концептуалізовані, а не частиною спектру безперервної диференціації. Крім того, наші дані підтверджують існування загальної просвітньої клітини-попередника, яка веде до тимчасових, обмежених альвеолярних та гормональних попередників. Цей просвітній відділ попередника зазнає змін транскрипції у відповідь на повну вагітність, лактацію та інволюцію. Таким чином, наші результати дають глобальний, неупереджений погляд на розвиток дорослих молочних залоз.

Тут ми використовували послідовність одноклітинних РНК (scRNAseq) для відображення динаміки клітин епітеліальних клітин молочної залози на чотирьох стадіях розвитку дорослих; вагітність, лактація та відлучення (повна природна інволюція). Наші дані з 23 184 окремих клітин ідентифікують 15 різних популяцій клітин у залозі та дозволяють їх ієрархічну структуру в різні моменти часу розвитку.

результат

Секвенування одноклітинної РНК визначає 15 скупчень клітин епітелію молочної залози

епітеліальних

Секвенування одноклітинної РНК ідентифікує 15 скупчень клітин епітелію молочної залози. Принципова схема, що висвітлює експериментальну установку для виділення РНК та послідовності окремих клітин за допомогою 10-кратної системи хрому. b Графік t-SNE з 23184 комірок візуалізує загальну структуру даних. Клітини забарвлюються згідно з чотирма часовими моментами розвитку наступним чином: рожевий = NP, темно-зелений = G, світло-зелений = L, фіолетовий = PI. c Такий же, як b, але фарбування клітин скупченнями. d t-SNE, пофарбований нормалізованою логарифмічно трансформованою експресією базального маркера Krt5 та просвітного маркера Krt18

Повнорозмірне зображення

Для подальшої характеристики кластерів ми ідентифікували диференційовано експресовані гени та отримали передбачувані ідентичності на основі відомих маркерів (рис. 2а, б). Як показано в таблиці 1, множинні скупчення клітин були віднесені до одного і того ж передбачуваного типу клітин. Ми виявили, що в цих випадках клітини демонстрували високу схожість і експресували однакові маркери, але походили з різних стадій розвитку (див. Суфікс NP, G, L або PI на рис. 2а), припускаючи, що стадія залози має специфічний вплив на країну транскрипції певних типів клітин.

Путативна ідентичність скупчень клітин епітеліальних клітин молочної залози. Кластерна дендрограма на основі перетворених в журнал середніх значень виразів 15 кластерів. Дерево було розраховано на основі кореляції Спірмена із зв'язком Уорда. b t-SNE із накладанням експресії кластер-специфічних генів. c Теплова карта, що виділяє гени ключових маркерів, які використовувались для отримання передбачуваних ідентичностей. Колірна шкала представляє логарифмічно перетворені та нормовані числа, зменшені до максимум 1 на рядок. Верхні стовпці відображають призначення кластера та ступінь кожної комірки. Для цілей візуалізації для великих кластерів було показано лише 100 випадково вибраних комірок

Повнорозмірне зображення

Стіл в натуральну величину

Ми виявили дві більші підгрупи в просвіті (рис. 2а). C1 - C5 показали характеристики гормоночутливих клітин (Hs), такі як високий рівень експресії гормональних рецепторів (Pgr, Esr1, Prlr) (рис. 2b, c). З передбачуваних клітин Hs ми виявили, що C1/C2 експресують маркери-попередники (наприклад, Aldh1a3, Cd14, Kit) 18, що свідчить про обмежену функцію попередника (Hsp) (рис. 2b, c), тоді як C3/4/5 показали більш диференційоване (Hsd) (рис. 2б, в; таблиця 1). Друга підгрупа в просвітньому відділі (С6 - С11) виражала лише низький рівень гормональних рецепторів. C6/7 виражав високі рівні маркерів-попередників, що узгоджується з фенотипом просвітнього пророку (Lp) (рис. 2б, в). На противагу цьому C8 - C11 експресували молочні білки (наприклад, Wap, Csn2) і складалися виключно з клітин гестації та лактації, підтверджуючи гіпотезу про те, що вони є секреторними альвеолярними (Av) клітинами (рис. 2b, c; таблиця 1). З передбачуваних альвеолярних клітин ми виявили, що C10/C11 експресують гени, пов'язані з обмеженою функцією альвеолярного попередника (Avp), тоді як C8/C9 виявляється в більш диференційованому альвеолярному стані (Avd) (рис. 2b, c).

У базальному відділі ми виявили, що клітини С14 виявляли такі характеристики міоепітеліальних клітин, як високий рівень Acta2, Oxtr та Krt15 (рис. 2b, c). Крім того, базальний відсік також містив клітинний кластер С15, який експресував високий рівень Procr, Gng11 та Zeb2, припускаючи, що вони представляють раніше ідентифіковані базальні клітини Procr +, які, як було показано, збагачені для одиниць репопуляції молочних залоз 19. (Рис. 2b, c).

Реконструкція ієрархії просвітньої диференціації

Ми зосередили увагу на клітинах з часових точок NP та G, щоб визначити стани диференціації епітелію молочної залози. Ці стани диференціації та переходи між ними можна обчислити за допомогою дифузійних карт 20. Коротше кажучи, цей метод містить дані у низькорозмірному просторі, де відстань між клітинами являє собою поступовий, але стохастичний процес, такий як диференціація. На дифузійних картах, сформованих з усіх епітеліальних клітин, ми спостерігали чітку сегрегацію між просвітніми та базальними скупченнями, практично не маючи перехідних процесів між цими двома групами (рис. 3а). Це підтверджує гіпотезу про те, що під час нормального гомеостазу тканин дві лінії в основному підтримуються самостійно, що відповідає більшості подальших досліджень лінії 21, 22, 23. На відміну від цього, просвіт поділу показав іншу структуру, з поступовим переходом між різними скупченнями та клітинами спільного походження (рис. 3б). Ми підтвердили надійність цієї біфуркації, перевіривши, що вона була присутня, коли використовувались різні методи вибору властивостей, виведення траєкторій та алгоритми вибіркової вибірки (додатковий малюнок 5).

Обчислювальна реконструкція процесів диференціації в молочній залозі. карта дифузії епітеліальних клітин з часових точок NP і G, що показує перші три дифузійні компоненти. b Траєкторії диференціації просвітнього відсіку на основі перших двох дифузійних компонентів. c Той самий графік, що і в b, пофарбовані нормалізованими та зниженими рівнями експресії різних генів

Повнорозмірне зображення

Ми виявили, що експресія маркера-попередника Aldh1a3 поступово зменшується, коли клітини віддаляються від свого загального походження (рис. 3в), яке значною мірою формується клітинами С6 (Lp). Ми також зазначили, що ліва рука траєкторії диференціації закінчується на C8 (Avd) і демонструє підвищену експресію Csn2 та Glycam1 (рис. 3c), що відповідає секреторному фенотипу. Між С6 та С8 ми виявили клітини, які були отримані переважно з С10 (Avp, рис. 3b). На правому плечі траєкторії диференціації клітини переходили від С6 до С2 та С4/5 (Hsp та Hsd), під час яких експресія Esr1 та Pgr збільшувалась, припускаючи, що ця гілка представляє диференціацію до гормоночутливих просвітніх клітин (рис. 3в). ).

Розташування псевдочасу визначає гени, пов’язані з просвітом диференціювання. Визначення галузі зондування гормонів та секреторної диференціації. Клітини забарвлюються шляхом їх прогресування через псевдочас, де низькі значення представляють недиференційовані клітини. b - d Приклади факторів транскрипції із виразом, залежним від псевдочасу, з однаковою загальною тенденцією на обох гілках ( b ) або галузеві тенденції ( c, d ). e, f Теплова карта всіх генів із залежною від гілки експресією, залежною від псевдочасу для лінії гормонального зондування ( e ) або секреторна лінія ( f ). Псевдочас і розподіл кластерів анотуються над спекою. Значення на тепловій карті представляють значення, зменшені за шкалою z, згладжені сплайси. Гени на теплових картах були згруповані за допомогою ієрархічної кластеризації з динамічним обрізанням дерев

Повнорозмірне зображення

Паритет готує просвітників до альвеолярної долі

Вплив парності на транскриптомічний ландшафт просвітнього відділу попередника. Порівняння множинних змін від С6 проти Люмінальний відсік і складка змінюється від С7 порівняно з люмінальними клітинами. Гени представляють перші 500 диференційовано експресованих генів між С6 та просвітніми клітинами. b Вулканічний графік, що ілюструє диференціальну експресію між C6 і C7, кольорові точки представляють важливі гени з відомою функцією в лактації та імунітеті, пунктирними лініями виділено поріг порогу P 0, 01 та часову зміну значення 1. Значення P скориговані для багаторазового тестування Бенджаміні - Хохберг. c, d Візуалізація різниці експресії генів, пов’язаних з лактацією ( c ) або імунітет ( d ) для шести просвітніх кластерів у NP та PI. Значення виразу відповідають нормованій кількості UMI. e Клітини PI, спроектовані на дифузійній карті з часових точок NP і G. Клітини NP і G сірі

Повнорозмірне зображення

обговорення

Коротше кажучи, наші дані дають неупереджений погляд на розвиток молочної залози. Цей підхід допомагає підтримати деякі раніше розроблені гіпотези в молочній залозі та описує процеси диференціації при високій роздільній здатності клітин. Набір даних буде корисним ресурсом для майбутніх досліджень, щоб зрозуміти взаємозв'язок між різними типами клітин залози та тим, як розвивається та прогресує рак молочної залози.

методи

Усі експериментальні роботи на тваринах виконувались відповідно до Закону про наукові процедури від 1986 р., Великобританія, та затверджені Комітетом з етики Інституту Сангера. Мишей C57BL/6N утримували в клітинах з індивідуальною вентиляцією на циклі 12:12 год світло-темно, при цьому вода та їжа були доступні за бажанням. Експеримент був встановлений, щоб дозволити одночасно збирати всі моменти часу розвитку та обробки тканин. Мишей жертвували термінальною анестезією. Самки спаривались із шпильками і були кинуті. Потім тканини збирали на 14,5 день (G) вагітності, на 6 день лактації (L) та на 11 день після природного відлучення (PI). Тканину самок NP забирали у віці 8 тижнів. У дослідженні використовували двох особин мишей за час розвитку. Стадію естрального циклу тварин з моменту часу NP та PI визначали за допомогою вагінального мазка (додаткова фігура 8).

Дисоціація молочної залози до суспензії одноклітинних клітин

Лімфатичні вузли, позбавлені молочних залоз (крім шийної пари), відокремлювали від мишей і механічно дисоціювали. Тонко подрібнену тканину переносили в травну суміш, що складається з DMEM/F12 (Gibco) + 10 мМ HEPES (Gibco) + колагенази (Roche) + 200 U мл - 1 гіалуронідази (Sigma) + гентаміцину (Gibco) протягом 3 годин при 37 ° ° C і кружляли кожні 30 хвилин. Після лізису еритроцитів у NH 4 Cl клітини ненадовго перетравлювались теплим 0,05% трипсином-ЕДТА (Gibco), 5 мг мл-1 диспази (Sigma) та 1 мг ml-1 DNase (Sigma) та клітинним фільтром (BD Biosciences) фільтрували.

Позначення клітин з подальшою проточною цитометрією та сортуванням

Підготовка та послідовність бібліотеки

Підготовка бібліотеки виконувалась відповідно до інструкцій у 10-кратному наборі для однієї комірки. Потім бібліотеки об’єднувались та розподілялись у шести смугах на HiSeq2500.

Обробка даних RNA-seq

Обробка зчитування проводилася за допомогою робочого циклу 10X Genomics 17. Коротко кажучи, одноразовий програмний набір Cell Ranger (//software.10xgenomics.com/single-cell/overview/welcome) був використаний для демультиплексування, призначення штрих-коду та кількісного визначення UMI. Показання узгоджували з еталонним геномом mm10, використовуючи заздалегідь створений пакет анотацій, отриманий на веб-сайті 10X Genomics. Всі смуги на зразку були оброблені за допомогою функції "countranger count". Потім вихід з різних шляхів агрегувався за допомогою 'cellranger aggr' з -normalise, встановленим на 'none'.

Контроль якості та попередня обробка

кластеризація

$ config [ads_text16] не знайдено

Аналіз диференціальної експресії

Аналіз диференціальної експресії генів проводили за допомогою edgeR 46. Для парного порівняння між кластерами гени із середнім рівнем експресії нижче 0,1 були вилучені з аналізу. Негативна біноміальна узагальнена лінійно-лінійна модель була встановлена ​​на решті генах із кластерними відведеннями як коваріати. Функція 'glmTreat' була використана для ідентифікації генів, які мають значно більші зміни часових згинів, ніж 1, при FDR 0,01. Гени-маркери, зображені на рис. 2 були ідентифіковані за допомогою функції 'findMarkers' у scran із налаштуваннями за замовчуванням для генів, які мали медіанну експресію 1 принаймні в одному кластері 40 .

Карти дифузії та виведення псевдочасу

Для виведення траєкторії диференціації ми використовували дифузійні карти. Спочатку ми відібрали всі клітини з часової точки NP та G (рис. 3а) та виявили HVG, як описано вище. Потім перераховані в журнал (log2 (count + 1)) кількості генів використовувались для обчислення дифузійних компонентів за допомогою функції „DiffusionMap“ (параметри за замовчуванням, як у долі 47). На рис. 3b, тоді ми зосередились на просвітньому відділі та перерахували карту дифузії, базуючись лише на просвітніх клітинах, використовуючи вищезазначену процедуру. Слід зазначити, що структура, виведена алгоритмом дифузійної карти, була надійною до вибору ознак та подальшої вибірки клітин (Додаткова Рис. 5b). Про структуру спільного походження та дві гілки можна також зробити висновок, використовуючи Monocle зі стандартними настройками 48 (Додаткова Рис. 5a). Для висновку про впорядкування гілок та псевдочасу ми визначили наступні три підказки, клітинку з найбільшим значенням для другого власного вектора (який був встановлений як корінь) та комірки з найбільшими та найменшими значеннями для першого власного вектора (порівняйте рис. . 4a).

Вираз, залежний від псевдотиму

Аналіз збагачення генів

Аналіз збагачення наборів генів, заснований на термінах генної онтології (GO), був проведений для характеристики різних наборів генів в аналізі. Ці гени порівнювали з усіма генами, які тестували на диференціальну експресію, використовуючи topGO із налаштуваннями за замовчуванням 49 .

Наявність даних

Автори заявляють, що всі дані, що підтверджують результати цього дослідження, доступні в статті та додаткових інформаційних файлах або у відповідного автора за обґрунтованим запитом. Дані послідовності РНК були депоновані в базі даних Gene Expression Omnibus (GEO) під кодом приєднання GSE106273. Дані також можна дослідити за адресою //marionilab.cruk.cam.ac.uk/mammaryGland. Усі обчислювальні аналізи проводились у R (версія 3.4.1) із використанням стандартних функцій, якщо не вказано інше. Код доступний в Інтернеті за адресою //github.com/MarioniLab/MammaryGland.

Дякую

Ми вдячні Інституту Сангера, Науково-дослідному центру (ФНБ) за допомогу. Дякую також Dr. Аарону Т. Луню (CRUK CI) за корисні обговорення та коментарі щодо рукопису. KB фінансується Кембриджським онкологічним центром. DA фінансує CRUK та Wellcome Trust. ІП фінансується CRUK. JCM фінансує CRUK та EMBL. WTK фінансується за рахунок кар'єрної премії CRUK (C47525/A17348), Кембриджський університет та Коледж Магдалини, Кембридж.