За десятиліття розвитку штучного інтелекту в цій області було створено два основних табори. "Символісти" прагнули будувати інтелектуальні машини, програмуючи логічні правила та уявлення про світ. "Коннекціоністи" прагнули побудувати штучні нейронні мережі, натхненні біологією для дослідження світу. Зараз дослідники з MIT, IBM та DeepMind вказують на силу поєднання цих двох підходів у новій роботі.

Команда під керівництвом Джоша Тененбаума, професора з Массачусетського технологічного інституту, створила комп’ютерну програму під назвою нейросимволічний концепт-студент (NS-CL), який пізнає світ (хоча і спрощену версію) у дитинстві - озираючись навколо себе та розмовляючи. Система складається з декількох частин. Одна нейромережа тренується на серії сцен, створених з невеликої кількості об’єктів.

Інша нейронна мережа навчається у серії текстових відповідей на запитання (наприклад: Який колір кулі? Червоний). Ця мережа навчиться відображати питання натуральною мовою у простій програмі, що працює на сцені, та створювати відповіді. Система NS-CL запрограмована на розуміння символічних понять у тексті, наприклад "Об'єкти", "атрибути об'єкта", "просторові зв'язки". Ці знання допомагають NS-CL відповісти на нові запитання щодо іншої сцени. Така вправа набагато вибагливіша, якщо ми використовуємо суто коннекціоністську процедуру.

підходів

"Це захоплюючий підхід", - говорить Бренден Лейк, доцент Нью-Йоркського університету. "Нейронне розпізнавання шаблонів дозволяє системі бачити, тоді як символічні програми дозволяють системі розуміти. У сукупності цей підхід виходить за рамки того, що можуть зробити сучасні системи поглибленого навчання ". Таким чином, гібридна система вирішує ключові обмеження двох попередніх підходів, поєднуючи їх.

Це долає проблему масштабованості символізму, яка прагнула програмувати всю складність людських знань, і в той же час одну з найпоширеніших проблем нейронних мереж - той факт, що їм потрібен величезний обсяг даних. Можна навчити нейронну мережу відповідати на запитання, надаючи мільйони прикладів у формі навчальних даних.

Однак дитині не потрібен такий величезний обсяг даних, щоб зрозуміти, що таке новий об’єкт і який його зв’язок з іншими об’єктами. Навіть навчена таким чином мережа насправді не зрозуміє концепції - вона просто ретельно відпрацює відповідний шаблон. Тому така система буде схильна до дуже тривіальних помилок, коли стикається з іншими сценаріями.

Новий метод може відкрити нові можливості для застосування штучного інтелекту, оскільки ця технологія вимагає набагато менше навчальних даних. Робототехнічні системи можуть вчитися "на льоту", не витрачаючи багато часу на навчання для кожного унікального середовища, в яке вони потрапляють.