Чи можете ви уявити, що зможете дізнатися, скільки калорій містить ваша тарілка, лише за допомогою однієї фотографії? Це останній проект, який розробляє Google, заснований на технології ШІ, і який може бути дуже корисним для боротьби з ожирінням.

Більш-менш навмисно, Google ви намагаєтеся уникати надто детальної інформації щодо вашого нового проекту на основі штучний інтелект (ШІ). Цей тип технологій став основою пошукової системи компанії та причиною, яка призвела до досягнення такої високої популярності. Метою придбання DeepMind за 400 мільйонів доларів у 2014 році було отримання досвіду цієї британської фірми у дослідженнях «Глибоке навчання», і таким чином наростити цей ключовий потенціал.

google

Крім того, за словами Еріка Софге з популярної науки, Googleplex поглинув деякі найяскравіші думки в галузі ШІ, а також найвідоміші компанії-робототехніки, офіційно призначивши частину згаданої групи експертів у таких галузях, як транспортні засоби без водія, доставки безпілотників та інших проектів, пов’язаних зі штучним інтелектом, про які вже було оголошено публічно. Але що саме задумали ці експерти Google? Відповідь - їжа.

На цьому тижні на прес-конференції в Бостоні, науковий співробітник Google Кевін Мерфі представив проект, заснований на аналізувати фотографії їжі та оцінювати кількість калорій за допомогою складних алгоритмів. Назва системи - Im2Calories, і, наприклад, переглянувши зображення, він може виявити два яйця, два млинці та три скибочки бекону. Звідси система вимірює розмір кожної порції їжі по відношенню до тарілки, так само, як і приправи. Крім того, Im2Calories не вимагає зображень із високою роздільною здатністю, фотографій стандартної якості, таких як зроблені Instagram.

Що стосується суми калорій, Im2Calories призначений для спрощення процесу, підтримуючи a добовий план харчування, шляхом ідентифікації харчових продуктів без необхідності вручну вставляти їх у програму та використання оцінок стійких змінних, таких як розмір порцій. "Ми зробимо його напівавтоматизованим", - сказав Мерфі під час своєї презентації, зазначивши, що можна виправити програмне забезпечення за допомогою випадаючих меню, якщо трапляється, що ви помилково сприймаєте смажене за яйця-пашот або ви отримуєте абсолютно неправильне читання . "Навіть якби це спрацьовувало лише 30% випадків, було б достатньо, щоб люди почали ним користуватися, щоб ми збирали дані та вдосконалювали процес з часом", - сказав Мерфі.

З огляду на велике занепокоєння в США проблемою ожиріння, очевидно, що комерційна версія Im2Calories буде дуже добре сприйнята.

Як працює Im2Calories

Якщо заглибитися трохи глибше в його роботу, як і у багатьох інших програмах „машинного навчання”, вона полягає у зв’язку візуального аналізу - у цьому випадку, визначення глибина кожного пікселя на зображенні - з розпізнаванням зразків. Im2Calories встановлює зв’язок між тим, що виявляє в порції їжі, та великою базою доступних калорій.

Im2Calories призначений для вдосконалення в процесі використання. Його мета - мінімізувати кількість часу, витраченого на годування або сканування програмного блоку, тим самим покращуючи його продуктивність. Коли Im2Calories читає, що це гамбургер, це тому, що пікселі на зображенні нагадують пікселі на записаних фото гамбургерів. Щоб глибоке навчання було ефективним, витягуючи нюанси насамперед із аудіо, відео, нерухомих зображень та джерел тексту, потрібно мати принаймні одне певна міра впевненості в собі.

Навіть припускаючи, що Im2Calories не стає повністю точним, Мерфі вважає, що це все одно вплине. "Для мене очевидно, що люди хочуть чогось такого, і це буде дуже корисно", - сказав він. "Гаразд, ми можемо отримати лише 20% калорій, це не має значення. У середньому ми зробимо тиждень, місяць чи рік. І ми можемо збирати інформацію від найрізноманітніших людей, щоб розпочати статистика на рівні населення. У мене є колеги з епідеміології та охорони здоров’я, які дуже зацікавлені ".

Google нещодавно розпочав процес патент для Im2Calories, а Мерфі відмовився розповісти деталі, коли це може бути доступно. Однак довгострокова мета цієї технології має більший охоплення. Очевидно, що Google спробує знайти найкращий варіант для вас. "Якщо ми зможемо здійснити цей процес з їжею, це лише вихідна точка", - сказав Мерфі. "Ми могли б уявити можливий аналіз інших типів сценаріїв, наприклад, на вулицях, з метою виявлення транспортних засобів або підрахунку кількості автомобілів, отримання характеристик тощо. Що допомогло б нам робити прогнози щодо можливості місця для паркування, серед інших варіантів. А оскільки технологія однакова, змінюватимуться лише дані ".

Якщо вони нарешті їх розвинуть роботів в автомобілях здатний виявити, в якому блоці існує найбільша ймовірність знайти безкоштовну автостоянку протягом десяти хвилин, немає сумнівів, що технології ШІ, засновані на "глибокому навчанні", будуть і надалі викликати все більший інтерес з боку Силіконова долина.