Бази даних відіграватимуть дуже важливу роль у дослідженнях, оскільки ми накопичуємо все більше і більше інформації, і нам потрібні інструменти, стратегії та методології, щоб мати можливість використовувати всю цю інформацію, яку ми генеруємо. До цього часу ми були в передісторії, якою буде обробка інформації, і в майбутньому ми повинні побачити вражаючі зміни в цьому відношенні.
Що таке бази даних і для чого вони потрібні?
Наш спільний інтерес полягає у дослідженні раціону та харчування окремих людей чи груп населення. Вивчити раціон людини чи популяції можна з точки зору їжі, але рано чи пізно нам доведеться дослідити, які хімічні сполуки ця людина чи популяція вживає з цими продуктами, оскільки причинно-наслідкові зв’язки, на які ми йдемо щоб спробувати знайти, найпростіший спосіб встановити їх - це вивчення надходження хімічних сполук. А їжа дуже складна з хімічної точки зору. У харчових продуктах є поживні речовини - головна причина зацікавленості - але існує також нескінченність сполук, одні з яких мають оздоровчі властивості, інші з небажаними властивостями, а інші без відомої активності - принаймні до цих пір - але всі вони надходять із наше годування.
Ми могли б використовувати хімічний аналіз для дослідження дієти, але це було б неприступною роботою, тому нам потрібні дані про склад їжі. Ці дані можна отримати з наукових статей, але це важко припустити, і нам потрібен документ, який збирає всю наявну інформацію про хімічний та харчовий склад. Ці дані дозволять нам оцінити раціон людей та населення, але вони також матимуть важливе значення для планування раціону цих людей та намагання досягти певних цілей, які можуть бути рекомендаціями щодо харчування або обмеженням споживання певних продуктів.
Тому ми погоджуємось, що одним із найважливіших застосувань даних та таблиць складу харчових продуктів є саме дослідження харчових досліджень, в яких кількість цих сполук визначається кількісно, але це не єдине використання. Вони також можуть знадобитися для планування, складання певних продуктів у харчовій промисловості або для маркування харчових продуктів. І, нарешті, використання в навчанні, в університетах, де імпортується Диплом з питань харчування та дієтології, а також в аналітичних лабораторіях або для розробки правових норм.
Бази даних - це набори даних, які репрезентують хімічний склад харчових продуктів, тобто вони повинні представляти те, що нас цікавить. Наприклад, якщо ми робимо іспанську базу даних про склад їжі, ми повинні спробувати зробити так, щоб ця база представляла склад їжі, який можна знайти на іспанському ринку.
Таблиця або база даних про харчові продукти - це документ, який має простішу структуру і в основному складається з трьох компонентів: переліку продуктів харчування, переліку поживних речовин або хімічних сполук та значень, для яких інформація про склад.
Методи розробки баз даних
Перший спосіб приготування - прямий, метод, який складається з планування відбору проб їжі, вибору аналітичних методів та аналізу цих зразків їжі. Дані збираються, складаються в базі даних і, нарешті, публікуються в електронному або друкованому форматі. Таблиці складів можна створювати з баз даних про склад харчових продуктів.
Цей метод має ту перевагу, що ми контролюємо весь процес. Контролюється дизайн плану вибірки - що є дуже важливим для досягнення репрезентативності бази даних -, планування плану вибірки, вибір аналітичних методів та процес компіляції даних. Якщо ми добре його розробимо, цей метод пропонує дані найвищої якості. Проблема цього методу в тому, що він страшенно дорогий. Аналіз однієї проби їжі на основні поживні речовини може коштувати 3000 євро. Тому нам потрібна альтернатива, яка дозволяє нам економити, що є непрямим методом.
Непрямий метод полягає у пошуку існуючої інформації про склад їжі, її складанні та передачі на перевірку - щоб перевірити, чи відповідає ця інформація цим вимогам, яким ми встановили, що вона повинна відповідати. Ми не можемо контролювати ні вибірку, ні вибір аналітичної техніки. І іноді те, що ми маємо, не відповідає нашим потребам належним чином. Наприклад, якщо ми зацікавлені в тому, щоб дані були репрезентативними для існуючих продуктів харчування на іспанському ринку, якщо публікація надає нам дані про їжу, якої зазвичай немає на нашому ринку, ця інформація марна, я не можу використовувати її для створення моя база даних.
Щодо аналітичного методу створення бази даних про склад харчових продуктів для застосування у галузі харчування, є деякі методи, які не працюють. Отже, ми повинні подати дані на перевірку (дані за даними), тоді ми зможемо зібрати дані та опублікувати їх. Перевага цього методу в тому, що він набагато дешевший за попередній, але проблема в тому, що він вимагає багато часу та персоналу з певною підготовкою.
Зазвичай використовується комбінований метод, який оптимізує співвідношення витрат/якості бази даних. У цьому методі ми відбираємо продукти, які мають більшу вагу в раціоні населення, до яких ми хочемо віднести базу даних, і ці продукти, якщо ми збираємося їх відбирати та аналізувати, для цих продуктів ми матимемо дані високої якості. Але щодо продуктів, що мають малу вагу, ми збираємося слідувати стратегії непрямого методу: ми будемо шукати інформацію та складати інформацію, передаючи її на експертизу. І ми поєднуємо дані з цих двох методів в одній базі даних. В принципі це метод вибору. Однак він має недолік, це те, що при використанні непрямого методу для отримання даних про продукти, що мають низьку вагу в раціоні, ми матимемо багато невідомих значень, оскільки, можливо, немає опублікованої інформації з цього приводу або ми маємо не мав доступу до неї. Як ми діятимемо у цих випадках, ми побачимо пізніше.
Джерела інформації
В якості джерел інформації ми можемо чітко проводити аналізи - які є зірковими даними -, з іншого боку, наявні дані, які ми збираємось отримати з наукових статей. Вони мають свої переваги, оскільки ці статті пройшли рецензування, тому є фільтр, але нам все одно потрібно переглянути їх. Проблема в тому, що це займає багато часу. Також існує можливість консультування докторських дисертацій та інших академічних робіт і, нарешті, даних, наданих компаніями, які також можуть бути використані, але які можуть не відповідати вимогам, встановленим нами для нашої бази даних.
Не можна забувати, що в рамках інформаційної системи, яку ми створили для створення цієї бази даних, ми можемо генерувати дані. Наприклад, для обчислення загальної кількості вуглеводів нам не потрібно їх шукати, якщо ми маємо дані про цукри та полісахариди, ми можемо розрахувати загальну кількість. Ми також можемо розрахувати склад продуктів за рецептами, очевидно, маючи алгоритми та коефіцієнти коригування для приготування. І нарешті, ми можемо також зробити оцінки, що ми називаємо атрибуціями та припущеннями - наприклад, кажучи, що салат має нульовий рівень холестерину, це атрибуція, мені не потрібно шукати кількість холестерину в салаті, щоб зробити свою базу даних, як я знаю що кількість дорівнює нулю, я присвоюю це значення, і мені не потрібно далі шукати цей компонент. Від 15 до 20% значень у базі даних складають цей тип прямих "нулів".
Які продукти ви повинні включити в базу даних?
Це залежить від призначення бази даних. Якщо метою є включення харчової інформації про продукти компанії, то вам доведеться мати продукти компанії, це очевидно. Але що повинні мати національні бази даних? Національна база даних повинна містити як мінімум основні продукти харчування, які вносять 80 відсотків кожного поживного речовини в раціон, а разом вони вносять 90 відсотків усіх поживних речовин, які споживає населення. Продукти харчування, що забезпечують важливу кількість поживних речовин і які представляють інтерес з точки зору здоров’я населення. Наприклад, є продукти, багаті залізом, які не є необхідними, але оскільки поширеність залізної анемії важлива для нашого населення, ми вважаємо цікавим, що ця їжа є в списку. І, нарешті, комерційні та економічні фактори, багато разів вибирають продукти, оскільки цікаво знати їх склад з комерційних причин.
Як визначається основна їжа? З даних обстеження харчування каталонського населення ви можете побачити перелік продуктів, які забезпечують 50 відсотків споживання жиру. Лише 19 продуктів становлять 50 відсотків споживання жиру. Є такі продукти, які, очевидно, повинні бути в списку, такі як оливкова олія, майонез або соняшникова олія, але є також такі продукти, які, в принципі, ми вважаємо, що вони не мають надзвичайно багато жиру, але які споживаються у великих кількостях.
Опис їжі. Конфлікти
Загальні назви, які ми зазвичай використовуємо, іноді не допомагають нам адекватно описувати їжу, і нам доводиться шукати інші системи, які є набагато вишуканішими. У таблицях складів використовується гранована система, це означає, що для кожної їжі нам доведеться описати найважливіші аспекти, які допоможуть нам їх правильно визначити та уникнути плутанини щодо інших продуктів.
Система Langual регулюється цим принципом граней, і кожна грань має тезаурус термінів, тому у нас є обмежений перелік дескрипторів для кожної грані продуктів, і нам доводиться описувати їжу за допомогою цих дескрипторів, які періодично переглядаються та розширюються.
Класифікація продуктів харчування
Системи класифікації харчових продуктів мають сильний культурний компонент, але є деякі системи, які намагаються бути універсальними, одна з них є Eurocode 2. Це дуже сувора система класифікації, але вона дуже цікава для тих, хто займається епідеміологією, оскільки може бути корисною для опису прийому досліджуваних осіб з точки зору груп продуктів харчування.
Ми всі погодимось, що всі поживні речовини повинні бути включені, проблема полягає в тому, що знайти такий обсяг інформації дуже складно, і ми повинні визначити пріоритети, ми зможемо включити лише ті поживні речовини, про які є достовірна інформація і у яких є гроші прикрити їх.
Виявлення поживних речовин також має проблеми. Багато разів є упереджені описи, наприклад, використання аскорбінової кислоти як синоніму вітаміну С є неправильним. Вітамін С містить кілька вітамінів, включаючи аскорбінову кислоту, і іноді ми можемо знайти таблиці складів, які використовують їх як синоніми. Правильний опис буде з двома вітамеро.
Визначити поживні речовини теж непросто, і існують системи, подібні до Langual, але присвячені поживним речовинам. Важливо подумати про те, яким саме є опис кожної поживної речовини, використовуючи базу даних. І одиниці та форми вираження також є життєво важливими.
Є також аспекти якості даних. Існують стратегії вивчення даних, і одна з них - це системи перевірки якості даних, для яких переглядається план відбору проб, кількість зразків, аналітичний метод та виконання аналізу. І простий спосіб зробити це за допомогою рубрик, які застосовуються до даних кожної композиції, щоб оцінити її якість.
Основні критерії якості
Існує декалог, якому повинна відповідати база даних про харчові продукти. Щодо поживних речовин, ми повинні попросити, щоб це був адекватний перелік, який відповідає нашим потребам, з чітким визначенням поживних речовин і що включає детальну інформацію про форми вираження. Що стосується продуктів, то їх адекватний перелік та хороший опис. Щодо значень, то невідомих значень небагато, і що ці показники хорошої якості, принаймні перевірені.