PCM, Wav, Aiff. Стиснення. Mp3, Ogg, Wma.
Робота з цифровим звуком - це майже звична робота для фахівців з головоломок. Оскільки аудіо зберігається на комп’ютері, а всі комп’ютерні файли мають розширення, ми повинні інтерпретувати кожну абревіатуру та абревіатуру.
Розширення є заключною частиною файлу після назви та періоду. Він використовується, щоб знати, який це тип файлу, якщо це текст, відео чи аудіо. Існує багато розширень, і всі вони вам звучать звично: WAV, RM, MP3, WMA, OGG ... Тоді давайте пограємо, щоб розшифрувати загадки і подивитися, що означає кожна з цих абревіатур.
НЕКОМПРЕСОВАНІ ЦИФРОВІ АУДІОФАЙЛИ
.PCM
Це не тип файлу або формату, а техніка перетворення аналогового в цифровий звук без будь-якого стиснення. (1) Тому ми не бачимо аудіо з розширенням pcm. Ми працюємо з PCM під час оцифрування, але завжди зберігаємо у файлах з одним із таких розширень:
Це найбільш широко використовуваний нестиснений цифровий аудіоформат. Належить Microsoft/IBM .
.AIFF: (Формат файлу обміну аудіо)
Це схоже на WAV, але для комп'ютерів Apple Macintosh або MAC.
.CDA: Це звукові доріжки, записані на компакт-диск, які також використовують систему PCM .
Усі нестиснені файли великі. Приблизно 10 мегабайт на кожну хвилину звуку. Це формати, що використовуються для збереження аудіо на професійному рівні, оскільки якість дуже хороша. Але коли нам не потрібно стільки якості і нам не вистачає місця, настав час застосувати стиснення файлів.
АУДІОКОМПРЕСІЯ
Стиснення зменшується, і коли ми зменшуємо, ми щось втрачаємо. Те саме стосується цифрового аудіо. Останні досягнення дозволили стиснути з мінімально можливими втратами якості, але вони завжди є. На противагу цьому було багато здобуто у зменшенні розміру файлів.
Хоча 4-хвилинне аудіо у форматі WAV займає приблизно 40 мегабайт, те саме аудіо, стиснене до MP3, може зменшити свою вагу до 4 мегабайт, у 10 разів менше. І, мабуть, вони звучать однаково. (2)
ЗБЕРЕЖИТИ НЕКОМПРЕССОВАНІ
Під час роботи у виробництві це завжди записується у форматі WAV, не стиснуте. Таким же чином він редагується та змішується. Якщо кінцевим результатом видання є аудіо, яке буде розміщено на веб-сайті або збережено на жорсткому диску комп’ютера, ми можемо стиснути його в mp3, але з якістю не менше 160 кбіт/с.
Якщо, навпаки, кінцевий пункт виробництва має бути записаний на компакт-диск, ніколи не стискайте, завжди залишайте аудіо у форматі WAV і запишіть його таким чином на компакт-диску.
1. Як працює стиснення?
Справа не в зморщенні чи стиску аудіо. Більшість систем стиснення звуку використовують «дефект» нашого вуха, щоб зменшити розмір файлу. Це називається маскуванням.
Маскування - це властивість людського вуха, яке заважає йому розрізняти дві частоти, що знаходяться близько в одному діапазоні, одна маскує іншу. Наприклад, якщо в пісні звучить одночасно звук з частотою 12 кГц і ще 12,2 кГц, ми могли б видалити один із двох, не помічаючи цього під час прослуховування.
Таким чином, компресор «віднімає» замасковані частоти, що зменшує кількість байт. І менше байтів під час обчислень перетворюється на менші файли, але не менше часу. Пісня при стисненні триває так само, як і нестиснута.
2. Якість стиснених файлів
У попередньому питанні ми побачили, що цифровий звук має два параметри: частоту дискретизації (оптимальна - 44,1 кГц) та роздільну здатність або розмір кожної вибірки (8 або 16 біт). Під час стиснення ми додаємо до цих двох третій параметр - бітрейт. Це кількість кілобайт в секунду (кбіт/с) і стосується якості стиснення.
• Нижче Кбіт/с, більше стиснення, менший розмір файлу, але нижча якість.
• Вища Кбіт/с, нижча стиснення, більший розмір файлу та вища якість.
Аудіо, стиснене зі швидкістю 128 Кбіт/с, має вищий рівень стиснення, ніж рівень 256 Кбіт/с. Це означає, що 128 - менший розмір файлу та нижча якість, ніж 256 Кбіт/с. Хоча для того, щоб розрізнити обидва, потрібно мати котяче вухо!
ЗМІННИЙ АБО ПОСТІЙНИЙ БІТ
Деякі файли мають постійну швидкість передачі даних в секунду (CBR Constant Bit Rate), а інші мають змінну швидкість (VBR Variable Bit Rate). Константа завжди однакова для всього звуку, наприклад 128 кілобайт на секунду. У змінному методі компресор використовує більше бітів, коли є частини аудіо, де більше частот, і він не може замаскувати всі.
ФОРМАТИ СТИСНАНОГО ФАЙЛУ
.MP3 (MPEG -1 Audio Layer 3) (4)
Він досягає високих компресій без особливих втрат, хоча все залежить від якості компресії, яку ми використовуємо. 128 Кбіт/с і менше, не рекомендується.
Хоча mp3 є найпоширенішим стандартом стиснення, особливо для аудіо на веб-сторінках, великим недоліком є його патент. Тож будь-який програвач або програмне забезпечення для редагування, яке хоче його використовувати, має за це заплатити.
.OGG (Vorbis)
В результаті цього патенту Фонд Xiph.org розробив у 2002 році абсолютно безкоштовний кодек (5) для стиснення звуку. Подібний за функціями mp3, він стає широко використовуваним в Інтернеті та в деяких програвачах, оскільки виробники не повинні платити патентні збори. На даний момент йому важко повністю замінити mp3, але він їсть багато землі.
.AAC (Розширене кодування звуку - Розширене кодування звуку)
Рівень стиснення вищий, ніж mp3 (MPEG -1), без значної втрати якості. AAC - один із кодеків, що використовується в новому стандарті стиснення MPEG -4. Цей аудіоформат використовується в програвачах, таких як iPod, та в деяких новіших цифрових радіосистемах. AAC формується як наступник mp3.
.ОЗП (також МРТ або РА)
Це файли компанії Real Network для аудіо. Проблема полягає в тому, що відтворення та видання дуже обмежене програмним забезпеченням тієї ж компанії та кількома іншими.
.WMA (Windows Media Audio)
Це ставка Windows на стислі формати. Він схожий на WAV, але менший за розміром та нижчої якості. Хоча файли mp3 та ogg відтворюються майже всіма програвачами та редакторами, те ж саме не стосується wma, тому він використовується дуже мало.
. AA3 (ATRAC - адаптивне трансформаційне акустичне кодування)
Формат, винайдений Sony. Це той, який використовують міні-дисководи-програвачі.
.ІНШІ
Вони використовуються в основному в аудіоплеєрах або для мелодій дзвінка для мобільних телефонів (6), таких як mmf, amr ...
АУДІО ПРОЕКТИ
Аудіоредактори Multitrack генерують файли зі своїми розширеннями. Наприклад, багатодорожна Audacity зберігає файли з розширенням .aup. Але, навіть якщо проект або сесія Audacity містять аудіо, які ми редагуємо, це не означає, що це розширення формату аудіофайлу. Це просто спосіб збереження проекту програмою. Кожен багатодоріжковий редактор, як і кожне програмне забезпечення, має своє розширення.
ТЕГИ ID3
Ці мітки або мітки не є аудіоформатами, а застосуванням цифрових файлів. Під час відтворення пісні в комп'ютерному аудіоплеєрі ми бачимо назву пісні, виконавця, альбом, рік ... Ця інформація є тегами, і її можна легко редагувати за допомогою того самого програвача, не впливаючи на звук пісні.
Екран аудіоплеєра Winamp для редагування тегів аудіо.
▪ Хвильова інженерія: цифрові аудіоформати. Альберто Лопес Мартін. Університет Вальядоліда. http://www.lpi.tel.uva.es/ (Прочитати документ)
Оцінки
Стиснення - це процедура, про яку ми поговоримо пізніше, що дозволяє зменшити розмір аудіо, не втрачаючи якості.
Коли ми говоримо про вагу, ми маємо на увазі розмір аудіо- чи цифрового комп'ютерного файлу в байтах. Великим файлам потрібно багато байтів, це означає, що вони займають більше місця на жорсткому диску і що вони «важать» більше для завантаження з Інтернету.
Нестиснений цифровий звук, як і CD, має 1411 Кбіт/с. Як бачите, різниця в байтах значна. У цьому прикладі ми говоримо про нестиснене цифрове аудіо стандартної якості з частотою дискретизації 44,1 кГц, 2 каналами для стерео та 16 бітами. Кількість: 44,1 × 2 × 16 = 1,411 Кбіт/с
Цей стислий цифровий аудіоформат був розроблений вченими з Інституту Фраунгофера IIS, що входить до Групи експертів із рухомих зображень (MPEG), яка займається розробкою стандартів аудіо- та відеокодування.
Скорочення від Encoder - Decoder. Аудіокодеки - це системи або технології стиснення та декомпресії.