Простори імен
Дії сторінки
Системи кодування а потреба в класифікації виникає внаслідок необхідності реєструвати, маскувати, упорядковувати, ідентифікувати, групувати та класифікувати явища та сприяти їхній реєстрації та передачі. Приклади: азбуки Морзе, написання ключів, класифікаційні коди бібліотек, коди товарів тощо.
Резюме
- 1 Еволюція систем кодування
- 2 Багатобайтова система
- 3 Версії цього типу кодування
- 4 Цілі кодексів
- 5 Характеристика кодових систем
- 6 Види кодування
- 6.1 Значний
- 6.2 Несуттєво
- 7 Джерела
Еволюція систем кодування
Поширення інформатики до нелатинських кореневих культур швидко виявило, що 256 символів було недостатньо, щоб містити графіки всіх мов. Наприклад, кирилиця; іврит; арабська; грецьких та японських, щоб назвати декілька. Стала очевидною потреба в системі з більш ніж 256 можливостями, що призвело до створення систем кодування, в яких кожен символ займав більше одного октету (принаймні певні символи), саме тому ці системи загалом відомі як широкі символи. Прийняте рішення включає дві великі групи: багатобайтову систему (§2) та широку символьну систему (§3), різні різновиди яких. Зазвичай перший використовується для зовнішнього представлення (зберігання) та зв'язку, тоді як другий є кращим для внутрішніх представництв.
Багатобайтова система
Якщо мова йде про представлення наборів із понад 256 символів у зовнішніх сховищах або в системах передачі, в яких економія простору та/або пропускна здатність є важливою, рішенням буде використання багатобайтових систем кодування. Відомо скорочено як MBCS ("Багатобайтовий набір символів").
Як вказує його назва, вони використовують більше одного октету, але ширина різних символів змінюється відповідно до потреби в даний момент. Багатобайтові символи - це суміш одно- та двобайтових символів, які можна вважати надмножиною 8-бітових ASCII. Звичайно, конвенція цього типу вимагає ряду правил, які дозволяють аналіз ("Розбір") рядка байтів для ідентифікації кожного символу.
Версії цього типу кодування
- JIS (японський промисловий стандарт). Він використовується в основному для спілкування, наприклад електронної пошти, оскільки використовує лише 7 бітів для кожного символу. Використовує екрановані послідовності для перемикання між одно- та двобайтовим режимами на символ та для перемикання між різними наборами символів.
- Shift-JIS Введена корпорацією Майкрософт і використовується в системі MS-DOS, саме ця система підтримує найменшу кількість символів. Кожен байт повинен бути проаналізований, щоб перевірити, чи є він символом чи першим із дуету.
- EUC (Розширений кодекс Unix). Ця система використовується як внутрішній метод кодування на більшості платформ Unix. Він приймає символи довжиною більше двох байт, тому він набагато розширюваніший, ніж Shift-JIS, і не обмежується кодуванням японської мови. Він дуже підходить для обробки декількох наборів символів.
- UTF-8 (формат перетворення Unicode). У цій системі кожен символ представлений послідовністю від 1 до 4 байт, хоча насправді кількість бітів, призначених для представлення символу, обмежена максимум 21 (решта - метадані - інформація про інформацію -). Мета цих метаданих полягає в тому, що послідовність може бути інтерпретована з будь-якої позиції.
Цілі кодексів
- Сприяти обробці.
- Дозволити однозначну ідентифікацію.
- Дозволити класифікацію.
- Дозволити пошук інформації або розташування.
- Уможливити встановлення взаємозв’язків між різними закодованими елементами.
- Сприяти маркуванню певних властивостей кодованих елементів.
Характеристика кодових систем
- Він повинен бути логічно пристосований до інформаційної системи, частиною якої він є.
- Він повинен мати точність, необхідну для опису даних.
- Його слід тримати якомога менше.
- Потрібно дозволити розширення.
- Він повинен бути простим у використанні.
- Вони повинні відповідати вимогам обладнання
Типи кодування
Коли ми говоримо про кодування символів під час обчислень, ми маємо на увазі метод, який дозволяє перетворити символ із природної мови (алфавіту чи складу) в символ з іншої системи подання, наприклад у число, послідовність електричних імпульсів в електронній система, октети, що застосовують стандарти або правила кодування. Це для того, щоб полегшити зберігання тексту в комп'ютерах або полегшити передачу тексту через телекомунікаційні мережі, дуже простим прикладом може бути код Морзе
Існує два основних типи кодових систем: значущі коди та незначущі коди.
Значний
Як вказує його назва, це ті, що мають на увазі значення, тобто які в більшій чи меншій мірі відображають характеристики об'єкта, предмета чи особи, якому він присвоєний.
Не суттєво
Іноді їх називають послідовними або послідовними) жодним чином не описують об'єкт, до якого вони застосовуються, а є простими мітками, за допомогою яких об'єкт відрізняється від інших.
Існує широкий вибір методів кодування, які класифікуються відповідно до використовуваних ними символів:
У загальному розумінні алфавітні та буквено-цифрові коди ефективні, коли йдеться про просте кодування, без великої кількості класифікацій та з невеликою кількістю ігор. Вони мають той недолік, що обмежена кількість букв не дає великої амплітуди в класифікаціях, хоча за алфавітом можна класифікувати 26 можливостей, що може зменшити розмір коду. Вони також дозволяють використовувати мнемонічні ресурси, що може знадобитися у випадках, коли потрібна швидка та проста інтерпретація коду.