что такое кодирование что такое декодирование информации
Что такое кодирование что такое декодирование информации
В процессах восприятия, передачи и хранения информации живыми организмами, человеком и техническими устройствами происходит кодирование информации. В этом случае информация, представленная в одной знаковой системе, преобразуется в другую. Каждый символ исходного алфавита представляется конечной последовательностью символов кодового алфавита. Эта результирующая последовательность называется информационным кодом (кодовым словом, или просто кодом).
Примерами кодов являются последовательность букв в тексте, цифр в числе, двоичный компьютерный код и др.
Код состоит из определенного количества знаков (имеет определенную длину), которое называется длиной кода. Например, текстовое сообщение состоит из определенного количества букв, число — из определенного количества цифр.
Преобразование знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы называется перекодированием.
При кодировании один символ исходного сообщения может заменяться одним или несколькими символами нового кода, и наоборот — несколько символов исходного сообщения могут быть заменены одним символом в новом коде. Примером такой замены служат китайские иероглифы, которые обозначают целые слова и понятия.
Кодирование может быть равномерным и неравномерным. При равномерном кодировании все символы заменяются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины (это затрудняет декодирование). Неравномерный код называют еще кодом переменной длины.
Примером неравномерного кодирования является код азбуки Морзе. Длительное время он использовался для передачи сообщений по телеграфу. Кодовый алфавит включал точку, тире и паузу. При передаче по телеграфу точка означала кратковременный сигнал, тире — сигнал в 3 раза длиннее. Между сигналами букв одного слова делалась пауза длительностью одной точки, между словами — длительностью трех точек, между предложениями — длительностью семи точек.
Вначале код Морзе был создан для букв английского алфавита, цифр и знаков препинания. Принцип этого кода заключался в том, что часто встречающиеся буквы кодировались более простыми сочетаниями точек и тире. Это делало код компактным. Позже код был разработан и для символов других алфавитов, включая русский.
Коды Морзе для некоторых букв.
Чтобы избежать неоднозначности, код Морзе включает также паузы между кодами разных символов.
Декодирование информации
В зависимости от системы кодирования информационный код может или не может быть декодирован однозначно. Равномерные коды всегда могут быть декодированы однозначно.
Для однозначного декодирования неравномерного кода важно, имеются ли в нем кодовые слова, которые являются одновременно началом других, более длинных кодовых слов.
Закодированное сообщение можно однозначно декодировать с начала, если выполняется условие Фано: никакое кодовое слово не является началом другого кодового слова.
Закодированное сообщение можно однозначно декодировать с конца, если выполняется обратное условие Фано: никакое кодовое слово не является окончанием другого кодового слова.
Неравномерные коды, для которых выполняется условие Фано, называются префиксными. Префиксный код — такой неравномерный код, в котором ни одно кодовое слово не является началом другого, более длинного слова. В таком случае кодовые слова можно записывать друг за другом без разделительного символа между ними.
Например, код Морзе не является префиксным — для него не выполняется условие Фано. Поэтому в кодовый алфавит Морзе, кроме точки и тире, входит также символ–разделитель — пауза длиной в тире. Без разделителя однозначно декодировать код Морзе в общем случае нельзя.
Конспект урока по информатике «Кодирование и декодирование информации».
Кодирование и декодирование информации
Вы будете перенаправлены на Автор24
Кодирование информации
Для осуществления полноценного процесса передачи информации, при котором сам процесс должен успешно завершиться, а сообщение дойти от отправителя до получателя в полном объеме, который, в свою очередь, его правильно трактует, информацию необходимо закодировать.
Кодирование — это преобразование информации из одной ее формы представления в другую, наиболее удобную для её хранения, передачи или обработки.
Способы кодирования информации бывают различные и зависят они, в первую очередь, от целей кодирования.
Наиболее распространенными из которых являются:
Чаще всего кодированию подвергаются тексты на естественных языках (русском, английском и пр.).
Цели кодирования заключаются в доведении идеи отправителя до получателя, обеспечении такой интерпретации полученной информации получателем, которая соответствует замыслу отправителя. Для этого используются специальные системы кодов, состоящие из символов и знаков. Код представляет собой систему условных знаков (символов), предназначенных для представления информации по определенным правилам. В настоящее время понятие «код» трактуется по-разному.
Некоторые авторы (Р. Бландел, А. Б. Зверинцев, В. Г. Корольке и др.) понимают коды как любую форму представления информации или же как набор однозначных правил, используя которые сообщение можно представить в той или иной форме. Согласно этому определению человеческая речь может выступать в качестве одного из кодов. Это может означать, что в результате кодирования сообщение преобразуется в последовательность, состоящую из произносимых слов.
Готовые работы на аналогичную тему
Другим вариантом трактовки термина «код», сформированного в технической среде под влиянием «математической теории связи (коммуникации)» и использования технических средств коммуникации, является условное преобразование, как правило, взаимно однозначное и обратимое, используя которое сообщения преобразовываются из одной системы знаков в другую. К примерам такого преобразования относят азбуку Морзе, семафорный код и жесты глухонемых. Для данного определения характерно четкое различие языка, который развивался вместе с человеком на протяжении всего этапа эволюции, и кодов, разработанных людьми для определенных целей и подчиняющихся четко сформулированным правилам.
В теории коммуникации кодирование представляют как соответствующую переработку исходной идеи сообщения с целью ее доведения до адресата. При этом в разных конкретных случаях формы передачи информации могут быть различными, например: брошюры, листовки, рекламные ролики па заданную тему и т.д.
Декодирование информации
Декодирование — процесс восстановления изначальной формы представления информации, т. е. обратный процесс кодирования, при котором закодированное сообщение переводится на язык, понятный получателю. В более широком плане это:
а) процесс придания определенного смысла полученным сигналам;
б) процесс выявления первоначального замысла, исходной идеи отправителя, понимания смысла его сообщения.
Если получатель правильно воспримет смысл сообщения, то его реакция будет именно такой, какую и ожидал от него отправитель сообщения. То, каким образом получатель будет расшифровывать сообщение, зависит, как правило, от его индивидуальных особенностей восприятия информации. Так как каждый человек в той или иной степени предвзято и субъективно оценивает события, то, соответственно разные люди воспринимают и понимают одни и те же события по-разному. И это непременно необходимо учитывать при трансляции информации и при коммуникации между людьми.
Модель кодирования/декодирования С. Холла
Особенности системы кодирования-декодирования, которая включает в себя обработку информационного сообщения с целью его передачи и осмысления потребителем, лучше всего рассмотреть на примере коммуникационной модели С. Холла. В основу его теории положены базовые принципы семиотики структурализма, которые предполагают, что любое смысловое сообщение можно сконструировать из знаков, имеющих как явные, так и подразумеваемые смыслы в зависимости от выбора, осуществляемого кодировщиком, т.е. коммуникатором. Согласно основному положению семиотики многообразие смыслов зависит от природы языка, являющегося инструментарием информационной системы, и от смысловых значений, которые заключены в комбинациях знаков и символов в рамках определенной социальной культуры, к которой принадлежат отправитель (кодировщик) и получатель (декодировщик).
Семиотика подчеркивает семантическую силу закодированного текста, рассматривает смысл информационного сообщения прочно внедренного в текст. С. Холл принимал базовые положения этого подхода, но, в свою очередь, внес в него ряд дополнений.
Согласно Холлу коммуникаторы часто кодируют сообщения, придерживаясь идеологических и пропагандистских целей, а для этого манипулируют языком и медиасредствами (сообщения приобретают «предпочтительный» смысл).
Получатели согласно Холлу не всегда обязаны принимать и декодировать сообщения в том виде, в котором они отправлены. Получатели оказывать сопротивление идеологическому влиянию, применяя при этом альтернативные оценки в соответствии со своим мировоззрением, опытом и взглядами на окружающую систему бытия.
Свою теорию С. Холл сформулировал, используя в качестве примера работу телевидения, но ее можно применить к любым видам средств массовой информации. Суть теории заключается в том, что медиасообщение, проходя на своем пути от источника до получателя, претерпевает ряд преобразований. В результате средства медиакоммуникации передают сообщения, конформные или оппозиционные по отношению к правящим властям, различным общественным, политическим и экономическим социальным институтам. Эти сообщения кодируются зачастую в форме устоявшихся содержательных жанров (к ним можно отнести новости политического, спортивного, экономического содержания; музыкальные передачи, сериалы и пр., в общем все то, что смотрят обыватели), имеющих очевидный содержательный смысл, актуализированную направленность и встроенные руководства для их интерпретации заинтересованной целевой аудиторией. Зрители же, в свою очередь, подходят к содержанию, предлагаемому СМИ, с другими «смысловыми структурами», которые строятся на их собственном здравом смысле, идеях и опыте.
Различные группы людей (или так называемые субкультуры) занимают разные социальные и культурные ниши этнопространства и по-разному воспринимают сообщения СМИ. В результате своих исследований С. Холл пришел к выводу, что декодированный смысл сообщения не обязательно должен совпадать с первоначальным смыслом, который был закодирован, хотя он и был опосредован уже сложившимися медиажанрами и общей языковой системой. Важным является и то, что декодирование может принимать направления, отличные от предполагаемого, т.е. получатели, образно говоря, могут читать между строк и даже сознательно искажать изначально заложенный смысл сообщения.
Теория Холла содержит ряд принципиальных положений, это:
Таким образом, мы пришли к определению того, кто такой получатель.
Получатель — это лицо, для которого предназначена передаваемая информация, и которое может интерпретировать ее. Получателю, чтобы понять смысл передаваемого сообщения, нужно его раскодировать (декодировать). В качестве получателя могут выступать как один человек, так и группа лиц, общество в целом или любая его часть. Когда в качестве получателя выступает более одного человека, то это называют аудиторией коммуникации.
Получатель информационного сообщения должен обладать определенными характеристиками, которые представляю собой важные факторы, влияющие на эффективность коммуникации. Главным условием при этом становится способность получателя воспринимать и декодировать отправленное ему сообщение. Эта способность зависит от профессиональной компетентности получателя, его жизненного опыта, принадлежности к той или иной группе, ценностных ориентаций, общей культуры, образовательного и интеллектуального уровня, а также обусловлена социокультурными рамками коммуникативного процесса. Реакция получателя представляет собой основной индикатор эффективности коммуникации.
Мы подробно с вами разобрали непосредственно саму теорию кодирования и декодирования информационных сообщений, в частности модель Холла, которая в большей степени ориентируется на социум.
Однако эти два процесса широко используются во всех сферах жизнедеятельности человека: медицине, технике, образовании и т.д. И каждый из нас ежедневно с ними сталкивается независимо от того, что происходит в окружающей нас жизни.
Что такое кодирование и декодирование информации
«Код», «кодировка», «декодирование» — услышав такие слова, многие вспоминают фильмы про шпионские фильмы. Но оказывается всё перечисленное давно вошло в повседневную жизнь, и читая книгу или пользуясь компьютером человек кодирует и декодирует информацию постоянно, ничуть не задумываясь об этом.
Необходимость рассматриваемых процессов
Представим, что человек словесно передаёт какие-либо данные, становясь источником информации. Любой, кто услышит его получит нужные сведения. А если необходимо, чтобы «услышал» компьютер или нужно сохранить и передать данные дальше? Значит требуется так «переделать» речь или другие носители информации, чтобы можно было записать или закодировать, а при необходимости восстановить, то есть раскодировать их. Поэтому и разработаны различные алгоритмы для процедуры кодирования и декодирования передаваемой информации.
Основные термины и положения
Кодирование — представление информации в удобном виде для обработки, хранения, передачи.
Декодирование — обратный процесс, когда данные преобразуются обратно в вид понятный человеку.
Код — пакет условных символов, благодаря которым происходит перенос информации по установленным правилам.
Человечество с незапамятных времён решало проблемы обработки данных. Даже в первобытном строе нужно было как-то донести до своих сородичей различную информацию, например, указать место для охоты, рассказать о набеге соседей. Вначале для этого использовались рисунки, жесты, звуковые сигналы — всё это можно назвать «первобытным кодом». Получатель, видя знакомые жесты понимал о чём идёт речь, то есть декодировал сообщение.
С развитием общества стали появляться языки народов, письменность. Стало возможным записать речь используя алфавит. Буквы стали кодом с помощью которого хранилась и передавалась информация. Зная алфавит, можно прочитать текст, декодировав его. Языки народов мира называют «естественными языками кодирования».
В отличие от них существуют и формальные, которые были придуманы для удобства использования в различных отраслях жизнедеятельности человека. Математические знаки, ноты, дорожные указатели, морская азбука — примеры формальных языков. Написание компьютерных программ не обойдётся без многочисленных языков программирования, которые также являются формальными.
Виды и способы кодирования
Выбор вида кодировки определяется несколькими факторами: существующими возможностями, обстоятельствами, целями и вероятностью последующей обработки данных. Возможны 3 вида кодирования передаваемой информации документа:
Поясним на примерах. Одной из форм кодировки является стенография. Здесь условия или обстоятельства таковы, что необходимо быстро записывать речь оратора. Поэтому применяется специальный код. Используя его, стенографист может записать целое предложение несколькими буквами или знаками. Вот один из примеров стенограммы:
При математических расчётах удобно вести запись в виде чисел. Однако, если целью является точное написание итогового числа, то пишут прописью. Тогда случайно пропущенная цифра не станет причиной искажения информации. Так при решении задач в школе используют цифровую или числовую кодировку. Но в бухгалтерских отчётах или банковских выписках прописывают итоговую сумму буквами. Нужно заметить, что одна и та же информация была записана естественным и формальным языками. Переходы между ними также являются кодированием.
Если необходимо скрыть содержание документа от посторонних глаз, то применяется шифрование — один из видов кодирования. Здесь метод кодирования известен только источнику и получателю данных. Дешифровка сообщения возможна при наличии ключа — дополнительной информации, используемой в алгоритме дешифрования. Данным направлением кодирования занимается наука криптография.
Краткая история развития кодирования
Ещё во II веке до н.э. древнегреческий учёный Полибий использовал схему с двумя факелами для представления букв греческого алфавита.
В 18 веке Клод Шапп сконструировал семафор, где каждой букве соответствовала своя фигура. Скорость передачи такого устройства была низка: 2 слова в минуту.
Знаменитый телеграф и азбука Морзе. Поистине революционное изобретение XIX века. Благодаря трём простым символам: точка, тире и пауза удалось повысить скорость и надёжность кодирования. Система до сих пор используется в мореплавании.
Беспроводной телеграф или радио. В 1895 году Попов, чуть позже в 1897 Маркони сконструировали отдельно друг от друга радиоприёмник. Благодаря ему можно было использовать азбуку Морзе на больших расстояниях.
XX век стал прорывом в области кодирования и декодирования информации. Беспроводной телефон, телевидение и радиовещание, компьютерные и мобильные технологии — везде применяется кодирование и расшифровка данных.
Кодирование и декодирование данных различного вида
Ежедневно миллионы людей используют компьютеры, совершенно не задумываясь, как происходит ввод текста и его считывание. Вся информация воспринимается компьютером в цифровой, двоичной форме, где для кодирования используются только 2 символа: 0 и 1, которые называются битами. Нулю соответствует низкое напряжение, единице — высокое. 8 битов образуют 1 байт.
В современных технологиях используют несколько видов кодирования/декодирования информации. Мы приведем пример самых распространенных методов кодирования и декодирования информации, которые можно считать основными, поскольку видов очень много, например, кодирование звука, цвета, чисел, видео, графики, текста и т.д.
Числа и текст
Кодирование текста осуществляется при помощи таблиц ASCII и UNICODE. В них каждому символу, букве соответствует двоичный код в виде нулей и единиц. ASCII была изобретена раньше и содержит 256 букв и символов. Однако, из-за необходимости кодирования национальных алфавитов составили расширенную таблицу UNICODE. На рисунке представлена таблица ASCII:
Как видно из таблицы числа также кодируются в двоичный формат, арифметические действия с ними аналогичны десятичной системе. Конечно, итоговая запись весьма громоздка, но для вычислительной техники это не создаёт затруднений. Так, число 4 будет записано в виде 0110100, а 5 — 0110101. Число 45 будет содержать оба двоичных кода, но для вычислений оно будет преобразовано в восьмиразрядный двоичный код.
Графика
Для кодирования изображений используется большее количество байтов. Графическое представление бывает растровым и векторным.
Цифровое оборудование работает с отдельными, дискретными деталями. Поэтому при создании растрового изображения исходная картинка «дробится» вертикальными и горизонтальными линиями на маленькие прямоугольники — пиксели. Чем больше пикселей, тем лучше качество изображения.
Цвет каждого пикселя задаётся с помощью трёх цветов: красный, зелёный, синий. Такая система называется RGB, где R — красный (Red), G — зелёный (Green), B — синий (Blue). При смешивании основных цветов можно получить практически любой оттенок. Количество того или иного цвета в одном пикселе указывается в двоичном коде. Чем больше битов используется для цвета, тем разнообразнее цветовая палитра изображения, а значит и реалистичней картинка.
Векторная графика применяется в чертежах, когда используются готовые геометрические шаблоны: прямоугольник, квадрат, круг и другие. Работая с ней, нужно указать лишь местоположение объекта, размер и цвет, не нужно отдельно указывать цвет каждого пикселя. Векторное кодирование широко распространено в издательском деле и при дизайне печатной продукции.
Звуковая волна характеризуется двумя параметрами: амплитудой и частотой. Амплитуда отвечает за громкость звука, а частота — за высоту. Также звуковые колебания разбиваются на мелкие части и в таком виде обрабатываются в цифровом канале. Каждой такой части соответствует своя амплитуда, выраженная в двоичном коде. Чем больше деталей, то есть чем с большей частотой разбивается звуковая волна, тем качественней происходит кодирование звука.
При декодировании звуковая карта «собирает» все части воедино и подаёт аналоговый звук на динамики.
Числовая информация
Как уже было отмечено, числа кодируются путём перевода их в двоичное исчисление. Если же нужно преобразовать дробное число, то используется 80-разрядное шифрование. Минусами двоичного представления являются неудобство при использовании такого нагромождения битов и замедление обработки данных. Можно перевести двоичную систему в шестнадцатеричную, что облегчит работу с числами.
Модель С.Холла
Наука, изучающая строение и функционирование знаковых систем, которые отвечают за хранение и передачу информации, называется семиотика. Согласно ей при декодировании документа он имеет тот же смысл, что был заложен кодировщиком или источником при процедуре кодирования передаваемой информации. Т.е. подразумевается однозначность кодирования/декодирования (сообщение имеет единственное возможное толкование).
С.Холл внёс коррективы в такое представление:
Таким образом, первоначальный смысл может абсолютно отличаться от конечного, вследствие отличающегося восприятия у разных социальных групп. Получатели могут придать сообщению совсем иное направление (показано на рисунке пунктиром).
Кодирование и декодирование информации
Ищем педагогов в команду «Инфоурок»
Описание презентации по отдельным слайдам:
Кодирование и декодирование информации Задание 5 (базовый уровень, время – 2 мин) Всё есть число. Пифагор
Кодирование — это преобразование информации из одной ее формы представления в другую, наиболее удобную для её хранения, передачи или обработки. Кодирование и декодирование информации Декодирование — процесс восстановления изначальной формы представления информации, т. е. обратный процесс кодирования, при котором закодированное сообщение переводится на язык, понятный получателю. В более широком плане это: а) процесс придания определенного смысла полученным сигналам; б) процесс выявления первоначального замысла, исходной идеи отправителя, понимания смысла его сообщения.
В основе каждого текста лежит алфавит – конечное множество символов. В основе русского языка лежит алфавит, называемый кириллицей, состоящий из 33 строчных и 33 заглавных букв. В основе английского языка лежит латиница – алфавит, состоящий из 26 строчных и 26 заглавных букв. Пусть задан алфавит Т, содержащий m символов: Т=
. Алфавит При нажатии на клавиатурную клавишу компьютер получает сигнал в виде двоичного числа, расшифровку которого можно найти в кодовой таблице – внутреннем представлении знаков в ПК. Стандартом во всем мире считают таблицу ASCII. Для хранения одного символа двоичного кода электронно-вычислительная машина выделяет 1 байт, то есть 8 бит. Эта ячейка может принимать только два значения: 0 и 1. Получается, что один байт позволяет зашифровать 256 разных символов, ведь именно такое количество комбинаций можно составить. Эти сочетания и являются ключевой частью таблицы ASCII.
. Алфавит Половина таблицы стандартов ASCII содержит коды цифр, управляющих символов и латинских букв. Другая ее часть заполняется национальными знаками, псевдографическими знаками и символами, которые не имеют отношения к математике. Код ASCII, в котором каждый символ алфавита кодировался словом из 8 бит (одним байтом). В этом алфавите 28=256 символов. Совершенно ясно, что в различных странах эта часть таблицы будет отличаться. Цифры при вводе также преобразовываются в двоичную систему вычисления согласно стандартной сводке. В двоичной системе счисления, которую активно используют компьютеры, встречаются лишь две цифры – 0 и 1. ASCII UNICODE
. Алфавит Половина таблицы стандартов ASCII содержит коды цифр, управляющих символов и латинских букв. Другая ее часть заполняется национальными знаками, псевдографическими знаками и символами, которые не имеют отношения к математике. Код ASCII, в котором каждый символ алфавита кодировался словом из 8 бит (одним байтом). В этом алфавите 28=256 символов. Совершенно ясно, что в различных странах эта часть таблицы будет отличаться. Цифры при вводе также преобразовываются в двоичную систему вычисления согласно стандартной сводке. В двоичной системе счисления, которую активно используют компьютеры, встречаются лишь две цифры – 0 и 1. Долгое время при работе с текстами, сохраняемыми в компьютере, используется код ASCII. Такой алфавит, содержащий 256 различных символов, мог включать латиницу и кириллицу, цифры, знаки операций, знаки препинания, скобки и другие символы. Но все-таки этого алфавита недостаточно, чтобы можно было хранить в памяти компьютера тексты на любых естественных языках. Сегодня для хранения текстов используется кодировка из 2-х байтов, называемая UNICODE кодировкой, позволяющая словами из 16 битов кодировать алфавит, содержащий 216=65536 символов. ASCII UNICODE
Пример. Пусть у нас есть алфавит из 3-х символов – А, М, П. Введем следующую кодировку: А-0, М-1, П-10. Рассмотрим закодированный текст: 1010. Этому тексту соответствует два слова – МАМА и ПП. Как видите, введенная кодировка не обеспечивает однозначное кодирование. Неоднозначное кодирование Если при кодирование выполняется условие Фано, то декодирование однозначно.
Условие Фано: никакое кодовое слово не совпадает с началом другого кодового слова. Коды, для которых выполняется условие Фано, называют префиксными (префикс слова — это его начальный фрагмент). Все сообщения, закодированные с помощью префиксных кодов, декодируются однозначно. Префиксные коды имеют важное практическое значение — они позволяют декодировать символы полученного сообщение по мере его получения, не дожидаясь, пока всё сообщение будет доставлено получателю. Условие Фано