Цветовая субдискретизация что это
Битность цвета и цветовая субдискретизация. Видеоурок
Современный видеооператор или видеограф, если угодно, — должен быть не только человеком творческим, но и технически грамотным. Сегодня ему нужны знания не только, например, в области построения кадра или экспонирования, но и знания о способах формирования и кодирования цифрового видеосигнала. Ведь от этого напрямую зависит качество материала, который вы после съемки отдадите монтажеру и цветокорректору и, в конечном итоге, качество того, что увидит зритель.
Сегодня речь пойдет о понятиях битности цвета и цветовой субдискретизации.
Некоторые камеры могут снимать видео с 10 битами на канал цветности. В этом случае мы получим 1024 оттенка на каждый из каналов цветности. Такое количество градаций человеческий глаз уже не способен различить, поэтому переход в градиентах любой плавности не будет заметен. Цифровые кинокамеры способны снимать материал с 12, 14 и даже 16-битным цветом — все это нужно для последующей постобработки.
Немного сложнее с цветовой субдискретизацией. Если вы поинтересуетесь техническими характеристиками камеры, на которую снимаете видео, то можете прочитать что-то вроде: Y’CbCr 4:2:0 или Chroma Sub-Sampling 4:2:2.
Некоторые догадываются, что 4:2:2 лучше, чем 4:2:0, а вот в чем разница знают немногие. Метод субдискретизации цвета основан на том, что человеческий глаз гораздо более чувствителен к яркости, чем к цвету. Поэтому при компрессии видеосигнала количество информации о цвете меньше, чем количество информации о яркости. Не будем лезть в математику процесса, перейдем к сути.
Первая цифра в этой системе значений – всегда «4» и она говорит нам о том, что разрешение в канале яркости полное, то есть уменьшения детализации нет. Следующие две цифры – это число выборок цветоразностных сигналов, можно не запоминать эту формулировку – означают они следующее: если после «4» стоят цифры 2:0 – это значит, что информации о цвете в 2 раза меньше и по горизонтали и по вертикали, то есть, при разрешении UHD 3840х2160 пикселей, разрешение в канале цвета составит 1920х1080 точек. Если после «4» стоят цифры 2:2, то при UHD разрешении 3840х2160 пикселей, разрешение в канале цвета составит 1920х2160 точек, то есть уменьшено в 2 раза только по горизонтали.
Таким образом, при выборке 4:2:2 разрешение канала цвета в 2 раза меньше, чем в канале яркости, а при выборке 4:2:0 информации о цвете уже в 4 раза меньше, чем в канале яркости.
Все что я вам сейчас рассказал, касается только камер снимающих сразу в компрессированные форматы, в других сферах видео и кинопроизводства могут использоваться и другие значения, например 4:4:4:4, где последняя цифра несет информацию о наличии альфа-канала.
Надеюсь, мы не слишком загрузили вас сложной информацией, следующие уроки будут посвящены практической составляющей процесса съёмки.
Цветовая субдискретизация
На практике кодирование изображений осуществляется уменьшением разрешения в цветоразностных каналах при сохранении разрешения в канале яркости.
Содержание
История
Введение
При передаче таких сигналов, возможно восстановление исходных составляющих цветов: красной (R), синей (B) и зеленой (G), которые используются в большинстве систем отображения видеоинформации.
При Y’, Cr, Cb представлении видеосигнала цветоразностные компоненты Cr, Cb передаются с пространственным разрешением, в два раза меньшим разрешения по яркостному сигналу, при этом частота дискретизации для яркостного сигнала Y’ устанавливается равной 13,5 МГц, что в два раза больше, чем для цветоразностных сигналов Cr и Cb — 6,75 МГц. Для цифровых стандартов принято базовое значение частоты дискретизации равное 3,375 МГц, таким образом, частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2.
Для сигналов ТВЧ согласно части II Рекомендации ITU-R 709-3 установлены частоты дискретизации сигналов яркости 74,25 МГц и цветности 37,125 МГц.
Форматы субдискретизации
Структура дискретизации сигнала обозначается как соотношение между тремя частями X:a:b (например, 4:2:2), описывающими число выборок яркостных и цветоразностных сигналов. Также иногда используется обозначение с четырьмя частями (4:2:2:4), где четвёртая цифра, если она включена, должна быть идентична первой цифре, указывающая на наличие сигнала четвертого канала, содержащего информацию прозрачности (альфа-канал). Этими частями являются:
8:4:4 Y’CbCr
Каждая из цветоразностных компонент Cb и Cr имеют одинаковую частоту дискретизации. Компонента яркости имеет в два раза большее разрешение. Эта система используется сканерами киноплёнки высокого уровня, устройствами телекино.
4:4:4 Y’CbCr
4:4:4 R’G’B’ (без субдискретизации)
Стоит отметить, что под «4:4:4» может пониматься цветовое пространство R’G’B’, которое вовсе не имеет цветовой субдискретизации. Видеоформаты, такие как HDCAM SR, могут записывать цифровой видеосигнал с частотой выборки 4:4:4 R’G’B’ посредством двухканального HD-SDI.
Используется в научных исследованиях, профессиональных системах и формате MPEG-2. Рекомендация 601 определяет стандарт полного цифрового видеосигнала с соотношением частот дискретизации яркостного и цветоразностных сигналов как 4:2:2. В каждой строке передается полный сигнал яркости, а для цветоразностных сигналов производится выборка каждого второго отсчета. Таким образом цветовое горизонтальное разрешение снижается вдвое.
Этот режим также определен технически. Используется в ограниченном наборе аппаратных и программных кодеров.
В соотношении 4:1:1, горизонтальное разрешение цветоразностных сигналов снижается до четверти от полного разрешения сигнала яркости, также пропускная способность уменьшается в два раза по сравнению с режимом без субдискретизации. Первоначально, 4:1:1 применялся в формате DV, который не считался вещательным и был единственным приемлемым форматом видеозаписи для низкобюджетных и потребительских приложений. В настоящее время, DV-формат (с выборкой 4:1:1) используется профессионально для производства новостей и воспроизведения видео при помощи серверов.
В системе NTSC, если частота дискретизации яркости равна 13,5 МГц, то это означает, что каждый из сигналов Cr и Cb будет дискретизован с частотой 3,375 МГц, что соответствует максимальной пропускной способности частоты Найквиста 1,6875 МГц, в то время как традиционный «NTSC кодер высокого класса аналогового вещания» будет иметь частоту Найквиста 1,5 МГц и 0,5 МГц для I/Q каналов. Однако в большинстве единиц оборудования, особенно в дешевых телевизорах и VHS / Betamax видеомагнитофонах, каналы цветности имеют пропускную способность только 0,5 МГц для Cr и Cb (что эквивалентно для I/Q). Таким образом, система фактически обеспечивает увеличенную пропускную способность цвета по сравнению с лучшими композитными аналоговыми спецификациями для NTSC, несмотря на то, что используется только 1/4 от полной полосы частот цветовой составляющей «полного» цифрового сигнала. Форматы, которые используют 4:1:1, включают в себя:
Различные варианты 4:2:0 конфигураций можно найти в:
Для цветоразностных компонентов Cb и Cr при дискретизации отбрасывается каждый второй отсчёт по горизонтали и по вертикали. Есть три варианта схем 4:2:0, имеющих различные горизонтальные и вертикальные размещения отсчётов:
Этот вид обработки данных особенно хорошо подходит для цветных систем PAL и SECAM. Большинство цифровых видео форматов PAL используют соответственно 4:2:0, за исключением DVCPRO25, который использует 4:1:1. Оба варианта 4:1:1 и 4:2:0 вдвое сокращают пропускную способность по сравнению с представлением без субдискретизации.
Поддерживается некоторыми кодеками, но используется не слишком широко. При этом соотношении коэффициентов используется половина вертикального и четверть горизонтального цветового разрешения, и лишь одна восьмая часть полосы пропускания максимальной цветового разрешения.
Терминология
Термин Y’UV относится к аналоговой схеме кодирования, в то время как Y’CbCr ссылается на цифровые схемы кодирования. Одно из различий между ними в том, что набор коэффициентов компонентов цветности U, V и Cb, Cr различен. Однако термин YUV часто используется ошибочно, обращаясь к кодировке Y’CbCr. Следовательно, выражения типа «4:2:2 YUV» всегда относятся к 4:2:2 Y’CbCr, так как просто нет такого понятия, как 4:x:x в аналоговой кодировке (например, YUV).
Также термином яркость и символом Y часто пользуются ошибочно, обращаясь к яркости, которая обозначается символом Y’. Обратите внимание, что яркость (Y’), принятая у видео инженеров отклоняется от яркости (Y) в колориметрии (как определено в CIE ). Яркость (в ТВ) формируется как взвешенная сумма компонентов RGB с гамма-коррекцией (трехцветной). Яркость формируется как взвешенная сумма линейных (трехцветной) компонентов RGB.
На практике, CIE символ Y часто неправильно используется для обозначения яркости. В 1993 году SMPTE принятое Руководство для инженеров EG 28, уточняет два термина. Обратите внимание, что главным символом ‘ используется, чтобы указать гамма-коррекцию.
Кроме того, понятие хрома/цветность у видео инженеров отличается от цветности в колориметрии. Хрома/цветность в видео-инженерной практике формируется из весовых компонентов трехцветной, нелинейных компонентов. Условия цветность и насыщенность часто используются как синонимы для обозначения цветности.
Видеоформаты
Следующая таблица показывает характеристики большинства видеоформатов и типов применяемой субдискретизации цветоразностных компонент, а также другие связанные с ними параметры, такие как скорость передачи данных и степень сжатия.
Избранные статьи
Статьи раздела
Обсуждаемые статьи
PaulPhoenix 9 января 2020, 08:39
feste 2 декабря 2019, 20:37
PaulPhoenix 18 ноября 2019, 21:34
PaulPhoenix 27 сентября 2019, 15:34
PaulPhoenix 16 декабря 2018, 23:29
Последние темы форума
perfect 24 августа 2019, 09:50
perfect 24 августа 2019, 09:49
perfect 24 августа 2019, 09:48
perfect 24 августа 2019, 09:47
perfect 24 августа 2019, 09:41
Цветовая субдискретизация понятным языком – немного отдаем, чтобы много выиграть
Автор: Michael J. McNamra, ProjectorCentral.com, 19 марта 2019
Вы когда-нибудь наблюдали сброс кадров или подзависания картинки во время воспроизведения фильмов в Full HD или 4K форматах с компьютера, медиасервера, или при трансляции потокового видео через интернет? Если да, то добро пожаловать в клуб! Это вполне обычные проблемы, связанные с пропускной способностью канала, которые, как правило, можно решить обновлением компьютера, интернет-службы, кабелей HDMI, или всех трех компонентов сразу.
Примечание ProjectorWorld: может быть проще понять данный термин, если вернуться к оригинальному английскому слову «subsampling». Если «Sampling» значит «брать замеры» — например параметры каждого пикселя, то с добавлением приставки «sub-» («под-») мы, стало быть, берем замеры не с каждого пикселя, а с некого их «подмножества». «Subsample» — это «выборка из выборки».
Однако, если бы не повсеместное использование цветовой субдискретизации и различных алгоритмов сжатия данных для хранения видео-данных на ваших Blu-ray и DVD-дисках, жестких дисках и серверах служб интернет-вещания, то проблема эта была бы куда более существенной и труднорешаемой. Все потому, что обе технологии работают сообща, существенно уменьшая требуемую пропускную способность канала и вычислительные мощности, необходимые для отображения видео в высоком разрешении и с частотой кадров 24, 30, 60, и даже 120 кадров в секунду. Без этих технологий лишь самые быстрые компьютеры и графические карты были бы в состоянии обработать и отобразить эти сотни мегабайт-в-секунду видео-данных, генерируемых фильмом в качестве 4K UHD HDR, при этом не сбрасывая кадры и без зависания картинки. К тому же, невероятно большой размер файлов, который потребовался бы для несжатых фильмов в Full HD и 4K, добавил бы много дополнительных часов или даже дней к времени их скачивания у служб потокового вещания; к тому же они бы быстро заполнили все дисковое пространство вашего ПК или медиасервера. Даже если ваше оборудование и интернет-подключение были бы в состоянии справиться с несжатым 4K-контентом, вам бы потребовались топовые кабели HDMI 2.1 и соответствующие интерфейсы у отображающего устройства, чтобы «пропихивать» несжатые видео-данные от плеера к устройству.
Цветовая субдискретизация использовалась с начала эпохи аналогового цветного телевидения, позволяя по узкой полосе пропускания, выделенной для каждого телеканала, одновременно передать черно-белое и цветное изображение, тем самым обеспечивая обратную совместимость с существующими черно-белыми телевизорами. Используемый в области аналогового сигнала термин «Y’UV» относится цветовой модели с субдискретизированным цветом, в которой подканал Y’ содержит нелинейный яркостный сингал* (информацию о яркости, соответствующую воспринимаемым яркости и детализации; в основном данные о яркости берутся из зеленого сигнала), тогда как субканалы U и V содержат цветовой компонент сигнала — красный и синий. Данная модель используется во всем мире для телевещания. Другая аналоговая модель, Y’PbPr, используется в основном для передачи компонентного видео по трем кабелям. В этой модели канал Y’ тоже содержит информацию о яркости (она же содержит основную часть данных, относящихся к цветности и детализации зеленого), тогда как каналы Pb и Pr содержат компонент цветовых данных «Синий минус яркость (Y)» и «Красный минус яркость»). Использование отдельного компонента сигнала для передачи информации о яркости в сочетании с двумя сигналами цветовых различий привело к экономии требуемой ширины канала по сравнению с аналоговым R, G, B сигналом, где каждый канал содержит собственный компонент яркости.
* Нелинейный сигнал, обозначаемый апострофом, означает, что к сигналу применена гамма-коррекция (прим. ProjectorWorld.ru)
Аналоговая модель Y’PbPr ближе соответствует современным цифровым моделям YCbCr и Y’Cb’Cr’ (яркость, цвет: синий; цвет: красный). Как и в аналоговых моделях, условный знак в виде апострофа означает, что изначальные значения для Красного, Зеленого и Синего пикселя, которые были получены камерой или сгенерированы в графическом приложении, были «субдискретизированы» нелинейным способом, который лучше учитывает различную чувствительность человеческого глаза к цветам и различным уровням яркости. Благодаря пониманию принципов работы глаза был сделан вывод, что именно данные о яркости являются наиболее важным компонентом, необходимым для того, чтобы видеть и различать объекты. При этом часть данных о цвете можно опустить без особого ущерба, в результате чего получаем сжатый сигнал, который экономит дисковое пространство и который проще передавать.
В данной статье мы сосредоточимся на трех наиболее широко используемых уровнях цветовой субдискретизации, которые можно обнаружить в рамках модели Y’Cb’Cr’. Эти уровни обычно выражаются в виде тройного отношения, которое соответствует значениям Y’:C’b:C’r. Если вы истинный видеофил, то наверняка встречались с этими «4:4:4», «4:2:2» и «4:2:0». Такие отношения сообщают нам, примерно следующее: «4 доли яркости к 2-м долям цвета (синего) к 2-м долям цвета (красного).» Отношение 4:4:4 используется для описания «недискретизированных» данных R, G, B. Это означает, что в сигнале равные доли выделены на яркость, цветность синего и цветность красного. «4:4:4» полностью соответствует сигналу RGB, как показано на рисунке выше.
Высчитываем Y’C’bC’r: Таблица взята из описания стандарта BT.2100 и описывает, как значения Y’C’bC’r высчитываются из изначальных значений R’, G’ и B’, записанных камерой или созданных в графическом приложении. Обратите внимание, что яркостный компонент Y’ содержит преимущественно данные, полученные на основании зеленого канала цветности G’ и практически без участия данных из B’.
Алгоритмы цветовой субдискретизации были созданы чтобы использовать на практике более высокую чувствительность человеческого глаза к оттенкам зеленой части цветового спектра, чем к красной и синей. (Возможно, это результат долгой эволюции человеческого вида в окружении зеленых растений и лесов?) По этой причине яркостный компонент Y’ (см. таблицу выше) и содержит преимущественно данные, которые были получены из зеленого канала. По этой же причине зеленый канал в большинстве цифровых фотографий содержит больше полезных данных, на основании которых можно превратить цветную фотографию в черно-белую (см. фото ниже). Если вы снизите насыщенность цветов на телевизоре или проекторе, то полученные черно-белые изображения на экране будут созданы почти полностью из данных по яркостному каналу, в котором примерно 70% зеленого, 25% красного и лишь 5% синего. В связи с таким «перекосом» нашего зрения в сторону зеленого цвета, цветовая субдискретизация позволяет уменьшить объем информации по цветности, содержащейся в красном и синем каналах, экономя вплоть до 30% трафика (при использовании уровня сжатия 4:2:2) без заметной для большинства зрителей разницы в детализации, цвете или контрастности изображения.
Зеленый канал в большинстве цифровых фотографий вносит больший вклад в черно-белое изображение, чем красный или синий.
Сам по себе метод цветовой субдискретизации позволяет снизить размер файла и требования к полосе пропускания на 30-50% по сравнению с изначальным R, G, B форматом, не приводя при этом к значимой деградации качества изображения. Высший уровень качества 4:2:2 является практически «lossless-сжатием» (без потери качества), зачастую применяемым к изначальному видеоматериалу до монтажа и цветокоррекции, позволяя ускорить процесс редактирования и обработки. Запись у большинства полупрофессиональных видеокамер осуществляется именно в этом формате. В области профессионального кинопроизводства цветовая субдискретизация применяется лишь после того, как несжатый (4:4:4) RGB видеоряд смонтирован и сохранен в качестве мастер-копии. Затем, после цветовой субдискретизации, следует применение общего алгоритма сжатия, который может включать MJPEG, AVC, либо HEVC, каждый из которых потребует меньше вычислительных мощностей и времени для сжатия видео в 4:2:2, чем 4:4:4. Взятые вместе, эти различные методы сжатия данных способны уменьшить размер видеофайла в 5-20 раз, так и не достигнув уровня, при котором качество изображения станет неприемлемым.
Как работает цветовая субдискретизация?
4:2:2. Формат 4:2:2 считается навысшим уровнем субдискретизации и сохраняет всю информацию по каналу яркости Y’. (Все прочие описываемые нами уровни также сохраняют полную информацию по яркости, и лишь несколько записывающих устройств субдискретизируют яркостный канал до уровня 3 или 2). А вот значения C’b и C’r берутся в два раза реже по горизонтали, чем параметр яркости, и в итоге каждый второй пиксель в каждой строке массива пикселей хранится без данных C’b и C’r, экономя около 30% ширины канала и дискового пространства. Когда эти видеоданные открываются компьютерной программой, медиаплеером или способным напрямую обрабатывать видео в 4:2:2 устройством отображения, то сперва все доступные данные восстанавливаются в несжатом виде, а затем недостающие ячейки с данными C’b и C’r заполняются данными из соседних по горизонтали пикселей (это также называется интерполяцией).
При субдискретизации 4:2:0 яркостный компонент остается нетронутым, а для улучшения качества изображения, данные о цветовых компонентах могут содержать некую смесь из выброшенных данных.
4:2:0. Теперь все становится чуть запутаннее. При уровне субдискретизации 4:2:0, яркостному каналу все еще позволяется сохраняться в нетронутом виде, но C’b и C’r берутся в два раза реже – не только по вертикали, но и по горизонтали, что дает экономию полосы пропускания и места для хранения порядка 50%. Однако, для улучшения качества, данные, хранящиеся для каждого из оставшихся пикселей могут содержать «смесь» из выброшенных данных (см. рисунок). При этом используются два алгоритма. В итоге, при восстановлении исходного изображения видеоплеером, получается меньше артефактов, более плавные переходы между краями линий в изображении и более тонкие детали, чем если бы просто сохранялась цветность для одного пикселя из четырех (без «смешения» с соседними). Безусловно, более плавные края линий означают, что текст на контрастирующем фоне может выглядеть смазано или нечетко, но данный артефакт изображения также может быть виден при сравнении на компьютерном мониторе с его четким изображением форматов 4:2:2 и 4:4:4.
Заключительное слово по цветовой субдискретизации
Происходит ли заметно большее ухудшение качества изображение при использовании метода 4:2:0 по сравнению с 4:2:2, если наша цель — просмотр кинофильмов? Большинство зрителей, просмотревших любое количество Blu-ray дисков в 4K UHD (SDR и HDR) не согласятся с этим. Все потому, что формат цветовой субдискретизации 4:2:0 является неотъемлемой частью стандарта 4K UHD Blu-ray (наряду с невероятно эффективным общим алгоритмом сжатия HEVC) и используется для хранения практически всех фильмов, которые вы можете посмотреть с помощью сервисов кабельного ТВ или широкополосного интернет-вещания. Перед тем, как начать воспроизведение, обычный UHD Blu-ray 4K плеер проверяет информацию HDMI EDID, которая хранится в проекторе или другом устройстве, чтобы определить, способно ли оно напрямую работать с видео в формате 4:2:2. Большинство устройств способны работать с видео в 4:2:0 или 4:2:2, поэтому плеер сперва преобразует данные с диска в формат 4:2:2 перед тем, как отправлять их на экран. Если устройство отображения не совместимо с 4:2:2, то плеер может отправить на него данные в 4:2:0 или же преобразовать их в 4:4:4 перед отправкой на устройство.
Опираясь на эти крохи информации, большинство UHD Blu-ray плееров оказываются в состоянии отобразить видео даже в чуть лучшем качестве и с большей точностью цветов чем то, что вы можете получить с 4K UHD Blu-ray диска! Все что нужно – это 4K-видеокамера или цифровая зеркалка, либо графическое приложение, позволяющее записывать видео с глубиной цвета 10-12 бит на пиксель с использованием субдискретизации 4:2:2 (не 4:2:0) или даже 4:4:4. Отредактировав такие видеоролики и сохранив их в формате, таком как Apple ProRes 4:2:2, а затем сжав с использованием 10-битного HEVC, их после этого можно записать на USB 3.0 жесткий диск и подключить его к соответствующему разъему Blu-ray плеера, либо даже напрямую подключить этот диск к USB 3.0 разъему проектора или телевизора (если имеется). Поскольку плееру или отображающему устройству не приходится преобразовывать 4:2:0 в 4:2:2, то в тонких цветовых переходах должно сохраниться больше оттенков.
В любом случае, факт остается фактом: сжатие данных и цветовая субдискретизация в том или ином виде необходимы для того, чтобы позволить современным плеерам и отображающим устройствам справляться с видео в 4K-разрешении – и вы можете быть уверены, что эти технологии обретут еще большую значимость, когда широкого распространения достигнет 8K-контент и соответствующие отображающие устройства; особенно – учитывая ограничения по дисковым хранилищам и пропускной способности каналов широкополосного вещания. К счастью, в связи с большей плотностью пикселей у 8K-контента и дисплеев, видео в форматах 4:2:0 и 4:2:2 будет смотреться даже лучше чем сейчас, даже при отображения резкого текста на контрастирующем фоне.
Майкл Макнамара – бывший ответственный редактор технологического раздела журнала «Popular Photography» и признанный эксперт в таких областях, как оцифровка, хранение и технологии отображения. Он был удостоен ряда наград как фотограф и оператор и он также является владельцем In-Depth Focus Labs в Хопвелл Джанкшен, штат Нью Йорк.