H.264

18.01.2017

H.264, MPEG-4 Part 10 или AVC (Advanced Video Coding) — лицензируемый стандарт сжатия видео, предназначенный для достижения повышенной степени сжатия видеопотока при сохранении высокого качества.

H.264/MPEG-4/AVC

Стандарт H.264 создан ITU-T Video Coding Experts Group (VCEG) совместно с ISO / IEC Moving Picture Experts Group (MPEG) в рамках совместной программы Joint Video Team (JVT).
Стандарты ITU-T H.264 и ISO/IEC MPEG-4 Part 10 (формальное название — ISO/IEC 14496-10) технически полностью идентичны. Финальный черновой вариант первой версии стандарта был закончен в мае 2003 года.

H.264 – это открытый лицензированный стандарт с поддержкой самых эффективных на сегодняшний день технологий сжатия видеоизображения. Кодер H.264 без ущерба для качества изображения может снижать размер файла цифрового видео более чем на 80% по сравнению с форматом Motion JPEG и на 50% - по сравнению со стандартом MPEG-4 Part 2. Что означает гораздо меньшие требования к полосе пропускания для передачи и объему памяти для хранения видеофайлов. Или возможность получения гораздо лучшего качества видеоизображения при той же скорости передачи данных.

В отрасли видеонаблюдения H.264, широко применяется там, где требуется высокая частота кадров и высокое разрешение, например, в охранном видеонаблюдении на автомагистралях, в аэропортах и казино - там, где нормой является использование частоты 30/25 кадров в секунду. Наибольшая экономия достигнута за счет снижения требований к ширине полосы пропускания и объёму свободного пространства для хранения данных.

Можно предположить, что стандарт H.264 ускорит переход на мегaпикcельные камеры, поскольку высокоэффективная технология сжатия поможет снизить огромные размеры файлов и скорость их передачи без ущерба для качества изображения. Есть и сопутствующие требования. Хотя H.264 и обеспечивает экономию расходов на ширину пропускного каналам сети и объёмы свободного пространства для хранения данных, этот стандарт требует наличия сетевых камер и станций наблюдения c более высокими техническими характеристиками.

Как происходит сжатие видеоизображения.

Сжатие видеоизображения – это сокращение и удаление избыточных видеоданных с целью оптимизации хранения и передачи файлов цифрового видео. В ходе этого процесса исходный видеосигнал обрабатывается с помощью алгоритма для создания сжатого файла, готового к передаче и хранению. Для воспроизведения сжатого файла применяется инверсный алгоритм, который фактически дает то же самое видеоизображение, что и оригинальный источник видеосигнала. Время требуемое для сжатия, отправки, распаковки и отображения файла, называется задержкой. При одинаковой вычислительной мощности – чем более сложен алгоритм сжатия, тем выше задержка.

Совместная работа пары алгоритмов называется видеокодеком (кодер/декодер). Видеокодеки, применяющие разные стандарты, как правило, несовместимы друг с другом, поэтому видеоданные, сжатые с использованием одного стандарта, нельзя распаковать с применением другого стандарта. К примеру, декодер MPEG-4 Part 2 не будет работать с кодером H.264. Причиной этому является тот факт, что один алгоритм не может корректно декодировать результат, полученный с помощью работы другого алгоритма, однако есть возможность оснастить множеством разных алгоритмов программное или аппаратное обеспечение, чтобы оно могло производить сжатие разных форматов. В различных стандартах сжатия видеоизображения применяются различные методы сокращения размера данных, и, таким образом, результаты отличаются по скорости передачи данных, качеству и уровню задержки. Результаты сжатия могут различаться и у кодеров, использующих один и тот же стандарт, поскольку разработчик кодера волен выбирать, какие именно наборы средств, определенных стандартом, в нем задействовать. До тех пор пока результат на выходе кодера соответствует формату и декодеру стандарта, возможны различные методы его реализации. Это выгодно, поскольку различные методы реализации имеют разные цели и разный бюджет.

Профессиональные программные кодеры для работы с оптическими носителями не в режиме реального времени должны иметь возможность обеспечивать лучшее кодированное видеоизображение по сравнению с аппаратными кодерами для проведения видеоконференций в режиме реального времени, встроенными в портативные устройства. Таким образом, определенный стандарт не может гарантировать определенную скорость передачи данных или ее качество. Более того, функционирование одного стандарта нельзя корректно сравнивать с другими стандартами или даже с различными методами реализации этого же стандарта без предварительного определения конкретного метода реализации. Декодер же, в отличие от кодера, должен реализовывать в себе все необходимые элементы стандарта с тем, чтобы декодировать соответствующий поток битов. Поэтому стандарт четко указывает, как именно алгоритм распаковки должен восстанавливать каждый бит сжатого видеоизображения.

Пpoфили и уpoвни H.264

Разработчики, участвующие в определении стандарта H.264, сосредоточили свое основное внимание на создании простого и ясного решения, сводящего к минимуму количество опций и параметров. Важнейшим аспектом данного стандарта, как и в случае с другими видеостандартами, является предоставление различных возможностей в рамках профилей (наборов алгоритмических параметров) и уровней (классов функционирования) для оптимальной поддержки популярных продуктов и распространенных форматов.

В H.264 заложено семь профилей, каждый из которых рассчитан на конкретную область применения. Каждый профиль определяет, какой именно набор параметров может использовать кодер, и ограничивает сложность реализации декодера. 

Сетевые камеры и видеокодеры, используют так называемый базовый профиль, рассчитанный на применение в областях с ограниченными вычислительными мощностями. Базовый профиль наиболее подходит для применения в современных кодерах режима реального времени, встроенных в сетевое видеооборудование. Этот профиль также обеспечивает низкий уровень задержки, что является важным требованием для охранного видеонаблюдения.

H.264 имеет 11 уровней или степеней ограничения требований к функциональности, пропускному каналу и памяти. Каждый уровень определяет скорость передачи данных и скорость кодирования в макроблоках в секунду для разрешений в диапазоне от QCIF до HDTV и выше. Чем выше разрешение, тем выше требуемый уровень.

Иcпoльзoвaние кaдpoв.

В зависимости от профиля H.264, кодером могу использоваться различные типы кадров:

  • I-кадр (или вводный кадр) – это изолированный кадр, который может декодироваться независимым образом без привязки к любым другим изображениям. Первое изображение в видеопоследовательности всегда является I-кадром. I-кадры необходимы в качестве начальных точек для новых просмотров или точек повторной синхронизации в случае нарушения переданного потока битов. I-кадры можно использовать для реализации функций перемотки вперед, назад и иных функций произвольного доступа. Кодер автоматически вставляет I-кадры через равные промежутки времени или по требованию в случае, когда ожидается присоединение новых клиентов к просмотру потока. Недостатком I-кадров является чрезмерное количество составляющих их бит, но они и не создают большого количества искажений.
  • P-кадр - расшифровывается как промежуточный кадр предсказуемого характера, содержит ссылки для своего кодирования на части предшествующих I-кадров и/или P-кадров. P-кадры требуют меньшее количество бит чем I-кадры, но  они очень уязвимы по отношению к ошибкам передачи из-за своей сложной зависимости от предшествующих ссылочных P- и I-кадров.
  • B-кадр (или промежуточный кадр двунаправленного предсказания) – это кадр, содержащий в себе ссылки и на предыдущий, и на последующий ссылочные кадры.

 Эффективность H.264

Стандарт H.264 ввёл новую передовую схему внутреннего предсказания при кодировании I-кадров. Данная схема может значительно сократить размер (в битах) I-кадра при сохранении высокого качества - с помощью успешного предсказания маленьких блоков пикселей в рамках макроблока внутри кадра. Это происходит посредством попытки найти совпадающие пиксели среди ранее закодированных пикселей, которые ограничивают новый пиксельный блок 4x4 для внутреннего кодирования. Путем повторного использования уже закодированных пиксельных значений можно значительно сократить размер данных в битах. Новое внутреннее предсказание – это ключевой элемент технологии H.264, уже доказавший свою высокую эффективность. Для сравнения: даже если в потоке H.264 использовать только I-кадры, размер получившегося файла будет гораздо меньшим, чем для потока Motion JPEG, в котором используются только I-кадры.

Другой особенностью формата H.264, отсутствующей в стандарте MPEG-4, является возможность применения фильтров блочных артефактов. Такие фильтры могут сглаживать артефакты, возникающие при сильном сжатии. Это позволяет проектировать системы с более высокой степенью сжатия, одновременно сохраняя и более высокую детализацию изображений.

Вернуться в раздел.

Вернуться на Главную.

Спасибо, мы свяжемся с вами в ближайщее время!