Download - Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания
![Page 1: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/1.jpg)
Дипломная работа на тему: «Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для
потокового вещания»
Руководитель: Крапивенко А.В.Дипломник 08-606: Инеев Д.Н.
МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ(национальный исследовательский университет)
![Page 2: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/2.jpg)
О чем вообще речь?
• Потоковое вещание видео – это непрерывная передача и отображении пользователю цифрового видео от источника потокового вещания.
• Видекодек - программа или алгоритм для сжатия и восстановления видеоданных.
![Page 3: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/3.jpg)
Особенности потокового видео
• Потоковое видео не имеет размера• Качество отображения зависит от
пропускной способности сети вещания• Восприятие видео зависит от величины
сетевой задержки
![Page 4: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/4.jpg)
Реакция на время отклика
• Границы времени отклика по Я. Нильсену:o 0.1 секунды – система отвечает мгновенноo 1 секунда – задержка становится заметнойo 10 секунд – предел внимания пользователяo > 10 секунд – полная потеря внимания
![Page 5: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/5.jpg)
Задержки в потоковом вещании
• Основные причины задержек следующие:– Низкая скорость кодирования/декодирования– Большой размер кодированных кадров– Удалённость сервера вещания– Помехи в сети передачи данных
![Page 6: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/6.jpg)
Почему H.265 (HEVC)?
• Стандарт находится в свободном доступе• H.264, предыдущий стандарт от тех же
авторов – широко распространен• Заявленная цель «уменьшение битовой
скорости на 50%» уже выполняется• Активно развивается, как сам стандарт, так
и его программные реализации
![Page 7: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/7.jpg)
Почему только часть?
• Написание кодека – очень трудоемкая задача
![Page 8: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/8.jpg)
Внутрикадровое предсказание• Кодер формирует предсказание для
X на основе A, B, C• К примеру, P(X) = (2A + B + C)/4 • Затем вычитает P(X) из X и кодирует
полученную разность.• Декодер вычисляет P(X) и прибавляет
к декодированной разности, тем самым получая X
• Для сжатия с потерями вместо A, B, C используется соответствующие A’,B’,C’, уже спрогнозированные
![Page 9: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/9.jpg)
HEVC: разбиение на блоки
• Всё изображение разбивается на крупные блоки кодового дерева размером 64x64
• Каждый из этих блоков может рекурсивно разбиваться на более мелкие вплоть до размеров 8x8
![Page 10: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/10.jpg)
HEVC: режимы интрапредсказания
• Всего 35 режимов:– 33 направленных– 1 DC– 1 Planar
• Среди них нужно выбрать лучший
![Page 11: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/11.jpg)
RD-стоимость
• RD-стоимость – мера вносимых искажений при заданной битовой скорости
• Jm = Dm + λRm
• Jm – RD-стоимость режима m
• Dm – мера искажений, SSD• λ – коэффициент, зависящий от параметра
квантизации• Rm – оценка количество бит, необходимых для
кодирования
![Page 12: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/12.jpg)
Поиск режима предсказания
1. Для каждого режима вычисляется SATD между текущим блоком и предсказанным.
2. Выбирается N (от 3 до 8) режимов с минимальным SATD
3. Из этих N режимов выбирается один с наименьшей RD-стоимостью
![Page 13: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/13.jpg)
Зачем что-то менять?
• Поиск производится для всех возможных подблоков размерами от 64x64 до 4x4
• Получается, что поиск режима предсказания выполняется 11935 раз для каждого блока
• При этом SATD вычисляется 341*35 раз• Оценка количества битов необходимых для
кодирования – 2623 раза• Это много, учитывая размер всего
изображения
![Page 14: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/14.jpg)
Как предлагается это ускорить
• Сократить количество возможных разбиений
• Сократить количество вычислений RD-стоимости
![Page 15: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/15.jpg)
Откуда могут быть проблемы
• При оптимизации скорости поиска режима предсказания могут возникнуть следующие проблемы:1. Изменится качество видео2. Изменится битовая скорость видео
![Page 16: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/16.jpg)
Кодек для программной реализации
• Для модификации был выбран кодек Kvazaar:– Открытые и понятные исходные коды– Свободная лицензия GPLv2– Кроссплатформенный
![Page 17: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/17.jpg)
Наборы настроек кодирования
• fast – быстро кодирует, низкое качество• slow – медленно кодирует, высокое
качество• medium – компромиссный вариант
![Page 18: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания](https://reader035.vdocuments.site/reader035/viewer/2022081515/55cebdb5bb61eb9d2f8b47ec/html5/thumbnails/18.jpg)
Архитектура системы потокового вещания