Метод бездротової передачі відеоданих, заснований на міжшаровій адаптації бітрейту та контролі помилок

Анотація

Вступ

Стандартний метод контролю швидкості коду H.264

Стандарт H.264 - це останній стандарт кодування відео. Він не тільки має високий ступінь стиснення відео, але також має сильну спорідненість до мережі і може адаптуватися до передачі різних мережевих середовищ. Функція H.264 розділена на два рівні: рівень кодування відео (VCL) і рівень абстракції мережі (NAL). Ієрархічна структура H.264 показана на рис. 1. Ця глава зосереджена на h. 264, в той же час у першій главі, на основі якості оцінки каналу, кодування відео H.264 та зміни бездротового каналу, відповідно до оцінки якості каналу для регулювання швидкості бітового кодування відео, зробити закодований відеопотік здатним адаптуватися до змін каналу, щоб поліпшити якість передачі потокового відео. Контроль бітрейту є ефективним методом для поліпшення пристосованості мережі стиснених відеоданих. В даний час існує безліч досліджень методів контролю бітрейту H.264. Цей документ розділяє їх на управління бітрейтом на основі алгоритму кодування та управління бітрейтом на основі стану мережі з точки зору того, чи слід використовувати інформацію про стан мережі.

Ієрархічна структура H.264

Алгоритм Лагранжа розглядає множину S = (S1, . Sk) вибіркових значень К джерело інформації, де Sk може бути вектором або скаляром. Кожне значення вибірки Sk можна кодувати, вибираючи якийсь режим кодування Яk = (Я1, . Яk) у встановленому режимі кодування Оk = (Оk1, . ОкН). Отже, відповідні множині Sзначень вибірки, існує відповідний набір Я = (Я1, . Яk) шаблонів кодування. Враховуючи обмежену швидкість передачі даних Р.c, режим кодування, вибраний для даної послідовності зразка джерела, повинен мінімізувати спотворення після кодування, як показано у формулі (1).

У формулі (1), D(S, Я) і Р.(S, Я) відповідно представляють ступінь спотворення і бітрейт вихідного потоку бітів. Серед них потік бітів кодується та квантується за допомогою режиму кодування Я для виведення вибірки S.

У практичних додатках для вибору режиму кодування зазвичай використовується наступна формула.

λ в екв. (2) - параметр Лагранжа. Для зразка S та вибраний режим кодування Я, режим кодування оптимальний при лінійному поєднанні бітрейта і ступеня спотворень J(S, Я| λ) (Функція витрат Лагранжа) є найменшою.

Розглядаючи зразок Sk, можна вважати, що швидкість передачі даних і ступінь спотворення після кодування пов'язані лише з відповідним режимом кодуванняЯk, отже, наступні дві формули відповідають дійсності:

Отже, якщо для кожного зразка обраний оптимальний режим кодування Sk ∈ S окремо, мінімальне значення J(S, Я| λ) можна легко отримати, щоб реалізувати відповідний контроль кодування.

Заснований на стані мережевого контролю швидкості кодування закодовані дані відповідно до важливої міри поділяються на різні типи кадрів, залежно від стану приймають різну стратегію передачі мережі, цей метод має безліч реалізацій, включаючиBскоротити для доступної пропускної здатності, RTTзазначена затримка в обидва кінці, PВтратасказав коефіцієнт втрати пакетів, kє постійною, залежно від відгуку в приймаючому кінці.

У літературі [10] пропонується така швидкість втрати пакетів PВтрата та швидкість відтворення медіапотоку Р.струм на приймальному кінці використовувався для прогнозування швидкості передачі Р.майбутнього в наступний момент у кінці відправлення та порівняно з поточною швидкістю відтворення Р.історії на кінці відправлення, щоб оцінити якість каналу, а потім відрегулювати значення QP кодера наступним чином (QP вказує параметри кодування):

Чим вище значення QP, тим нижче точність кодування, тим більше розмитого зображення і менший вихідний бітрейт; Навпаки, чим менше значення QP, тим чіткіше зображення і вищий бітрейт на виході. Цей метод широко вивчений і застосовується завдяки простоті та простоті реалізації. Стратегія контролю швидкості коду в цьому документі також реалізована шляхом регулювання значення QP.

Контроль швидкості коду H.264 на основі міжшарового дизайну

Процес адаптації швидкості міжшарового кодування та управління помилками

Діаграма декодування потоку відеоданих

Стратегія управління бітрейтом у цій роботі реалізується шляхом отримання доступної смуги пропускання каналу в часі, а потім динамічного регулювання параметра кодування H.264 (QP). Стандарт H.264 забезпечує загалом 52 значення QP від 0 до 51 для процесу кодування. Коли QP дорівнює 0, це представляє найбільш складне квантування, а вихідний бітрейт перевищує 10 Мбіт/с. Коли максимальне значення QP дорівнює 51, воно являє собою найгрубіше квантування, а вихідний бітрейт може бути нижче 100 Кбіт/с. Для кожних 6 збільшення QP розмір кроку квантування подвоюється. На практиці відповідний QP може бути обраний гнучко відповідно до стану каналу. Конкретна схема управління бітрейтом така:

після встановлення з'єднання кінець відправлення починає збирати вихідні відеодані та стискати їх (використовуючи значення QP за замовчуванням кодера, яке в цьому документі становить 23) та відправляти. Тут слід зазначити, що IDR-кадр початкового кадру відеопослідовності не здійснює управління швидкістю коду, оскільки він приймає внутрішньокадрове кодування, що впливає на подальшу реконструкцію зображення. Потім викликається функція збору швидкості мережевої карти для отримання швидкості передачі мережевої карти Р.PHY, і початкове значення C.S = КР. ∗ Р.PHY і КР. встановлено на 0,5.

сканувати швидкість передачі мережевої карти Р.PHY як тільки кожен кадр даних буде відправлений, і оновіть значення QP згідно з наступним методом

Якщо (Р.Біт + V + C.S)

Інакше якщо (Р.Біт > C.S + V)

Де, Р.Біт - вихідна швидкість коду кодера H.264, яку кодер може отримати безпосередньо; V визначається як запас пропускної здатності, і значення в цьому документі становить 0,5 Мбіт/с. Його функція полягає у тому, щоб запобігти занадто різким змінам значення QP та спричинити зниження якості зображення. Тут нижня межа QP встановлена на 23 замість мінімального значення 0, оскільки хороша якість відео може бути отримана, коли QP дорівнює 23. Не потрібно сліпо шукати менше значення QP, і зміна значення QP теж є великий, що також призведе до бурхливих коливань розміру вихідного потоку і вплине на ефект передачі.

налаштуйте приймач на передачу пакету RR кожні 10 с. Відправник отримує пакет RR і витягує коефіцієнт втрати пакетів P. Відрегулюйте значення КР. наступним чином

Якщо (P > Pa)

Інакше якщо (P $$ _R = _R \ ast \ ліва (1+ \ alpha \ права) $$

Де Pa і Pb - поріг швидкості втрати пакетів, і α - константа регулювання КР.. У цій роботі 5%, 0,5% та 0,1 взято відповідно. Використовуючи цей алгоритм, коли мережеве середовище є відносно стабільним і швидкість передачі базової мережевої карти приблизно постійна, інформація зворотного зв'язку від RTCP може автоматично регулюватися КР. до стабільного значення, так що рівень втрати мережевих пакетів підтримується на відносно низькому рівні. Коли канал змінюється протягом короткого часу, швидкість фізичного рівня змінюється відповідно, і вихідна швидкість передачі даних буде автоматично збільшена або зменшена для адаптації до зміни каналу. Коли мережеве середовище змінюється, наприклад, коли змінюється конкурентний потік бізнесу, зворотній зв'язок RTCP може автоматично коригуватися КР.. Отже, ця міжшарова спільна стратегія управління бітрейтом ефективно враховує короткочасні зміни каналів та довгострокові зміни мережевого середовища.

Стратегія інкапсуляції пакетів RTP, заснована на міжшаровому дизайні

VCL головним чином відповідає за ефективний кодек та декодування цифрового відео, забезпечуючи потік кодування відео з високою якістю, високим ступенем стиснення, надійністю, класифікацією та іншими характеристиками [5]. NAL головним чином відповідає за правильне відображення даних, закодованих відео, що генеруються шаром кодування відео, в різні мережі передачі. Для передачі потоку бітового відео, що генерується VCL, у певній мережі, NAL інкапсулює потік кодування VCL для цієї мережі та протоколу її передачі. Таким чином, H.264 може гнучко застосовувати різні методи інкапсуляції для різних мереж передачі та покращувати адаптивність мережі. Кожен блок NAL складається з навантаження послідовності байтів (RBSP) та набору інформації заголовка NAL, що відповідає кодованим відео даних. Структура послідовностей блоків NAL показана на рис. 3.

Послідовність одиниць NAL

Для того, щоб зробити дані, закодовані H.264, більш зручними для мережевої передачі, останній стандарт RFC3984 конкретно визначає три формати навантаження для інкапсуляції H.264 RTP, а саме один блок блоків NAL, пакет агрегування та блок осколків. При мережевій передачі необхідно лише встановити кодовані дані H.264 на різні типи навантаження відповідно до фактичних вимог програми, і тоді головку пакета RTP можна використовувати для мережевої передачі.

Для вилучення шару SVC використовували метод вилучення часового шару MGS. Для послідовності відео CIF рівень SVC відображається на чотири шари DASH. Для відео 720p перекладіть на 5 шарів DASH. Сформовані точки роботи DASH задовольняють середній розподіл ставок від найнижчого до найвищого рівня. Застосовується метод доставки носіїв інформації на основі пріоритетів, описаний у літературі [1]. Буфер для кожного користувача становить 20 с, а час попередньої вибірки буфера - 6 с. Під час моделювання всі користувачі DASH одночасно запитують відео. У LTE RTT мережі бездротового доступу, ядерного пулу та сторони мережі становить 50-60 мс. Враховуючи затримку Інтернету, наскрізний RTT в моделюванні становить 100 мс. TCP може ефективно зменшити часті втрати пакетів і має хорошу продуктивність у бездротовій мережі.

Ми порівняли алгоритм DFSRA з добре відомими алгоритмами для максимізації пропускної здатності системи, опитування та пропорційного справедливого планування. Тим часом реалізований алгоритм жадібності утиліти в літературі [8], де використовується така функція корисності:

Це опукла функція швидкості, деa1, a2, a3 - це статичне значення. Параметри відео та стиснення різні, як і ці значення.

Результати моделювання та аналіз

Ми змоделювали запропонований алгоритм на інструменті моделювання Quainet. Моделюється сценарій, коли кілька клієнтів DASH запитують динамічні адаптивні ієрархічні відеопотоки в комірці LTE. Використовувались послідовності відео CIF з хімічною швидкістю (конфігурація 1) та 720p HD відео з високою швидкістю (конфігурація 2) відповідно.

Налаштування моделювання

Програмне забезпечення H.264JSVM використовується для кодування відео CIF "Новини" та "Форман". Розгортаються адаптивне передбачення рівня блоку макросів та кодування CABAC. Відео містить 300 кадрів, ВИКОРИСТОВУЄ перші 240 кадрів і повторює відео 10 разів. Відео "Форман" - це довга відеопослідовність, яка ВИКОРИСТОВУЄ перші 2400 кадрів із частотою кадрів 25 кадрів в секунду. Для GoP встановлено значення 16. Кожен сегмент відео містить 3 GoP. Параметри квантування основного шару та рівня вдосконалення були обрані як 40 та 28 відповідно. Вагове значення MGS встановлюється відповідно до A. Шар вдосконалення кодується у 4 шари MGS та 5 часових шарів і містить загалом 20 шарів MGS. Відео було закодовано за допомогою еталонного програмного забезпечення H.264 для моделювання. Характеристики стиснення відео наведені в таблиці 1.

Індекс оцінки

Наступний індекс якості використовується для оцінки ефекту передачі. Висока ефективність: PSNR використовується для оцінки якості та високої ефективності відео. Стабільність відтворення: використовуйте наступні індикатори для вимірювання стабільності відтворення.

Серед них друга частина - це індекс нестабільності, а \ (_i ^ \) - найвищий рівень прийому i чіп. Функція ваги буває ϖ(d) = Я - d більше штрафу за нещодавні зміни ставок. Рівень буфера: клієнтам DASH потрібно завантажити достатньо даних, щоб уникнути перебоїв. Але також уникайте витрачання пропускної здатності мережі, завантажуючи занадто багато даних. Безперервність гри: основна п'єса враховує кількість творів, що перевищує термін відтворення, і тривалість кожної зупинки гри. Імовірність переривання визначається як кількість переривань, поділена на загальний час гри. Чесність: справедливість вимірюється різницею PSNR різних користувачів, які дивляться одне і те ж відео.

Результати моделювання та аналіз

По-перше, моделюється запропонований метод відображення від SVC до DASH. Відповідний метод від рівня SVC до рівня DASH називається методом відображення, який також можна розглядати як окремий випадок пропонування методу відображення. Під час моделювання всі користувачі знаходяться на відстані від 250 до 350 м від базової станції. Ця частина моделювання використовує алгоритм планування PF за замовчуванням. Запропонований метод може зменшити накладні витрати на заголовки повідомлення на 50%. Для CIF-відео запропонований спосіб може збільшити пропускну здатність щонайменше на 50%, а HD-відео щонайменше на 240 кбіт/с. Зі зменшенням кількості користувачів зростання буде більше. У конфігурації 1 кількість користувачів - 12; у конфігурації 2 кількість користувачів - 22 (див. рис. 4). Коли 7 Т менше, можна досягти кращої якості відтворення, але стабільність погана. Ви також можете помітити, що чим більша смерть, тим більший буфер. Це тому, що DPBS запитує майбутні шардовані блоки даних, коли вважає поточний запит нестабільним.

Баланс між ефективністю та стабільністю