Вчимося працювати зі звуком для відео.

Багато хто стикався з тим, що в фільмах стислих DivX звук сильно стиснутий і в результаті получаються настільки високі спотворення, що фільм не можна нормально дивитися. Або накладення перекладу було настільки поганим, що не зрозуміло ні оригіналу, ні перекладу. Це може дуже зіпсувати відчуття від перегляду фільму.

У цій статті я хочу торкнутися теми стиснення звуку для відео.В якості огляду трохи торкнуся формати, які не застосовуються в відео.

MP3
Почну з найпоширенішого на даний момент аудіо формату - MP3. Мнігіе впевнені в тому, що це MPEG 3, але це не так, MP3 це MPEG1 Layer III, але про все по порядку.

Відео: Як монтувати відео в програмі Adobe Premiere Pro CS4, CS6 - Як працювати? огляд програми

MPEG розшифровується як «Moving Picture Coding Experts Group», дослівно - «Група експертів з кодування рухомих зображень». MPEG веде свою історію з січня 1988 року. Точніше, група MPEG була створена Міжнародною організацією стандартів (International Standards Organization або скорочено ISO) і Міжнародної електротехнічної комісією (International Electro-Technical Commission або скорочено IEC). Група була утворена для створення стандартів кодування рухомих зображень і аудіо інформації. Починаючи з перших зборів в травні 1988 року, група почала зростати і виросла до надзвичайно щільною групи фахівців. Зазвичай, в зборах MPEG беруть участь близько 350 фахівців з більш ніж 200 компаній. Зустрічі проводяться близько трьох разів на рік. Велика частина учасників MPEG - це індивідуальні фахівці, зайняті в тих чи інших наукових і академічних установах. На сьогоднішній день MPEG розроблені такі нормативні документи і алгоритми:

MPEG1 - (Листопад 1992) - стандарт кодування, зберігання та декодування рухомих зображень і аудіо інформації-
MPEG2 - (листопад 1994) - стандарт кодування для цифрового телевіденія-
MPEG2.5 - стиснення аудіо зі зниженим дозволом (аудіо 16,22.05,24 кілогерц) -
MPEG3 - багатоканальний MPEG1 + MPEG2, цей стандарт практично вмер
MPEG4 - стандарт для мультимедіа додатків: версія 1 (жовтень 1998) і версія 2 (грудень 1999) -
Отже, все по порядку:
1) Розглянемо комплект MPEG1: Layer (рівень) I, Layer II і Layer III. Загальна структура процесу кодування однакова для всіх рівнів. Для кожного рівня визначено свій формат запису біт-потоку і свій алгоритм декодування.

алгоритми MPEG засновані в цілому на вивчені властивості сприйняття звукових сигналів слуховим апаратом людини (тобто кодування виробляється з використанням так званої «психоакустической моделі»). Тобто, людський слух не ідеальний і сприйнятливість слуху на різних частотах, в різних комбінаціях - різна. Цим і користуються при побудові «психоакустической моделі», яка враховує, які звуки, частоти, можна вирізати не завдаючи шкоди слухачеві композиції.
Коротко про алгоритм кодування. Вхідний цифровий сигнал спочатку розкладається на частотні складові спектра. Потім цей спектр очищається від свідомо нечутних складових - низькочастотних шумів і найвищих гармонік, тобто фактично фільтрується. На наступному етапі проводиться значно складніший психоакустичний аналіз чутного спектру частот. Це робиться в тому числі з метою виявлення і видалення «замаскованих» частот (частот, які не сприймаються слуховим апаратом на увазі їх приглушення іншими частотами). Потім, в залежності від рівня складності використовуваного алгоритму, може бути також проведений аналіз передбачуваності сигналу. На довершення до всього, проводиться стиснення вже готового біт-потоку спрощеним аналогом алгоритму Гоффмана (Huffman), що дозволяє також значно зменшити займаний потоком обсяг.
Як було зазначено вище, комплект MPEG-1 має три рівні (Layer I, II і III). Ці рівні мають відмінності в яке забезпечується коефіцієнті стиснення і якості звучання одержуваних потоків. Layer I дозволяє сигнали 44.1 КГц / 16 біт зберігати без відчутних втрат якості при швидкості потоку 384 Кбіт / с, що становить 4-х кратний виграш в займаному об`еме- Layer II забезпечує таку ж якість при 194 Кбіт / с, а Layer III - при 128 (або 112). Виграш Layer III очевидний, але швидкість компресії при його використанні найнижча (треба відзначити, що при сучасних швидкостях процесорів це обмеження вже не помітно). Так ось, MP3 ні що інше, як MPEG1 Layer III.

Стандарт MPEG-2 був спеціально розроблений для кодування ТВ сигналів мовного телебачення, тому на розгляді MPEG-2 ми б не зупинялися, якби в квітні 1997 цей комплект не отримав «продовження» у вигляді алгоритму MPEG-2 AAC (MPEG-2 Advanced Audio Coding - просунуте аудіо кодування). Стандарт MPEG-2 AAC став результатом кооперації зусиль інституту Fraunhofer, компаній Sony, NEC і Dolby. MPEG-2 AAC є технологічним приймачем MPEG-1.
Тепер конкретніше про MP3. Так як цей формат досить старий, за час його існування різні фірми випускали для нього кодери, які тим чи іншим вили краще своїх конкурентів. Так, фірма Xing перша стала використовувати VBR для mp3 файлів. Fraunhofer (родоначальник MP3) використовувала Joint-Stereo. Lame був незалежним проектом (що на заході дуже цінується) і за його використання не треба було платити. Але пройшло досить багато часу і залишилися найсильніші. На даний момент це проект Lame і оригінальний кодер від Fraunhofer. На мій погляд, Lame однозначно виграє у праотця за якістю і швидкості кодування (адже він досі розвивається і підтримує такі речі, як ММХ). Подальша розмова піде про нього.

Існує кілька режимів роботи кодера LAME: CBR, ABR, VBR.Начну з самого простого режиму - CBR. CBR (Constant Bit Rate - постійний бітрейт) - це такий спосіб кодування вихідного аудіо потоку, при якому всі його блоки (фрейми) кодуються з однаковим бітрейтом. Іншими словами, бітрейт на всій протяжності (всіх фреймів) результуючого потоку є постійним. Тобто Розмір файлу буде дорівнює тривалість помножити на бітрейт (він вимірюється в кілобайт / секунда)
ABR і VBR можна записати під однією назвою - VBR, різниця в їх алгоритмах вибору бітрейта.
VBR (Variable Bit Rate - змінний бітрейт) - це такий спосіб кодування вихідного аудіо потоку, при якому кожен окремий блок (фрейм) кодується зі своїм бітрейтом. Вибір бітрейта, оптимально підходить для кодування даного фрейму, здійснюється самим кодером шляхом аналізу «складності сигналу» в кожному окремому фреймі.

А в чому ж різниця ABR і VBR? В алгоритмі вибору бітрейта.
ABR (Average Bit Rate - середній бітрейт) - при роботі з ABR ми задаємо середній бітрейт, який ми хотіли б отримати, а кодер користуючись своїм механізмом оцінки складності композиції змінює бітрейт кожного окремого фрейма. В результаті, ми отримуємо майже прогнозований обсяг файлу і якість, трохи краще, ніж CBR.
VBR (Variable Bit Rate - змінний бітрейт) - при роботі з VBR ми задаємо НЕ бітрейт, а якість, яке бажаємо отримати. Показник якості задається значенням від 9 (найнижча якість) до 0 (найвища якість). При цьому ми не можемо прогнозувати бітрейт і розмір файлу, який вийдуть після кодування. Бітрейт визначає сам кодер в залежності від складності композиції і від рівня якості. Єдине що ми можемо зробити в цьому режимі, це обмежити бітрейт зверху і знизу (відповідними префіксами командного рядка).

Чим вам користуватися, вибирайте самі, на мій погляд менш проблемно користуватися ABR, я заздалегідь знаю, який розмір файлу я отримаю. У VBR теж є свої плюси: він не обмежений у дотриманні бітрейта і змінює його не соромлячись у всьому заданому діапазоні, від чого якість одержуваної композиції помітно вище, в порівнянні з ABR на тому ж середньому бітрейті.

AAC

Цей формат спочатку позиціонувався розробниками як наступник MP3, так як мав порівняно з останнім рядом безперечних достоїнств. Як і в MP3 в основі алгоритму AAC лежить психоакустична модель кодування, тобто при стисненні якась частина звукового спектра видаляється. При цьому алгоритм AAC містить велику кількість удосконалень, спрямованих саме на поліпшення якості вихідного аудіосигналу. В MPEG-2 AAC використовуються інші алгоритми перетворень, поліпшені обробники шумів і новий банк фільтрів. Зі спеціальних можливостей можна назвати, так звані «водяні знаки» (watermarks) - інформацію про авторські права, яку AAC дозволяє зберігати в тілі аудіокомпозиції, причому видалити цю інформацію не зруйнувавши цілісність звукової інформації неможливо.

При цьому MPEG-2 AAC володіє високою якістю звучання і дуже високим ступенем компресії аудіокомпозицій. Так, наприклад, аудіокомпозицій в форматі AAC з bitrate 96 kbs забезпечує якість звучання, аналогічне потоку MPEG-1 Layer III bitrate128 kbs. При порівнянні ж файлів AAC з bitrate 128 kbs, якість звучання відчутно перевершує MPEG-1 Layer III з такою ж ступенем стиснення.



І цілком можливо цей формат замінив би застаріваючий MP3 якби не одне але ... Відразу ж після закінчення робіт над MPEG-2 AAC деякі з компаній співзасновників забрали належні їм вихідні коди стандарту і на їх базі створили власні формати, комерційні і не сумісні один з одним. Ось таким чином і з`явилася та мішанина несумісних форматів, які називають «сімейство форматів Аудіостиснення AAC».

На даний момент існують чотири різновиди формату AAC: Homeboy AAC, ATT a2b AAC, Liquifier PRO AAC (LQT), Astrid / Quartex AAC

Всі ці модифікації несумісні між собою, мають власні кодери / декодери і неоднакові за якістю. Так, останні дві модифікації по ряду параметрів перевершують першу пару. Найвищою якістю володіє Liquifier PRO AAC (LQT), цей формат є комерційним, це його головний мінус. Це означає, що в цей формат можна затиснути свою домашню колекцію музики і слухати тільки їх програвачем, що не відредагувати, не дати сусідові послухати, чи не вмонтувати звук в фільм в цьому форматі не вийде. Не так давно я прочитав новину про смерть фірми Liquid Audio. Дуже шкода ... На перевірку це був, мабуть, найкращий кодер.

Eщё одна цікава новина: Для формату MPEG-4 збираються впровадити аудіо кодер AAC Plus з технологією SBR (про неї абзацом нижче) .Суд по SBR тут присутній Fraunhofer, це їх разработка.Что з цього вийде в подальшому побачимо, а вірніше почуємо.

MP3Pro
Кодек MP3 Pro анонсований в липні 2001 року компанією Coding Technologies разом з Tomson Mulimedia і інститутом Fraunhofer. Формат MP3Pro є продовженням, або, точніше, розвитком старого MP3. MP3Pro є сумісним з MP3 назад (повністю) і вперед (частково). Тобто файли, закодовані за допомогою MP3Pro, можна відтворювати в звичайних програвачах, проте якість звучання при цьому помітно гірше, ніж при відтворенні в спеціальному програвачі. Це пов`язано з тим, що файли MP3Pro мають два потоку аудіо, в той час як звичайні програвачі розпізнають в них тільки один потік, тобто звичайний MPEG-1 Layer 3.

У MP3Pro використана нова технологія - SBR (Spectral Band Replication). Ця технологія призначена для передачі верхнього частотного діапазону. Ідея технології та передумови такі. Справа в тому, що технології використання психоакустических моделей мають один спільний недолік: всі вони працюють якісно до бітрейту 128 Kbps. На більш низьких бітрейтах починаються різні проблеми: або для передачі аудіо необхідно обрізати частотний діапазон, або кодування призводить до появи різних артефактів. Цей ключовий момент показує, що використання психоакустической моделі не досить при роботі з бітрейтами нижче 128 Kbps. Нова технологія SBR доповнює використання психоакустических моделей. Працює це так: в файлі передається (кодується) трохи більше вузький діапазон частот ніж зазвичай (тобто з обрізаними «верхами»), а верхні частоти відтворюються (відновлюються) вже самим декодером на основі інформації про більш низьких частотних складових. Таким чином, технологія SBR застосовується практично не стільки на стадії стиснення, скільки на стадії декодування. «Загадковий» другий «паралельний» потік даних, про який говорилося вище, якраз і є та мінімальна необхідна інформація, яка використовується при відтворенні для відновлення верхніх частот. Проведені дослідження показують, що ця інформація - є усереднена потужність сигналу в верхньому (обрізаному) діапазоні частот. Точніше не одна усереднена потужність для всього діапазону вирізаних частот, а інформація про середньої потужності в декількох смугах частот верхнього діапазону. Детальніше про SBR.
Якість звучання MP3Pro можна назвати суб`єктивно дуже хорошим навіть на бітрейте 64 Кбіт / с. Суб`єктивно, нескладні композиції при такому бітрейте сприймаються не гірше ніж MP3 128 Кбіт / с. Однак, необхідно враховувати той факт, що таке звучання досягається штучним шляхом, і що чутний сигнал являє собою вже не стільки оригінал, скільки синтезовану копію оригіналу, що змушує задуматися меломанів, володарів високоякісної аудіо апаратури, а також просто цінителів якісного оригінального звучання. Тести показують, що використаний в MP3 Pro штучний прийом критичним чином впливає на якість кодування (і подальшого відтворення) безлічі музичних композицій. Це означає, що використання кодека дуже недоцільно і не рекомендується при складанні фонотеки або для постійного зберігання аудіо. З іншого боку, кодек може займати виграшні позиції в області потокового аудіо.
Цей формат на даний момент розвивається та є кодування їм в повній мірі не освоєно. Природно, затискати в нього можуть тільки ентузіасти, які не бояться проблем, які є в бета версіях. У фільм його теж (може бути поки що) не можна вмонтувати, значить, він не підходить для конкуренції з MP3. Тим, кому цікаво більше почитати про MP3Pro.

Відео: Монтаж відео в FCPX. Робота зі звуком в Final Cut Pro X

TwinVQ (VQF)
Цей формат по праву вважається найстарішим конкурентом MP3. Алгоритм аудіокомпресії TwinVQ (Transform-domain Weighted Interleave Vector Quanization - векторне квантування з перетворюваними доменами і зваженим чергуванням) був розроблений японською фірмою Nippon Telegraph and Telephone Corp. (NTT), точніше, її підрозділом Human Interface Laboratories. Патент на використання цього формату належить фірмі NTT, яка першою представила на ринку програмного забезпечення програвачі та кодеки TwinVQ. Цей формат по основним концепціям, використовуваним при компресії аудіо, сильно нагадує MP3, але при цьому використовується зовсім інша психоакустична модель. Відповідно і вибір «потрібних» і «непотрібних» звуків здійснюється за зовсім іншими критеріями. Розмір файлів VQF в середньому на 30-35% менше, ніж MP3, при приблизно однаковій якості звуку. Так, наприклад, якість звучання потоку TwinVQ при bitrate 96 Кбіт / с практично ідентично якості звучання потоку MPEG-1 Layer III (при bitrate 128 Кбіт / с) і сімейства MPEG-2 AAC (при bitrate 96 Кбіт / с).
Ліцензією на використання даного формату володіє так само всім відома фірма Yamaha, яка, власне, і здійснює на протязі вже більше ніж двох років основну підтримку і розкручування формату VQF. Компанія Yamaha, як завжди, підійшла до справи дуже сумлінно, і, можна сказати, що, пропоноване нею програмне забезпечення для створення і відтворення аудіокомпозицій VQF під торговою маркою SoundVQ, є найкращим для даного формату на поточний момент, як по дизайну, так і по якості кодування / декодування звуку.
Як показали тести, як програмні, так і акустичні, з використанням живих тестерів, VQF перевершує МР3 за всіма параметрами в нижній області звукового спектра, але програє останньому в області верхніх частот. На частотах вище 15 кГц, VQF на 2-3 дБ поступається MP3. При всьому при цьому, VQF вносить набагато менше спотворення форми сигналу в композиціях з великим динамічним діапазоном (реальна музика).
Цей формат так само підходить тільки для зберігання музики, поки немає редактора, який міг би з`єднати відео і TwinVQ (VQF). Завантаження процесора при прослуховуванні TwinVQ (VQF) досить висока, пошук потрібного фрагмента йде довго, в зв`язку з цим можна припустити, що TwinVQ (VQF) так і не буде інтегрований з відео.

Давайте розглянемо реальних конкурентів формату MP3: OGG

OggVorbis - це абсолютно новий універсальний формат аудіокомпресії вийшов влітку 2000 року. Цей наймолодший формат з усіх конкурентів МР3 розроблений групою Xiphophorus і є всього лише невеликою частиною з мультимедіа проекту OggSquish, в якому буде крім форматів Аудіостиснення ще і кодеки видеокомпрессии. Втім, це все в майбутньому, а поки OggVorbis - єдиний реально існуючий формат з цього семейства.У цього формату є перевага над усіма іншими форматами (Lame - MP3 не чіпаємо) - він безкоштовний. Тобто, за використання його в своїх програмах, програмістам не треба буде платити. Це дуже практичний крок, адже MP3 таким чином і захопив ринок. Зараз, потрібен дуже хороший і безкоштовний кодек, для того, щоб скинути гегемона.
Як кажуть керівники проекту, OGG використовує оригінальний математичний алгоритм і власну психоакустичного модель. Це звільняє його від необхідності виплачувати якісь ліцензійні збори і проводити інші виплати стороннім фірмам-виробникам аудіо форматів. Алгоритм Ogg Vorbis розрахований на стиснення даних на всіх можливих бітрейтах без обмежень, тобто від 8 Kbps до 512 Kbps, а також на кодування із змінним бітрейтом (VBR). Алгоритм передбачає зберігання всередині файлів докладних коментарів про виконавця і назву композиції, а також графічної інформації. В алгоритмі передбачається також можливість кодування декількох каналів аудіо (більше двох, теоретично до 255), можливість редагування вмісту файлів, а також так званий «масштабований бітрейт» - можливість зміни бітрейту потоку без необхідності декодування. Підтримується потокове відтворення (streaming). Для зберігання даних використовується власний універсальний формат bitstream Ogg Squish, розрахований на зберігання будь-якої інформації мультимедіа системи Ogg Squish. За якістю звуку, OGG успішно конкурує з MP3, але до таких монстрів, як LQT йому далеко, тому його перспективність саме в безкоштовності і підтримці нових специфікацій (бітрейт до 512 Kbps, 255 каналів звуку, підтримку багатьма ентузіастами ...). Так само, я прочитав в прес-релізі Vorbis, що вони збираються до літа 2003 року випустити відео кодек! Подивимося, що з цього вийде, забігаючи вперед, скажу, що Ogg Vorbis мені найбільше сподобався за якістю.
Формат постійно розвивається, що підтверджує вихід фінальної версії кодека v.1.0, який той же зазнає постійних змін. Є плагіни для Winamp, які програють формат OGG (на даний момент вони вбудовані в Winamp), з`явилася підтримка цього формату в фільмах. Якщо врахувати молодість цього формату, то він дуже швидко просувається на ринок. Але, природно не обходиться і без але ... Якщо взяти і встановити на систему DivX5, і спробувати переглянути фільм зі звуком в OGG, то ви отримаєте тішінуL. Кодеки для OGG потрібно встановлювати окремо. Природно це буде стримувати просування цього формату. Будемо сподіватися, що Microsoft буде включати підтримку цього формату на рівні ядра в наступних оновленнях і операційних системах. Поки ж Microsoft зацікавлена в просуванні власного формату, про нього - нижче.

WMA
Є такий аудіо кодек Voxware Audio CODEC v4.0, працював досить не погано, навіть проходив випробування на деяких високошвидкісних цифрових телефонних мережах США і Канади, був вбудований в Media Player операційних систем Windods. В один прекрасний день він виявився купленим всім відомою компанією Microsoft. З цього дня він став по-іншому назватися і працювати на іншого господаря. Ласкаво просимо в WMA! Розробка була повністю скуплено і програмісти компанії приступили до подальшого доопрацювання і сполученню її з іншими частинами операційної системи Windows. Цей кодек хоч і вийшов пізніше інших, зате мав набагато більш високими характеристиками і головне він безкоштовний! Microsoft винайшла найбільш ефективний спосіб знищення конкурентів - Зробити власний продукт безкоштовним, з підтримкою на рівні DirectX.
Новонароджений формат без потуг на оригінальність був названий WMA - Windows Media Audio. Цей формат позиціонується своїми творцями, як наступник цілої плеяди застарілих аудіоформатів, починаючи з Real Audio і закінчуючи MPEG Layer III.

Microsoft обіцяє, що якість WMA буде не гірше якості LQT (AAC), а це вже претензія на якість. Знову ж, фірма Microsoft вирішила бути оригінальною. Звук WMA неможливо буде використовувати зі звичайними AVI файлами (читай - спроба проштовхнути свій формат WMV, який так само не підтримує потік AVI). Для роботи з WMA і WMV був введений новий транспортний протокол ASF.
Остання, бачена мною версія Windows Media Codec - 8. Якість звуку я не порівняв, а ось відео вельми посередньої якості, плюс великі проблеми з пошуком потрібного фрагмента, роблять його неконкурентоспроможним у порівнянні з іншими відео форматами. А значить і аудіо залишиться не затребуване (адже WMA працює тільки з WMV).

WMA - Дуже розкручений формат (Тільки за рахунок просування разом з Windows), не показав ніяких видатних результатів, не дивлячись на заявлені характеристики. Плюс ця система захисту, вбудована в версії 8 і 9, теж підрізає йому крила (для деяких це навпаки плюс - захист від несанкціонованого прослуховування).

AC3
Використовувана в Dolby Digital схема компресії даних AC3 володіє дуже високою ефективністю (коефіцієнт стиснення може бути більше 12: 1, підтримувані бітрейти від 32 до 640 кбіт / с, в кіно використовується 320 кбіт / с) і при цьому досить високим суб`єктивним якістю звуку.

AC3, як і всі сучасні схеми стиснення даних звукових потоків (Зокрема, MP3), використовує в своїй роботі особливості слухового сприйняття людини, або психоакустичного модель. Наприклад, в присутності гучного сигналу деякої частоти тихіші і мають трохи більш високу або низьку частоту звуки маскуються гучним сигналом, тобто не чути або чути дуже погано. Також маскуються сигнали, які звучать після і навіть перед гучним звуком. Це явище дозволяє не кодувати або кодувати з меншою розрядністю маскуються звуки. Компресія даних здійснюється також шляхом недеструктивного позбавлення від надлишкової інформації. Для реалізації цих схем вхідний потік аудіо розбивається в часі (на перекриваються блоки (фрейми) по 512 семплів, при частоті дискретизації 48 кГц це становить 10,66 мс, якщо ж в сигналі присутні різкі перепади рівня, то розмір блоку зменшується вдвічі, щоб якісно передати ці швидкі скачки) та за частотою (весь звуковий діапазон в 24000 Гц розбивається на 256 сегментів, що дає ширину кожної смуги в 93,75 Гц).
Цікаво, що психоакустична модель, використовувана кодером, може змінюватися, оскільки параметри моделі передаються в потоці AC3 і потім можуть використовуватися декодером для відновлення вихідного звучання.

Ще одним способом зменшення потоку даних є об`єднання даних з різних каналів (те ж саме використовується в MP3 - Joint Stereo). У реальному багатоканальної фонограмі в декількох каналах звукова інформація часто перетинається, і її можна закодувати один раз для всіх, а не для кожного каналу окремо. Ця техніка застосовується тільки для частот вище 10 кГц, що дозволяє зберегти локалізацію джерел звуку, а при тому, що в розпорядженні кодера є цілих п`ять повноцінних звукових каналів і, відповідно, широке поле для маневру, потік даних цим спосіб можна зменшити досить значно.
Вельми цікаво поводиться формат AC3, сам собою напрошується висновок, що на DVD отримують якість за рахунок великого бітрейта. Можна з великою впевненістю сказати, що цього вимагають невисокі обчислювальні здатності апаратних програвачів DVD.

Теорію розглянули, але практика - це зовсім інша справа. Я вирішив сам прослухати всі формати і порівняти їх якість. Я не шукав кращого музичного формату, це буде AAC, я шукав формат придатний для фільмів.

Відео: Відео урок 2 - Робота зі звуком в Edius

MP3Pro і AAC не беруть участі в зв`язку з невисокою поширеністю цих форматів. Слухати їх можна тільки в спеціальних програвачах. Мене це не влаштовує. До того ж AAC досить ресурсоёмок, що так само наклало б свій відбиток при перегляді фільму.

Порівняння буду проводити на найбільш часто використовуваному (для фільмів) бітрейте ~ 96 kbit / s в MP3, інші формати підганялися під такий самий розмір файла.
Приховувати не буду, для MP3 я виставив особливі параметри. тому при такому бітрейте йому високі однозначно не витягнути, я вирішив йому допомогти, частота дискретизації 32 КГц, фільтр нижніх частот 15 кГц і режим Joint Stereo. При стандартних параметрах звук MP3 - огидний, що ми іноді спостерігаємо у фільмах (бітрейт 96 Kbit / s а звук ...). Для інших форматів ці настройки виставити було неможливо, тому що жоден з них не підтримує ФНЧ, а виставляти, частоту дискретизації 32 КГц без ФНЧ немає сенсу, можна тільки все зіпсувати.

Відео: Логопед звук Р. Сучасна методика 2014 року. Розрахована на заняття вдома. Правильно і лекгко

OGG - злегка завищений рівень високих частот-СЧ - норма НЧ - норма
WMA - синтезовані високі, неприємно слушать- СЧ - норма НЧ - норма
MP3 - подіскажени високі частоти-СЧ - норма НЧ - норма

AC3 - подіскажени високі частоти і завищений рівень-СЧ - кілька надривние- НЧ - важкуватий

Отже, конкурентів 2: OGG і MP3. Кого ж вибрати? MP3 більш поширений, OGG краще звук, делема. Для себе, я вибрав би OGG, для всіх рекомендую MP3. MP3 - вже практично вилизаний формат, підтримуваний всіма і вся, але з невеликим застереженням, параметри кодування потрібно підбирати. Звук, закодований в OGG, доводиться зливати з відео Форман OGM, про який поки ще мало хто знає, але у которонго є свої переваги над звичайними AVI з MP3 звуком.
1) Який бітрейт потрібен для відео DivX з роздільною здатністю 720х576, 25 fps, щоб якість була хороша (без квадратиків), але не занадто великий розмір файлу. 825 або 1 025 може бути прийнятно або це занадто мало?
2) Чому при перегляді телепередач з ТВ-тюнера звук хороший, але записується погано (не те щоб дуже, але злегка гірше ніж при перегляді наживо)? цей трабл є у мене і ще у мого знайомого. Чи можна в VirtualDub або в іншому редакторі відео за допомогою якого-небудь фільтра або ефекту це виправити?

Відповіді на такі питання читайте далі:
1.Бітрейт залежить від довжини самого файлу не менше, ніж від дозволу .. для хорошої якості цілком достатньо 1000-1200, особливо при такому дозволі ...
2.Чи спробувати збільшити рівень запису на мікшері.
Якщо треба підправити звук в готовому відеофайл можна поступити двояко. В VirtualDubMod - в меню звуку поставити режим повної обробки і збільшити гучність при перезапісі.Загрузіть і встановити VirtualDubMod можна за наступним посиланням  VirtualDubMod-1.5.10.2-RUS .

Розглянемо, що може робити VirtualDubMod 1.5.10.2.

VirtualDubMod 1.5.10.2 - відрізати, приклеїти звук. Синхронізувати звук з відео. Уроки, розрізати, склеїти відеофайли AVI. Зробити скріншоти з відеофайлу.
VirtualDubMod 1.5.10.2 - програми для захоплення і обробки відео. Це вдосконалений варіант популярної програми для обробки відео VirtualDub.Особенності цієї програми заключаютcя в возможностіработать з розширеним кількістю типів відео файлів і звуку. На відміну від VirtualDub, VirtualDubMod може окривать не тільки файли AVI і MPEG -1, але і VOB, MPEG -2, OGM, Matroska -MKV, а так само підтримує безліч звукових форматів: AC3, WAV, MP3, Ogg Vorbis, DTS, SRT files (ASCII / Unicode). Одним з найголовніших відміну від VirtualDub, є можливість працювати з безліччю аудіо потоків, тобто в AVI файл можна додати декілька звукових доріжок в різних форматах, так само підтримується і відкриття подібних файлів з DVD - VOB.
1) Відкриваємо VirtualDubMod Налаштовуємо оціі: Options => Prefernces => By default try processing VBR MPR streams like NunDub
2) Відкриваємо відео файл: меню File => Open video file ...
3) Відкриваємо в меню Video, потім вибираємо Direct Stream Copy
4) Йдемо в меню Streams, і заходимо в Stream List і зберігаємо аудіо файлWAV
Чекаємо пару хвилин збереження файлу:
5) Тепер прибираємо існуючу звукову доріжку Disable
і завантажуємо нову Add
Якщо поточна звукова доріжка була накладена із зсувом, то клацаємо правою кнопкою миші по новій доріжці і вибираємо Interleaving для синхронізації звуку і зображення.
6) Тепер все готово для збереження відеофайлу з новою звуковою доріжкою: В меню: File вибираємо Save As ... і вказуємо ім`я шлях в папку де буде збережений новий відео файл.
Чекаємо кілька хвилин, поки йде збереження ...
Через кілька хвилин Ви отримаєте відео файл з новою звуковою доріжкою.
Розрізати, склеїти відеофайли AVI- VirtualDubMod.
Спочатку ми навчимося ділити відео файл на дві або більше частин.
Навіщо нам це може знадобитися? Припустимо, Ви завантажили відео файл 1400 МБ, а записати хочете на два CD диска по 700 Мб. Або Ви хочете з фільму зробити рекламний ролик, а для цього Вам необхідно спочатку отримати кілька сегментів відео файлу, щоб потім склеїти в один відео ролик ..
На цьому уроці ми поділимо фільм навпіл і потім з`єднаємо дві частини.
1) Відкриваємо VirtualDubMod
2) Відкриваємо відео файл: меню File => Open video file ...
3) Откриваемвменю Video, потім вибираємо Direct Stream Copy
4) Вибираємо кінцеву точку виділення повзунком (1), і закріплюємо закінчення сегмента (2). Якщо Ви відрізаєте сигмент з середини відео файлу, то спочатку лівої чорної стрілкою закріплюємо початок закріплення.
На допомогу до повзунка ми можемо використовувати зміщення по ключовим кадрам
6) Далі зберігаємо перший сигмент як файл * .AVI
Чекаємо кілька хвилин, поки йде збереження ...
Зверніть увагу на те, що Ваш початковий відео файл не змінюється, Ви отримуєте окремий фрагмент, в окремому відео файлі (перший сегмент).
7) Тепер все те ж саме робимо з вихідним відео файлом для збереження другого сигмент.
Знову відкриваємо вікно VirtualDubMod і бачимо - повзунок в тій точці, на якій закінчили виділення першого сегмента, і закріплюємо початок виділення. Потім рухаємо, повзунок в кінець відео файлу, і закріплюємо закінчення виділення.
8) Зберігаємо другий сигмент відео файлу.
Чекаємо кілька хвилин, поки йде збереження ...
Тепер Ви маєте два відео файлу, отримані з одного. Вихідний відео файл у Вас теж залишиться.
Тепер ми навчимося з`єднувати два або більше сегментів в один відео файл.
1) Відкриваємо VirtualDubMod
2) Відкриваємо перший сигмент відео файлу.
3) Додаємо другий сигмент.
4) Зберігаємо як новий AVI відео файл.

Ось власне і все.Приємною Вам роботи і приємного звуку у фільмах !! Але краще встановити програму Adobe Audition.Скачать БЕЗКОШТОВНО Adobe Audition 3.0 можна за наступним посиланням  Adobe_Audition_3.0 . Русифікатор і активатор знаходяться всередині архіва.Как працювати з Adobe Audition 3.0 докладніше Ви можете дізнатися скачавши БЕЗКОШТОВНО архів за цим посиланням  Audit30 .

P.P.S. Якщо у Вас є питання, бажання прокоментувати або поділитися досвідом, напишіть, будь ласка, в коментарях нижче.

Поділися в соц мережах:
Cхоже

Увага, тільки СЬОГОДНІ!