Технологии обработки аудиоинформации
Содержание
- Звуковая информация
- Кодирование звука
- Временная дискретизация звука
- Глубина кодирования звука
- Качество оцифрованного звука
- Звуковые форматы
Звуковая информация
Звук – это распространяющаяся в воздухе, воде или другой среде волна (колебания воздуха или другой среды), с непрерывно меняющейся частотой и амплитудой.
Чем больше амплитуда – тем громче звук.
Чем больше частота колебаний – тем выше тон звука .
Единица измерения громкости звука – децибел (дБ)
Кодирование звука
Кодирование звука – это преобразование звуковой информации из одной формы в другую.
Процесс преобразования звуковых волн в двоичный код в памяти компьютера
Аудиоадаптер (звуковая плата) - специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.
Звуковая волна
Микрофон
Переменный электрический ток
Аудиоадаптер
Двоичный код
Память компьютера
Процесс воспроизведения звуковых волн в двоичный код в памяти компьютера
Память компьютера
Двоичный код
Аудиоадаптер
Переменный электрический ток
Динамик
Звуковая волна
Временная дискретизация звука
Непрерывная звуковая волна разбивается на отдельные маленькие временные участки
Для каждого участка устанавливается определенный уровень громкости.
Частота дискретизации звука – это количество измерений громкости звука за одну секунду.
Глубина кодирования
Каждой "ступеньке" присваивается определенное значение уровня громкости звука.
Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации i , которое называется глубиной кодирования звука.
Глубину кодирования звука – это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. При этом количество уровней громкости равно N = 2 i = 216 = 65536.
Соответствие звуков различных характеристик некоторым источникам звука
Радиотрансляция
Информационный объем звукового файла
I - информационный объем звукового файла
H - частота дискретизации (количество измерений в секунду времени)
i - глубина кодирования информации (количество уровней громкости в измерениях)
k - количество каналов по которым производится запись (моно - 1 канал, стерео - 2 канала, квадро - 4 канала)
При решении подобных задач, как и многих других нужно помнить, что чаще всего все расчеты удобнее производить в степенях двойки.
I=H*i*t*k
Задача №1
Рассчитаем необходимый информационный объем аудиофайла, длительностью 1 секунда при качестве кодирования 16 битов и частотой дискретизации 48кГц:
I=H*i*t*k
I= 16 бит *48 000 * 1сек = 76800 бит
Задача №2
Ю. Антонов «Белый теплоход», время звучания 3 мин 18 сек, качество аудио-CD диска, стерео
Решение:
44,1 кГц = 44100 Гц
3 мин 18 с = 198 с
I = H*i*t*k = 2·44100 Гц·16 бит·198 с = = 279417600 бит = 34927200 байт ≈ ≈ 34108,6 Кб ≈ 33,3 Мб
Ответ: I = 33,3 Мб
Качество оцифрованного звука
- Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука
- Низкое качество: телефонная связь при
частоте дискретизации 8000 раз в секунду
глубине дискретизации 8 битов
и записи одной звуковой дорожки (моно)
- Самое высокое качество: аудио-CD при
частоте дискретизации 48000 раз в секунду
глубине дискретизации 16 битов
и записи двух звуковых дорожек (стерео)
Звуковые форматы
Звуковой файл - файл, хранящий звуковую информацию в числовой двоичной форме.
- WAV – универсальный формат
- MP3 –формат со сжатием
Звуковые редакторы осуществляют запись, воспроизведение, редактирование звука, микширование (наложение звуковых дорожек друг на друга), применение звуковых эффектов (эхо, воспроизведение в обратном направлении и т.д.)
- Звук — это упругие волны, распространяющиеся в какой-либо упругой среде и создающие в ней механические колебания.
- В процессе кодирования звукового сигнала производится его временная дискретизация – непрерывная волна разбивается на отдельные маленькие временные участки «ступеньки».
- Качество компьютерного звука определяется характеристиками аудиоадаптера:
- Частотой дискретизации Разрядностью(глубина звука).
- Частотой дискретизации
- Разрядностью(глубина звука).
Задание 1
Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65536 возможных уровней интенсивности сигнала?
Задание 2
Оценить информационный объём цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука.
Задание 3
Определить длительность звукового файла, который уместится на дискете 3,5’’ (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объёмом 512 байтов каждый): при высоком и низком качестве звука.
Задание 4.
Оцените объем моноаудиофайла длительностью звучания 10с при частоте дискретизации 22,05 кГц и разрешении 8 бит. Ответ запишите в байтах, килобайтах, мегабайтах.
Задание 5.
Определите объем памяти для хранения цифрового аудиофайла, время звучания которого составляет 2 минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит.
Задание 6.
Объем звукового файла 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания этого файла, записанного с частотой дискретизации 22,05 кГц?
Задание 7.
Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук?
Задача 1. Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?
Задача 2. Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?
Задача 3. Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации — 22050 Гц. Какова разрядность аудиоадаптера?
Задача 4. Определите качество звука (качество радиотрансляции, среднее качество, качество аудио-CD) если известно, что объем моноаудиофайла длительностью звучания в 10 сек. равен: а) 940 Кбайт; б) 157 Кбайт.
Задача 5. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Во сколько раз различаются информационные объемы оцифрованного звука?
Аналого-цифровой преобразователь
Фильтрация — отсечение всех сигналов, частоты которых выше частоты, которая требуется для преобразования.
Граница на которой фильтр срезает частоту чаще всего имеет ширину 2кГц.
Оверсэмплинг — фильтрация на высокой частоте.
Дискретизация — процесс взятия отсчетов непрерывного во времени сигнала в равно отстоящие друг от друга временных точках. Интервал дискретизации — интервал времени через который производится взятие отсчетов.
Аналого-цифровой преобразователь
Квантование — процесс измерения мгновенных уровней сигнала полученных в результате дискретизации с точностью, ограниченной количеством разрядов, используемых для записей значений.
Есть 3 стандарта хранения отсчетов:
• 1 бит — 256 уровней сигналов;
• 16 бит — 65536 уровней сигналов;
• 32 бит — 4294967296 уровней сигналов;
Аналого-цифровой преобразователь
Динамическая обработка служит для изменения динамического диапазона сигнала .
Динамический диапазон сигнала — разница между самым громким и самым тихим звуком.
Чем шире диапазон, тем больше разница между самым тихим и самым громким звуком и наоборот. Динамические процессоры в основном подключаются «в разрыв».
Основные виды динамических обработок
10 работает как лимитер. " width="640"
Динамические обработки
Задача компрессора состоит в том, что бы сжимать динамический диапазон обрабатываемого сигнала. Компрессор понижает уровень громких звуков и повышает уровень тихих.
Лимитер тоже сжимает динамический диапазон, но в отличие от компрессора делает это жестко — не позволяет сигналу превышать определенный уровень.
Основные параметры:
• Порог — уровень сигнала, при котором срабатывает обработка.
• Отношение — определяет величину уменьшения сигнала при превышения порога.
Например, 2 : 1 означает, что при превышении порога сигнал должен быть уменьшен вдвое. У лимитера этот параметр не регулируется (бескончность). Компрессор с отношением n :1 , n 10 работает как лимитер.
Динамические обработки
• Атака — скорость срабатывания компрессора.
• Затухание — скорость восстановления компрессора.
• Усиление — уровень общего усиления сигнала на выходе. Задается в децибелах, отражающих увеличение или ослабление сигнала, который не превышает порог срабатывания.
• Жесткое или мягкое колено — определяет жесткость срабатывания (отношение достигает своего значения сразу или плавно).
Гейт и экспандер
Это обработка, противоположная лимитеру. Если лимитер отсекает самые громкие звуки, то гейт отсекает самые тихие.
Гейт пропускает только те сигналы, уровень которых превосходит заданный порог, остальные отбрасывает. В основном предназначен для борьбы с шумами и паразитными сигналами (звук соседнего барабана).
Основные параметры:
• Порог — уровень сигнала, при котором срабатывает обработка.
• Отношение — определяет насколько должен уменьшаться сигнал, уровень которого ниже порога. Чаще всего полное ослабление.
Например, 40 Дб — это практически полное ослабление.
• Атака — скорость срабатывания компрессора.
• Затухание — скорость восстановления компрессора.
Экспандер прибор очень похожий на гейт. Отличие состоит в том, что гейт понижает сигнал ниже порога на определенную величину , а экспандер понижает сигнал в заданном отношении.
Эквалайзер — устройство или компьютерная программа, позволяющая выравнивать амплитудно-частотную характеристику звукового сигнала, то есть корректировать его (сигнала) амплитуду избирательно, в зависимости от частоты. Эквалайзер обычно используется для частотной компенсации прибора.
Можно воспринимать эквалайзер как совокупность нескольких фильтров.
Графический эквалайзер
Графический — эквалайзер с жестко определенным набором фильтров.
Графический эквалайзер имеет определенное количество регулируемых по уровню частотных полос, каждая из которых характеризуется постоянной рабочей частотой, фиксированной шири-
ной полосы вокруг рабочей частоты, а также диапазоном регулировки уровня (одинаковый для всех полос).
Параграфический эквалайзер
Параграфический — эквалайзер графического типа с регулировкой добротности.
Параметрический эквалайзер
Параметрический — эквалайзер с котонизированным набором фильтров. Параметрический эквалайзер удобно использовать для исправления конкретного дефекта.
Каждая полоса параметрического эквалайзера имеет три основных регулируемых параметра:
• Центральная частота в герцах (Гц);
• Добротность — безразмерная величина;
• Уровень усиления или ослабления выбранной полосы в децибелах
(дБ).
Звуковые платы
Состав звуковой платы
Блок записи и воспроизведения.
Самый важный блок звуковой платы. Он управляется своим собственнымдрайвером и не связан с блоком DSP и блоком синтезатора.
Важные части:
• цифро-аналоговый преобразователь (ЦАП);
• аналогово-цифровой преобразователь (АЦП).
Основные характеристики преобразователей:
• тип;
• разрядность.
Важные характеристика самого блока
• частота дискретизации;
• количество входных и выходных каналов.
Блок синтезатора
Этот блок предназначен для синтеза произвольных звуковых сигналов, втом числе голос и музыкальные инструменты .
Блок DSP
Digitalsignalprocessor (DSP) — цифровой сигнальный процессор.Используется для обработки аудиоданных в цифровом виде. Блок DSP разгружает основной процессор во время звуковой обработки.
Блок интерфейсов
Большинство звуковых плат поддерживают:
• USB ;
• FireWire ;
• PCI ;
• PCI - express ;
• MIDI — на встроенной звуковой плате нужны специальные адаптеры;
• S/P-DIF — для передачи данных в цифровом формате непосредственно.
Блок микшера
Этот блок нужен для сведения входных и выходных аудио-сигналов и регулировки их уровня. Важное свойство — поддержка внутренней коммутации. Таким образом карта может записывать сама на себя.
Тон-генератор — это устройство, предназначенное для синтеза и управляемое только через MIDI-интерфейс.
На самом деле это обычный синтезатор, только без клавиатуры.
Тон-генератор с достаточными возможностями управления может оченьточно воспроизвести звучание инструмента по заданному MIDI-потоку.
Формирования MIDI-сообщений используют MIDI-контроллеры :
• клавиатура;
• педаль;
• рукоятка с несколькими степенями свободы;
• ударная установка (с датчиками способа и силы удара);
• струнный инструмент;
• духовой инструмент.
Протокол MIDI
MIDI-протокол является событийно-ориентированным. Обмен данными осуществляется при помощи сообщений. Сообщения —блоки данных произвольной длины. Каждое сообщение является командой для музыкального инструмента.
Стандарт предусматривает 16 независимых и равноправных логических каналов. Внутри канала действуют свои режимы работы.
Запись и передача
Индустрия звукозаписи развивается с 30-х годов XX века.
Секвенсор — аппаратное или программное устройство для записи и воспроизведения MIDI-сообщений.


Технологии обработки аудиоинформации (2.84 MB)

