Цифровой звук и запись звука на компьютере. Перспективы и проблематика

18.04.2019

Шилд блока реле 4 канала для Arduino UNO R3 и MEGA 2560

Реле — это электромеханические устройства, замыкающие и/или размыкающие контакты внешней электрической цепи при подаче в обмотку реле управляющего электрического тока. Этот ток порождает магнитное поле, вызывающее перемещение ферромагнитного якоря реле, механически связанного с электрическими контактами внешней электрической цепи. Последующее перемещение контактов коммутирует эту цепь.
К реле можно подключить лампочку, вентилятор, электромагнитный клапан для управление поливом и программно управлять этими устройствами изменением состояния на цифровых выводах Arduino.
Relay Shield — плата расширения для Arduino, на которой расположены 4 независимых реле TIANBO, подключённых к цифровым пинам Arduino. Это реле управляется напряжением 5 вольт и способно коммутировать до 3 ампер постоянного тока напряжением 24 В и переменного тока напряжением 125 В.

Для управления 4 реле платы используются следующие выводы Arduino - D4, D5, D6, D7.. При подключении каждого вывода Arduino к схеме переключения реле используется гальваническая развязка, что предотвращает внешние наводки при включении/выключении, подключенной к реле нагрузки. В схеме реле используется транзистор p-n-p типа, для его открытия нужно подать на базу минус. Для этого используем функцию digitalWrite(pin, LOW). Транзистор будет открыт и через управляющую цепь потечет ток и реле сработает. Для отключения реле следует закрыть транзистор, подав на базу плюс, вызвав функцию digitalWrite(pin, HIGH).
О текущем состоянии каждого из них можно судить по индикаторным светодиодам, расположенным на плате. К каждому реле подведён клеммник на 3 провода, что позволяет использовать реле как в режиме "нормально разомкнутое", так и в режиме "нормально замкнутое".
В отличие от большиства модулей реле для Arduino, данная плата сделана в формате шилда, что значительно эконимит место и увеличивает надежность контакта между Arduino и реле.

Характеристики реле
Ток обмотки: 80 мА;
Максимальное коммутируемое напряжение: 24 В постоянного тока; 125 В переменного тока;
Максимальный коммутируемый ток: 3 А;
Рекомендованная частота переключения: до 1 Гц;
Время жизни: не менее 50 000 переключений.

Рассмотрим пример использования Relay Shield. Подключим к реле лампу освещения, которая будет включаться/выключаться в зависимости от освещенности помещения. В качестве датчика освещенности помещения будем использовать фоторезистор. Схема соединений.

// Используемый вывод для реле
#define PIN_RELAY 7
// Пин подключения фоторезистора
#define PIN_PHOTORESISTOR A0
// переменная для хранения показаний фоторезистора
int val_photo;
// граничное значение освещенности
#define VAL_PHOTO_ON 220
#define VAL_PHOTO_OFF 520

Void setup(void)
{
// подключение последовательного порта
Serial.begin(9600);
// настроить вывод реле как OUTPUT
pinMode(PIN_RELAY,OUTPUT);
// включить свет
digitalWrite(PIN_RELAY,LOW);
}
void loop(void)
{
// получение данных с фоторезистора
val_photo=analogRead(PIN_PHOTORESISTOR);
// включить
if(val_photo< VAL_PHOTO_ON)
digitalWrite(PIN_RELAY,LOW);
// выключить
else if(val_photo< VAL_PHOTO_OFF)
digitalWrite(PIN_RELAY,HIGH);
// пауза перед следующим измерением
delay(5000);

С помощью Ардуино. Но как быть, если мы задумаем управлять устройствами, подключенными к бытовой сети? Напомню, что даже небольшая настольная лампа питается от источника переменного тока с напряжением 220 Вольт. Обычный полевой транзистор, который мы использовали в схеме с двигателем уже не подойдет.

Чтобы управлять мощной нагрузкой да еще и с переменным током воспользуемся реле. Это такое электромеханическое устройство, которое механическим способом замыкает цепь нагрузки с помощью электромагнита. Посмотрим на внутренности:

Принцип действия реле следующий. Подаем напряжение на электромагнитную катушку. В катушке возникает поле, которое притягивает металлическую лапку. В свою очередь, лапка механически замыкает контакты нагрузки.

У реле есть два основных применения. Во-первых, мы можем подав всего 5 Вольт на катушку, замкнуть цепь очень мощной нагрузки. Например, реле, используемое в уроках для Ардуино, может включить холодильник или стиральную машину. Во-вторых, некоторые виды реле могут одновременно замкнуть и разомкнуть сразу несколько разных цепей с разным напряжением.

На этом уроке мы будем работать не с отдельным реле, а с целым релейным модулем. Помимо самого реле, модуль содержит еще и оптоэлектронную развязку с транзистором, которые защищают выводы Ардуино от скачков напряжения на катушке.

У одинарного модуля реле есть всего три контакта. Подключим их по следующей схеме.

Кстати, вход реле является инвертированным. Это означает, что высокий уровень на контакте In выключит катушку реле, а низкий уровень — включит.

Принципиальная схема

Внешний вид макета

2. Программа для Ардуино

Напишем простую программу, которая будет включать лампу на 3 секунды, а затем гасить на 1 секунду.

Const int relPin = 3; void setup() { pinMode(relPin, OUTPUT); } void loop() { digitalWrite(relPin, HIGH); delay(1000); digitalWrite(relPin, LOW); delay(3000); }

Загружаем программу на Ардуино. Теперь подключаем питание к лампе и к реле. Наконец, подаем питание на контроллер.

3. Автоматический светильник или уличный фонарь

С помощью контроллера, реле и датчика света можно сделать несложный автоматический светильник. Контроллер будет зажигать лампу в момент, когда уровень света на датчике станет меньше заданного значения.

В качестве датчика используем готовый модуль на основе . Подключим все три устройства по следующей схеме.

Принципиальная схема

Внешний вид макета

4. Программа автоматического светильника

Аналоговый вывод датчика дает значения в диапазоне от 0 до 1023. Причем, 0 — для максимального уровня света и 1023 для полной темноты.

Сначала нам нужно определиться при каком уровне света включать лампу, а при каком выключать. В нашей лаборатории при свете дня датчик показывает значение L = 120, а ночью около L = 700. Будем включать реле при L > 600, и выключать при L < 200. Вспомним как и напишем программу.

Const int photoPin = A5; const int relPin = 3; void setup() { pinMode(photoPin, INPUT); pinMode(relPin, OUTPUT); } void loop() { if(analogRead(photoPin) < 200) digitalWrite(relPin, HIGH); if(analogRead(photoPin) > 600) digitalWrite(relPin, LOW); }

Загружаем программу на Ардуино и проводим эксперимент. Лучше всего это делать ночью.

Задания

1. Музыка реле. Как известно, электромеханическое реле издает щелчок при срабатывании. Попробуйте воспользоваться этим для проигрывания какой-нибудь несложной мелодии.

2. Управление двигателем. Имея два трехконтактных реле, таких же как в этом уроке, можно собрать схему для изменения направления вращения двигателя.

способ записи речи, музыки, изображения, текстов и т. п. путём преобразования их в цифровой код, к-рый в виде последовательности дискретных сигналов (напр., электрич. импульсов) фиксируется на магн. ленте, магн. или оптич. дисках и др. носителях. Ц. з. и. применяется в вычислит. технике, системах звуко- и видеозаписи, цифровом телевидении и др.

- кассеты с магнитной лентой, на которой данные записаны в ЦИФРОВОМ виде. Такие кассеты меньше и длиннее аналоговых...
Научно-технический энциклопедический словарь
- используемый при передаче финансовых документов в компьютерной системе "клиент-банк" зашифрованный идентификатор лица, передающего информацию...
Большой экономический словарь
- ...
Энциклопедический словарь экономики и права
- цифрова́я ка́рта цифровая модель топографической, тематической или специальной карты, представленная в виде числовых значений плановых координат x и y, аппликат z и закодированных свойств...
Географическая энциклопедия
- смешанная нотация, в которой для представления понятий используют в качестве основных символов буквы и цифры.По-английски: Alphanumeric notationСм. также: Нотация ...
Финансовый словарь
- используемый при передаче финансовых документов в компьютерной системе "клиент- банк" зашифрованный идентификатор лица, передающего информацию...
Большой бухгалтерский словарь
- "...Цифровая карта; ЦК: цифровая картографическая модель, содержание которой соответствует содержанию карты определенного вида и масштаба..." Источник: " ГОСТ 28441-99. Картография цифровая...
Официальная терминология
- "...Цифровая картографическая информация; ЦКИ: картографическая информация, представленная в цифровой форме..." Источник: " ГОСТ 28441-99. Картография цифровая...
Официальная терминология
- "...Цифровая модель: логико-математическое представление в цифровой форме объектов картографирования и отношений между ними..." Источник: " ГОСТ 28441-99. Картография цифровая...
Официальная терминология
- "...Цифровая картографическая продукция: продукция, получаемая с использованием цифровой картографической информации..." Источник: " ГОСТ 28441-99. Картография цифровая...
Официальная терминология
- "...Цифровая картография: раздел картографии, охватывающий теорию и практику создания и использования цифровой картографической продукции..." Источник: " ГОСТ 28441-99. ...
Официальная терминология
- "... - иерархические серии стандартизованных цифровых скоростей передачи, не происходящих от одного генератора и поддерживаемых в установленных пределах.....
Официальная терминология
- "... - иерархическая совокупность цифровых транспортных структур, стандартизованных для транспортирования по физическим сетям передачи соответствующим образом адаптированной нагрузки.....
Официальная терминология
- процессы, посредством которых информация вносится и сохраняется в некотором физическом теле с целью её последующего получения...
- управления, автоматическая система управления, в которой осуществляется квантование сигналов по уровню и по времени...
Большая Советская энциклопедия
- способ записи информации, при котором регистрируемые на носителе сигналы преобразуются в последовательность кодовых комбинаций импульсов. Обеспечивает высокое качество воспроизводимых сигналов...
Большой энциклопедический словарь

"ЦИФРОВАЯ ЗАПИСЬ ИНФОРМАЦИИ" в книгах

Цифровая головоломка

Из книги Самые трудные головоломки из старинных журналов автора Таунсенд Чарлз Барри

Цифровая головоломка Эту головоломку придумал знаменитый говорящий носорог Руперт. Расположите четыре цифры - 2,3,4 и 5 - и знаки «+» и «=» таким образом, чтобы получился арифметический пример.Эта головоломка проста только на первый

Цифровая фотокамера

Из книги 100 великих чудес техники автора Мусский Сергей Анатольевич

Цифровая фотокамера В 1989 году фабрика «Свема» выпустила последнюю партию любительской кинопленки формата 8 миллиметров, пять лет назад закрылась последняя лаборатория по проявке этой пленки, а чуть позже из продажи исчезли и все необходимые химикаты… Так, на наших

Запись и воспроизведение информации

Из книги Большая Советская Энциклопедия (ЗА) автора БСЭ

Цифровая система

Из книги Большая Советская Энциклопедия (ЦИ) автора БСЭ

Цифровая видеокамера

Из книги Тысяча и один совет по дому и быту автора Поливалина Любовь Александровна

Цифровая видеокамера Как уже упоминалось, цифровые видеокамеры стоят дороже аналоговых, а потому не всегда доступны обычному потребителю. Запись производится в форматах Digital-8 и MiniDV на DV-кассету.Они имеют все те же функции, которые применяются в аналоговых камерах.

Цифровая Техника

Из книги Путеводитель по журналу "Радио" 1981-2009 гг автора Терещенко Дмитрий

Цифровая Техника Счетчик для электронных часовКоротаев Г.1981, № 1, с. 46. Музыкальная шкатулкаПолин А.1981, № 2, с. 47. Цифровой экспозиметрПсурцев В.1981, № 3, с. 23. Цифровой экспозиметрПсурцев В.1981, № 4, с. 30. Секундомер-таймер из Б3-23Для Народного Хозяйства И БытаЗальцман Ю.1981, № 5, с.

Запись графической информации

Из книги Запись CD и DVD: профессиональный подход автора Бахур Виктор

Запись графической информации Чтобы с помощью InterVideo записать компакт-диск, используя файл-образ, созданный в другой подобной программе, следует щелкнуть мышью на команде Запись с изображения в меню Инструменты. Откроется окно Изображение на диск (рис. 9.8). Рис. 9.8. Окно

8.7. Запись и считывание информации связки ключей из iCloud

автора Нахавандипур Вандад

8.7. Запись и считывание информации связки ключей из iCloud Постановка задачи Требуется сохранить информацию в связке ключей, а также обеспечить хранение этой информации в пользовательской связке ключей, расположенной в облаке iCloud. Так пользователь сможет получать доступ к

12.2. Запись информации в файлы и считывание информации из файлов

Из книги iOS. Приемы программирования автора Нахавандипур Вандад

12.2. Запись информации в файлы и считывание информации из файлов Постановка задачи Требуется сохранить на диске информацию (например, текст, данные, изображения и

Цифровая подпись.

Из книги PGP: Кодирование и шифрование информации с открытым ключом. автора Левин Максим

Цифровая подпись. Огромным преимуществом публичной криптографии также является возможность использования цифровой подписи, которая позволяют получателю сообщения удостовериться в личности отправителя сообщения, а также в целостности (верности) полученного

Глава 25. Обыск. Выемка. Наложение ареста на почтово-телеграфные отправления. Контроль и запись переговоров. Получение информации о соединениях между абонентами и (или) абонентскими устройствами (в ред. Федерального закона от 01.07.2010 N 143-ФЗ)

Из книги Уголовно-процессуальный кодекс Российской Федерации автора Дума Государственная

Глава 25. Обыск. Выемка. Наложение ареста на почтово-телеграфные отправления. Контроль и запись переговоров. Получение информации о соединениях между абонентами и (или) абонентскими устройствами (в ред. Федерального закона от 01.07.2010 N 143-ФЗ) Статья 182. Основания и порядок

Запись контактной информации

Из книги Формула времени. Тайм-менеджмент на Outlook 2007-2010 автора Архангельский Глеб

Запись контактной информации

Из книги Формула времени. Тайм-менеджмент на Outlook 2013 автора Архангельский Глеб

Запись контактной информации Когда людей, с которыми мы общаемся, много, не грех последовать примеру великих и учитывать важные подробности, с этими людьми связанные. Для этого, естественно, такие подробности нужно зафиксировать. Обычная адресная книжка или визитница

ЗАПИСЬ ИНФОРМАЦИИ В ПАМЯТИ

Из книги Улучшаем память - в любом возрасте автора Лапп Даниэль

ЗАПИСЬ ИНФОРМАЦИИ В ПАМЯТИ Представьте себе, что вы хотите записать какой-нибудь текст или песню на магнитофон. Прежде всего вы должны убедиться в том, что ваш аппарат работает исправно. (Аналогичным образом врач должен проверить, нет ли в вашем мозгу

Цифровая разница

Из книги Цифровое пиратство. Как пиратство меняет бизнес, общество и культуру автора Тодд Даррен

Цифровая разница Применительно к продаже цифровых товаров эта модель выглядит еще целесообразнее, потому что, несмотря на риторику индустрии, дефицита в цифровых мультимедиа не ощущается. Каждый может воспроизвести их сколько угодно раз. Однако модель «заплатите,

Все права в отношении данного документа принадлежат авторам. Воспроизведение данного текста или его части допускается только с письменного разрешения обоих авторов.

В последнее время возможности мультимедийного оборудования претерпели значительный рост, однако этой области почему-то не уделяется достаточно внимания. Рядовой пользователь страдает от нехватки информации и вынужден учиться лишь на собственном опыте и ошибках. Этой статьей мы постараемся устранить это досадное недоразумение. Данная статья ориентирована на рядового пользователя и ставит своей целью помочь ему разобраться в теоретических и практических основах цифрового звука, выявить возможности и основные приемы его использования.

Что именно мы знаем о звуковых возможностях компьютера, кроме того, что в нашем домашнем компьютере установлена звуковая плата и две колонки? К сожалению, вероятно из-за недостаточности литературы или по каким-либо другим причинам, но пользователь, чаще всего, не знаком ни с чем, кроме встроенного в Windows микшера аудио входов/выходов и Recorder’а. Единственное использование звуковой карты, которое находит простой пользователь – это вывод звука в играх, да прослушивание коллекции аудио. А, ведь, даже самая простая на сегодняшний день звуковая плата, установленная почти в каждом компьютере, умеет намного больше - она открывает широчайшие возможности для всех, кто любит и интересуется музыкой и звуком, а для тех, кто хочет создавать свою музыку, звуковая карта может стать всемогущим инструментом. Для того чтобы узнать что же умеет компьютер в области звука нужно только поинтересоваться и перед вами откроются возможности, о которых вы, может быть, даже не догадывались. И все это не так сложно, как может показаться на первый взгляд.

Некоторые факты и понятия, без которых тяжело обойтись.

В соответствии с теорией математика Фурье, звуковую волну можно представить в виде спектра входящих в нее частот (рис. 1).

Частотные составляющие спектра - это синусоидальные колебания (так называемые чистые тона), каждое из которых имеет свою собственную амплитуду и частоту. Таким образом, любое, даже самое сложное по форме колебание (например, человеческий голос), можно представить суммой простейших синусоидальных колебании определенных частот и амплитуд. И наоборот, сгенерировав различные колебания и наложив их друг на друга (смикшировав, смешав), можно получить различные звуки.

Справка: человеческий слуховой аппарат/мозг способен различать частотные составляющие звука в пределах от 20 Гц до ~20 КГц (верхняя граница может колебаться в зависимости от возраста и других факторов). Кроме того, нижняя граница сильно колеблется в зависимости от интенсивности звучания.

1. Оцифровка звука и его хранение на цифровом носителе

«Обычный» аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде. Как же происходит преобразование аналогового сигнала в цифровой?

Цифровой звук – это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество» будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот – приблизительно от 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Как этого добиться и как происходит оцифровка? Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть», то есть описать математический вид функции и сохранить в памяти компьютера. Однако практически это невозможно, поскольку звуковые колебания нельзя представить аналитической формулой (как y=x 2 , например). Остается один путь – описать функцию путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям – амплитудной и временной (приближать в точках – значит, говоря простым языком, брать значения функции в точках и записывать их с конечной точностью). Таким образом, оцифровка сигнала включает в себя два процесса - процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации - это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени (рис. 2).

Квантование - процесс замены реальных значений сигнала приближенными с определенной точностью (рис. 3). Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим. Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Теперь о практических проблемах. Во-первых, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

Во-вторых, согласно теореме Котельникова частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения (под фразой «в цифровом звуке есть такие-то частоты и шумы» подразумевается, что когда этот звук будет преобразован обратно из цифрового вида в аналоговый, то в его звучании будут присутствовать упомянутые частоты и шумы). Так, например, джиттер (jitter) – шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к «захвату» не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. Как мы говорили, при квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.

Небольшая справка: стандартные параметры записи аудио компакт-дисков следующие: частота дискретизации - 44.1 КГц, уровень квантования – 16 бит. Такие параметры соответствуют 65536 (2 16) уровням квантования амплитуды при взятии ее значений 44100 раз в секунду.

На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя - всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

2. Преобразование звука из цифрового вида в аналоговый

Как после оцифровки прослушивать звук? То есть, как преобразовывать его обратно из цифрового вида в аналоговый?

Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала (рис. 4).

Еще совсем недавно воспроизведение звука в домашних компьютерах было проблемой, так как компьютеры не оснащались специальными ЦАП. Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker). Вообще говоря, этот динамик до сих пор имеется почти во всех PC, но никто уже не помнит как его «раскачать», чтобы он заиграл. Если вкратце, то этот динамик присоединен к порту на материнской плате, у которого есть два положения – 1 и 0. Так вот, если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом он «плавно раскачивается» вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox – это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый – то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты, подключаемой либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом. Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно) в режимРис. Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнямиРис. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.

3. Способы хранения цифрового звука

Для хранения цифрового звука существует много различных способов. Как мы говорили, оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени. Таким образом, во-первых, блок оцифрованной аудио информации можно записать в файл «как есть», то есть последовательностью чисел (значений амплитуды). В этом случае существуют два способа хранения информации.

Первый (рис. 5) - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд (бывают знаковое или беззнаковое представления). Именно в таком виде записаны данные на всех аудио CD. Второй способ (рис. 6) - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Во-вторых, можно сжать или упростить данные так, чтобы они занимали меньший объем памяти, нежели будучи записанными «как есть». Тут тоже имеются два пути.

Кодирование данных без потерь (lossless coding) - это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Например, после сведения звука в студии звукозаписи, данные необходимо сохранить в архиве в оригинальном качестве для возможного последующего использования. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры – это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио.

Имеется и второй путь кодирования, на котором мы остановимся чуть подробнее, – кодирование данных с потерями (lossy coding).Цель такого кодирования - любыми способами добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это достигается путем использования различных алгоритмов «упрощающих» оригинальный сигнал (выкидывая из него «ненужные» слабослышимые детали), что приводит к тому, что декодированный сигнал фактически перестает быть идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). Надо особо подчеркнуть, что в основе всех lossy-кодеров лежит использование так называемой психоакустической модели, которая как раз и занимается «упрощением» оригинального сигнала. Говоря точнее, механизм подобных кодеров выполняет анализ кодируемого сигнала, в процессе которого определяются участки сигнала, в определенных частотных областях которых имеются неслышные человеческому уху нюансы (замаскированные или неслышимые частоты), после чего происходит их удаление из оригинального сигнала. Таким образом, степень сжатия оригинального сигнала зависит от степени его «упрощения»; сильное сжатие достигается путем «агрессивного упрощения» (когда кодер «считает» ненужными множественные нюансы), такое сжатие, естественно, приводит к сильной деградации качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания.

Как мы сказали, современных lossy-кодеров существует достаточно много. Наиболее распространенный формат – MPEG-1 Layer III (всем известный MP3). Формат завоевал свою популярность совершенно заслуженно – это был первый распространенный кодек подобного рода, который достиг столь высокого уровня компрессии при отличном качестве звучания. Сегодня этому кодеку имеется множество альтернатив, выбор остается за пользователем. К сожалению, рамки статьи не позволяют привести здесь тестирования и сравнения существующих кодеков, однако авторы статьи позволят себе привести некоторую информацию, полезную при выборе кодека. Итак, преимущества MP3 – широкая распространенность и достаточно высокое качество кодирования, которое объективно улучшается благодаря разработкам различных кодеров MP3 энтузиастами (например, кодер Lame). Мощная альтернатива MP3 – кодек Microsoft Windows Media Audio (Файлы.WMA и.ASF). По различным тестам этот кодек показывает себя от «как MP3» до «заметно хуже MP3» на средних битрейтах, и, чаще, «лучше MP3» на низких битрейтах. Ogg Vorbis (файлы.OGG) – совершенно свободный от лицензирования кодек, создаваемый независимыми разработчиками. Чаще всего ведет себя лучше MP3, недостатком является лишь малая распространенность, что может стать критическим аргументом при выборе кодека для длительного хранения аудио. Вспомним и еще молодой кодек MP3 Pro, анонсированный в июле 2001 года компанией Coding Technologies совместно с Thomson Multimedia. Кодек является продолжением, или, точнее, развитием старого MP3 – он совместим с MP3 назад (полностью) и вперед (частично). За счет использования новой технологии SBR (Spectral Band Replication), кодек ведет себя заметно лучше других форматов на низких битрейтах, однако качество кодирования на средних и высоких битрейтах чаще уступает качеству почти всех описанных кодеков. Таким образом, MP3 Pro пригоден больше для ведения аудио трансляций в Internet, а также для создания превью песен и музыки.

Говоря о способах хранения звука в цифровом виде нельзя не вспомнить и о носителях данных. Всем привычный аудио компакт-диск, появившийся в начале 80-х годов, широкое распространение получил именно в последние годы (что связано с сильным удешевлением носителя и приводов). А до этого носителями цифровых данных являлись кассеты с магнитной лентой, но не обычные, а специально предназначенные для так называемых DAT-магнитофонов. Ничего примечательного – магнитофоны как магнитофоны, однако цена на них всегда была высокой, и такое удовольствие было не всем «по зубам». Эти магнитофоны использовались, в основном, в студиях звукозаписи. Преимущество таких магнитофонов было в том, что, не смотря на использование привычных носителей, данные на них хранились в цифровом виде и практически никаких потерь при чтении/записи на них не было (что очень важно при студийной обработке и хранении звука). Сегодня появилось большое количество различных носителей данных, кроме привычных всем компакт дисков. Носители совершенствуются и с каждым годом становятся более доступными и компактными. Это открывает большие возможности в области создания мобильных аудио проигрывателей. Уже сегодня продается огромное количество различных моделей переносных цифровых плееров. И, можно предположить, что это еще далеко не пик развития такого рода техники.

4. Преимущества и недостатки цифрового звука

С точки зрения обычного пользователя выгоды много - компактность современных носителей информации позволяет ему, например, перевести все диски и пластинки из своей коллекции в цифровое представление и сохранить на долгие годы на небольшом трехдюймовом винчестере или на десятке-другом компакт дисков; можно воспользоваться специальным программным обеспечением и хорошенько «почистить» старые записи с бобин и пластинок, удалив из их звучания шумы и треск; можно также не просто скорректировать звучание, но и приукрасить его, добавить сочности, объемности, восстановить частоты. Помимо перечисленных манипуляций со звуком в домашних условиях, Интернет тоже приходит на помощь аудио-любителю. Например, сеть позволяет людям обмениваться музыкой, прослушивать сотни тысяч различных Интернет-радио станций, а также демонстрировать свое звуковое творчество публике, и для этого нужен всего лишь компьютер и Интернет. И, наконец, в последнее время появилась огромная масса различной портативной цифровой аудио аппаратуры, возможности даже самого среднего представителя которой зачастую позволяют с легкостью взять с собой в дорогу коллекцию музыки, равную по длительности звучания десяткам часов.

С точки зрения профессионала цифровой звук открывает поистине необъятные возможности. Если раньше звуковые и радио студии размещались на нескольких десятках квадратных метров, то теперь их может заменить хороший компьютер, который по возможностям превосходит десять таких студий вместе взятых, а по стоимости оказывается многократно дешевле одной. Это снимает многие финансовые барьеры и делает звукозапись более доступной и профессионалу и простому любителю. Современное программное обеспечение позволяет делать со звуком все что угодно. Раньше различные эффекты звучания достигались с помощью хитроумных приспособлений, которые не всегда являли собой верх технической мысли или же были просто устройствами кустарного изготовления. Сегодня, самые сложные и просто невообразимые раньше эффекты достигаются путем нажатия пары кнопок. Конечно, вышесказанное несколько утрировано и компьютер не заменяет человека – звукооператора, режиссера или монтажера, однако с уверенностью можно сказать, что компактность, мобильность, колоссальная мощность и обеспечиваемое качество современной цифровой техники, предназначенной для обработки звука, уже сегодня почти полностью вытеснило из студий старую аналоговую аппаратуру.

Конечно, цифровая техника тоже имеет свои недостатки. Многие (профессионалы и любители) отмечают, что аналоговый звук слушался живее. И это не просто дань прошлому. Как мы сказали выше, процесс оцифровки вносит определенную погрешность в звучание, кроме того, различная усиливающая цифровая аппаратура привносит так называемые «транзисторные шумы» и другие специфические искажения. Термину «транзисторный шум», пожалуй, нет точного определения, но можно сказать, что это хаотичные колебания в области высоких частот. Не смотря на то, что слуховой аппарат человека способен воспринимать частоты до 20 кГц, похоже, все-таки, человеческий мозг улавливает и более высокие частоты. И именно на подсознательном уровне человек все же ощущает аналоговое звучание чище, чем цифровое.

Впрочем, у цифрового представления данных есть одно неоспоримое и очень важное преимущество – при сохранном носителе данные на нем не искажаются с течением времени. Если магнитная лента со временем размагничивается и качество записи теряется, если пластинка царапается и к звучанию прибавляются щелчки и треск, то компакт-диск / винчестер / электронная память либо читается (в случае сохранности), либо нет, а эффект старения отсутствует. Важно отметить, мы не говорим здесь об Audio CD (CD-DA – стандарт, устанавливающий параметры и формат записи на аудио компакт диски) так как не смотря на то, что это носитель цифровой информации, эффект старения его, все же, не минует. Это связано с особенностями хранения и считывания аудио данных с Audio CD. Информация на всех типах компакт-дисков хранится покадрово и каждый кадр имеет заголовок, по которому его возможно идентифицировать. Однако различные типы CD имеют различную структуру и используют различные методы маркировки кадров. Поскольку компьютерные приводы CD-ROM рассчитаны на чтение в основном Data-CD (надо сказать, что существуют различные разновидности стандарта Data-CD, каждый из которых дополняет основной стандарт CD-DA), они часто не способны правильно «ориентироваться» на Audio CD, где способ маркировки кадров отличен от Data-CD (на аудио CD кадры не имеют специального заголовка и для определения смещения каждого кадра необходимо следить за информацией в кадре). Это означает, что если при чтении Data-CD привод легко «ориентируется» на диске и никогда не перепутает кадры, то при чтении с аудио компакт диска привод не может ориентироваться четко, что при появлении, скажем, царапины или пыли может привести к чтению неправильного кадра и, как следствие, скачку или треску звучания. Эта же проблема (неспособность большинства приводов правильно позиционироваться на CD-DA) является причиной еще одного неприятного эффекта: копирование информации с Audio CD вызывает проблемы даже при работе с полностью сохранными дисками вследствие того, что правильное «ориентирование на диске» полностью зависит от считывающего привода и не может быть четко проконтролировано программным путем.

Повсеместное распространение и дальнейшее развитие уже упомянутых lossy-кодеров аудио (MP3, AAC и других) открыло широчайшие возможности распространения и хранения аудио. Современные каналы связи уже давно позволяют пересылать большие массивы данных за сравнительно небольшое время, однако самой медленной остается передача данных между конечным пользователем и поставщиком услуг связи. Телефонные линии, по которым пользователи в большинстве своем связываются с Интернетом, не позволяют осуществлять быструю передачу данных. Нечего и говорить, что такие объемы данных, какие занимает несжатая аудио и видео информация, передавать по привычным каналам связи придется очень долго. Однако появление lossy-кодеров, обеспечивающих десяти-пятнадцати кратное сжатие, превратило передачу и обмен аудио данными в повседневное занятие каждого пользователя Интернета и сняло все преграды, образованные слабыми каналами связи. Касательно этого нужно сказать, что развивающаяся сегодня семимильными шагами цифровая мобильная связь во многом обязана именно lossy-кодированию. Дело в том, что протоколы передачи аудио по каналам мобильной связи работают на приблизительно тех же принципах, что и известные всем музыкальные кодеры. Поэтому дальнейшее развитие в области кодирования аудио неизменно ведет к уменьшению стоимости передачи данных в мобильных системах, от чего конечный пользователь только выигрывает: дешевеет связь, появляются новые возможности, продлевается время работы батарей мобильных устройств и т.д. Не в меньшей степени lossy-кодирование помогает экономить деньги на покупке дисков с любимыми песнями – сегодня стоит только зайти в Интернет и там можно найти почти любую интересующую песню. Безусловно, такое положение вещей давно «мозолит глаза» звукозаписывающим компаниям – у них под носом люди вместо покупки дисков обмениваются песнями прямо через Интернет, что превращает некогда золотое дно в малоприбыльный бизнес, но это уже вопрос этики и финансов. Одно можно сказать с уверенностью: с таким положением вещей уже ничего нельзя поделать и бум обмена музыкой через Интернет, порожденный именно появлением lossy-кодеров, уже ничем не остановить. А это только на руку рядовому пользователю.

5. К вопросу об обработке звука

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Обсуждение каждого из названных типов преобразований может стать целым научным трудом. Стоит привести несколько практических примеров использования указанных видов преобразований при создании реальных звуковых эффектов:

Echo (эхо) Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того, чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.
Reverberation (повторение, отражение). Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически, с помощью реверберации можно «оживить», например, фонограмму, сделанную в заглушенном помещении. От эффекта «эхо» реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного. Иными словами, блок реверберации упрощенно представляет собой петлю, где выход блока подключен к его входу, таким образом уже обработанный сигнал каждый цикл снова подается на вход смешиваясь с оригинальным сигналом.
Chorus (хор). В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием со входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

Безусловно, как и во всех других областях, в обработке сигналов также имеются проблемы, которые являются своего рода камнем преткновения. Так, например, при разложении сигналов в спектр частот существует принцип неопределенности, который невозможно преодолеть. Принцип гласит, что нельзя получить точную спектральную картину сигнала в конкретный момент времени: либо для получения более точной спектральной картины нужно проанализировать больший временной участок сигнала, либо, если нас интересует больше время, когда происходило то или иное изменение спектра, нужно пожертвовать точностью самого спектра. Иными словами нельзя получить точный спектр сигнала в точке - точный спектр для большого участка сигнала, либо очень приблизительный спектр, но для короткого участка.

Механизмы для обработки сигналов существуют как в программном, так и в аппаратном исполнениях (так называемые эффект-процессоры). Например, вокодеры и гитарные процессоры, хорусы и ревербераторы существуют в виде аппаратуры, а также в виде программ.

Практическую обработку сигналов можно разделить на два типа: обработка «на лету» и пост-обработка. Обработка «на лету» подразумевает мгновенное преобразование сигнала (то есть с возможностью осуществлять вывод обработанного сигнала почти одновременно с его вводом). Простой пример – гитарные «примочки» или реверберация во время живого исполнения на сцене. Такая обработка происходит мгновенно, то есть, скажем, исполнитель поет в микрофон, а эффект-процессор преобразует его голос и слушатель слышит уже обработанный вариант голоса. Пост-обработка – это обработка уже записанного сигнала. Скорость такой обработки может быть сильно ниже скорости воспроизведения. Такая обработка преследует те же цели, то есть придание звуку определенного характера, либо изменение характеристик, однако применяется на стадии мастеринга или подготовки звука к тиражированию, когда не требуется спешка, а важнее качество и скрупулезная проработка всех нюансов звучания. Существует множество различных операций над звуком, которые вследствие недостаточной производительности сегодняшних процессоров нельзя реализовать «на лету», поэтому такие преобразования проводят лишь в пост-режиме.

Обработка сигнала – это сложная и, главное, ресурсоемкая процедура. Она сравнительно недавно стала проводиться в цифровых устройствах – раньше различные эффекты звучания и другие достигались путем обработки звука в аналоговых приборах. В аналоговой аппаратуре звук в виде электрических колебаний проходит через различные тракты (блоки электрических элементов), чем достигается изменение фазы, спектра и амплитуды сигнала. Однако такой способ обработки имеет массу недостатков. Во-первых, страдает качество обработки, ведь каждый аналоговый элемент имеет свою погрешность, а несколько десятков элементов могут критически повлиять на точность и качество желаемого результата. А во-вторых, и это, пожалуй, самое главное, почти каждый отдельный эффект достигается путем использования отдельного устройства, когда каждое такое устройство может стоить очень дорого. Возможность же использования цифровых устройств имеет неоспоримые преимущества. Качество обработки сигналов в них намного меньше зависит от качества аппаратуры, главное – это качественно оцифровать звук и иметь возможность качественно его воспроизводить, и тогда качество обработки ложится уже только на программный механизм. Кроме того, для различных манипуляций со звуком не требуется постоянная смена оборудования. И, самое главное, поскольку обработка ведется программным путем, для нее открываются просто невероятные возможности, которые ограничены лишь мощностью компьютеров (а она увеличивается с каждым днем) и фантазией человека. Однако, (по крайней мере сегодня) здесь имеются и свои неприятности. Так, например, часто, даже для осуществления несложной обработки сигнала необходимо осуществить его разложение в спектр частот. В этом случае обработка сигнала на лету может быть затруднена именно из-за ресурсоемкости этапа разложения. Поэтому преобразования, требующие спектрального разложения, выполняют чаще в пост-режиме.

6. Аппаратура

Немаловажная часть разговора о звуке связана с аппаратурой. Существует много различных устройств для обработки и ввода/вывода звука. Касательно обычного персонального компьютера следует подробнее остановиться на звуковых картах. Звуковые карты принято делить на звуковые, музыкальные и звукомузыкальные. По конструкции же все звуковые платы можно разделить на две группы: основные (устанавливаемые на материнской плате компьютера и обеспечивающие ввод и вывод аудио данных) и дочерние (имеют принципиальное конструктивное отличие от основных плат - они чаще всего подключаются к специальному разъему, расположенному на основной плате). Дочерние платы служат чаще всего для обеспечения или расширения возможностей MIDI-синтезатора.

Звукомузыкальные и звуковые платы выполняются в виде устройств, вставляемых в слот материнской платы (либо уже встроены в нее изначально). Визуально они имеют обычно два аналоговых входа - линейный и микрофонный, и несколько аналоговых выходов: линейные выходы и выход для наушников. В последнее время карты стали оснащаться также и цифровым входом и выходом, обеспечивающим передачу аудио между цифровыми устройствами. Аналоговые входы и выходы обычно имеют разъемы, аналогичные разъемам головных наушников (1/8”). Вообще, входов у звуковой платы немного больше, чем два: аналоговые CD, MIDI и другие входы. Они, в отличие от микрофонного и линейного входов, расположены не на задней панели звуковой платы, а на самой плате; могут иметься и другие входы, например, для подключения голосового модема. Цифровые входы и выходы обычно выполнены в виде интерфейса S/PDIF (интерфейс цифровой передачи сигналов) с соответствующим разъемом (S/PDIF – сокращение от Sony/Panasonic Digital Interface - цифровой интерфейс Sony/Panasonic). S/PDIF - это «бытовой» вариант более сложного профессионального стандарта AES/EBU (Audio Engineering Society / European Broadcast Union). Сигнал S/PDIF используется для цифровой передачи (кодирования) 16-разрядных стерео данных с любой частотой дискретизации. Помимо перечисленного, на звукомузыкальных платах имеется MIDI-интерфейс с разъемами для подключения MIDI-устройств и джойстиков, а также для подсоединения дочерней музыкальной карты (хотя в последнее время возможность подключения последней становится редкостью). Некоторые модели звуковых карт для удобства пользователя оснащаются фронтальной панелью, устанавливаемой на лицевой стороне системного блока компьютера, на которой размещаются разъемы, соединенные с различными входами и выходами звуковой карты.

Определим несколько основных блоков, из которых состоят звуковые и звукомузыкальные платы.

1. Блок цифровой обработки сигналов (кодек). В этом блоке осуществляются аналого-цифровые и цифро-аналоговые преобразования (АЦП и ЦАП). От этого блока зависят такие характеристики карты, как максимальная частота дискретизации при записи и воспроизведении сигнала, максимальный уровень квантования и максимальное количество обрабатываемых каналов (моно или стерео). В немалой степени от качества и сложности составляющих этого блока зависят и шумовые характеристики.

2. Блок синтезатора. Присутствует в музыкальных картах. Выполняется на основе либо FM-, либо WT-синтеза, либо на обоих сразу. Может работать как под управлением собственного процессора, так и под управлением специального драйвера.

3. Интерфейсный блок. Обеспечивает передачу данных по различным интерфейсам (например, S/PDIF). У чисто звуковой карты этот блок чаще отсутствует.

4. Микшерный блок. В звуковых платах микшерный блок обеспечивает регулировку:

уровней сигналов с линейных входов;
уровней с MIDI входа и входа цифрового звука;
уровня общего сигнала;
панорамирования;
тембра.

Рассмотрим важнейшие параметры, характеризующие звуковые и звукомузыкальные платы. Наиболее важными характеристиками являются: максимальная частота дискретизации (sampling rate) в режиме записи и в режиме воспроизведения, максимальный уровень квантования или разрядность (max. quantization level) в режиме записи и воспроизведения. Кроме того, так как звукомузыкальные платы имеют еще и синтезатор, то к их характеристикам относят и параметры установленного синтезатора. Естественно, чем с большим уровнем квантования карта способна кодировать сигналы, тем большее качество сигнала при этом достигается. Все современные модели звуковых карт способны кодировать сигнал с уровнем 16 бит. Одной из важных характеристик является возможность одновременного воспроизведения и записи звуковых потоков. Особенность карты одновременно воспроизводить и записывать называют полнодуплексной (full duplex). Есть еще одна характеристика, которая зачастую играет решающую роль при покупке звуковой карты - отношение сигнал/шум (Signal/Noise Ratio, S/N). Этот показатель влияет на чистоту записи и воспроизведения сигнала. Отношение сигнал/шум – это отношение мощности сигнала к мощности шума на выходе устройства, этот показатель принято измерять в дБ. Хорошим можно считать отношение 80-85 дБ; идеальным – 95-100 дБ. Однако нужно учитывать, что на качество воспроизведения и записи сильно влияют наводки (помехи) со стороны других компонент компьютера (блока питания и проч.). В результате этого отношение сигнал/шум может изменяться в худшую сторону. На практике методов борьбы с этим существует достаточно много. Некоторые предлагают заземлить компьютер. Другие, дабы как можно более тщательно уберечь звуковую карту от наводок, «выносят» ее за пределы корпуса компьютера. Однако полностью уберечься от наводок очень тяжело, так как даже элементы самой карты создают наводки друг на друга. С этим тоже пытаются бороться и для этого экранируют каждый элемент на плате. Но сколько бы усилий не прилагалось к решению этой проблемы, полностью исключить влияние внешних помех невозможно.

Еще одна не менее важная характеристика – коэффициент нелинейных искажений или Total Harmonic Distortion, THD. Этот показатель также критическим образом влияет на чистоту звучания. Коэффициент нелинейных искажений измеряется в процентах: 1% - «грязное» звучание; 0.1% - нормальное звучание; 0.01% - чистое звучание класса Hi-Fi; 0.002% - звучание класса Hi-Fi – Hi End.. Нелинейные искажения – результат неточности в восстановлении сигнала из цифрового вида в аналоговый. Упрощенно, процесс измерения этого коэффициента проводится следующим образом. На вход звуковой карты подается чистый синусоидальный сигнал. На выходе устройства снимается сигнал, спектр которого представляет собой сумму синусоидальных сигналов (сумма исходной синусоиды и ее гармоник). Затем по специальной формуле рассчитывается количественное соотношение исходного сигнала и его гармоник, полученных на выходе устройства. Это количественное соотношение и есть коэффициент нелинейных искажений (THD).

Что такое MIDI-синтезатор? Термин «синтезатор» обычно используется применительно к электронному музыкальному инструменту, в котором звук создается и обрабатывается, меняя свою окраску и характеристики. Естественно, название этого устройства пошло от его основного предназначения – синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation – частотная модуляция) и WT (Wave Table – таблично-волновой). Поскольку мы не можем здесь подробно останавливаться на их рассмотрении, опишем лишь основную идею методов. В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является по сути суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными (оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.

MIDI-синтезатор – это синтезатор, отвечающий требованиям стандарта, о котором мы сейчас поговорим. MIDI – это общепринятая спецификация, связанная с организацией цифрового интерфейса для музыкальных устройств, включающая в себя стандарт на аппаратную и программную части.

Эта спецификация предназначена для организации локальной сети электронных инструментов (рис. 7). К MIDI-устройствам относятся различные аппаратные и музыкальные инструменты, отвечающие требованиям MIDI. Таким образом, MIDI-синтезатор – это музыкальный инструмент, предназначенный обычно для синтеза звука и музыки, а также удовлетворяющий спецификации MIDI. Давайте разберемся кратко, почему выделен отдельный класс устройств, названный MIDI.

Дело в том, что осуществление программной обработки звука часто сопряжено с неудобствами, обусловленными различными техническими особенностями этого процесса. Даже возложив операции по обработке звука на звуковую карту или любую другую аппаратуру, остается множество различных проблем. Во-первых, зачастую желательно пользоваться аппаратным синтезом звучания музыкальных инструментов (как минимум потому, что компьютер – это слишком общий инструмент, часто необходим просто аппаратный синтезатор звуков и музыки, не более). Во-вторых, программная обработка звука часто сопровождается временными задержками, в то время как при концертной работе необходимо мгновенное получение обработанного сигнала. По этим и другим причинам и прибегают к использованию специальной аппаратуры для обработки, а не компьютеров со специальными программами. Однако при использовании аппаратуры возникает необходимость в едином стандарте, который позволил бы соединять устройства друг с другом и комбинировать их. Эти предпосылки и заставили в 1982 году несколько ведущих в области музыкального оборудования компаний утвердить первый MIDI-стандарт, который впоследствии получил продолжение и развивается по сей день. Что же в конечном счете представляет собой MIDI-интерфейс и устройства в него входящие с точки зрения персонального компьютера?

Аппаратно - это установленные на звуковой карте: синтезатор различных звуков и музыкальных инструментов, микропроцессор, контролирующий и управляющий работу MIDI-устройств, а также различные стандартизованные разъемы и шнуры для подключения дополнительных устройств.
Программно - это протокол MIDI, представляющий собой набор сообщений (команд), которые описывают различные функции системы MIDI и с помощью которых осуществляется связь (обмен информацией) между устройствами MIDI. Сообщения можно рассматривать как средство удаленного управления.

Рамки данной статьи не позволяют нам углубляться в частности описания MIDI, следует отметить однако, что в отношении синтезаторов звука MIDI устанавливает строгие требования к их возможностям, примененным в них способам синтеза звука, а также к управляющим параметрам синтеза. Кроме того, для того, чтобы музыка созданная на одном синтезаторе могла бы быть легко перенесена и успешно воспроизведена на другом, были установлены несколько стандартов на соответствие инструментов (голосов) и их параметров в различных синтезаторах: стандарт General MIDI (GM), General Synth (GS) и eXtended General (XG). Базисным стандартом является GM, остальные два являются его логическими продолжениями и расширениями.

В качестве практического примера устройства MIDI, можно рассмотреть обычную MIDI-клавиатуру. Упрощенно, MIDI-клавиатура представляет собой укороченную клавиатуру рояля в корпусе с которой находится MIDI-интерфейс, позволяющий подключать ее к другим MIDI-устройствам, например, к MIDI-синтезатору, который установлен в звуковой карте компьютера. Используя специальное программное обеспечение (например, MIDI-секвенсор) можно включить MIDI-синтезатор в режим игры, например, на рояле, и нажимая на клавиши MIDI-клавиатуры слышать звуки рояля. Естественно, что роялем дело не ограничивается – в стандарте GM имеются 128 мелодических инструментов и 46 ударных. Кроме того, используя MIDI-секвенсор можно записывать исполняемые на MIDI-клавиатуре ноты в компьютер, для последующего редактирования и аранжировки, либо просто для элементарной распечатки нот.

Надо отметить, что поскольку MIDI-данные – это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура – это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим MIDI-файлы (.MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).

Вернемся к рассмотрению звукомузыкальных плат. Поскольку мы уже уточнили, что такое MIDI, нельзя обойти стороной характеристики встроенного аппаратного синтезатора звуковой карты. Современный синтезатор, чаще всего, основан на так называемой «волновой таблице» - WaveTable (вкратце, принцип работы такого синтезатора состоит в том, что звук в нем синтезируется из набора записанных звуков путем их динамического наложения и изменения параметров звучания), раньше же основным типом синтеза являлся FM (Frequency Modulation – синтез звука посредством генерирования простых синусоидальных колебаний и их смешения). Основными характеристиками WT-синтезатора являются: количество инструментов в ПЗУ и его объем, наличие ОЗУ и его максимальный объем, количество возможных эффектов обработки сигналов, а также возможность поканальной эффект-обработки (конечно, в случае наличия эффект-процессора), количество генераторов, определяющих максимальное число голосов в полифоническом (многоголосном) режиме и, может быть самое главное, стандарт, в соответствии с которым выполнен синтезатор (GM, GS или XG). Кстати, объем памяти синтезатора - не всегда величина фиксированная. Дело в том, что в последнее время синтезаторы перестали иметь свое ПЗУ, а пользуются основным ОЗУ компьютера: в этом случае все используемые синтезатором звуки хранятся в файле на диске и при необходимости считываются в ОЗУ.

7. Программное обеспечение

Тема программного обеспечения очень широка, поэтому здесь мы только вкратце обсудим основные представители программ для обработки звука.

Наиболее важный класс программ – редакторы цифрового аудио . Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами (как встроенными, так и подключаемыми извне – об этом позже), очистка от шумов, имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторые из таких программ: Cool Edit Pro (Syntrillium), Sound Forge (Sonic Foundry), Nuendo (Steinberg), Samplitude Producer (Magix), Wavelab (Steinberg).

Основные возможности редактора Cool Edit Pro 2.0 (см. Скриншот 1 - пример рабочего окна программы в многодорожечном режиме): редактирование и сведение аудио на 128 дорожках, 45 встроенных DSP-эффектов, включая инструменты для мастеринга, анализа и реставрации аудио, 32-битная обработка, поддержка аудио с параметрами 24 бит / 192 КГц, мощный инструментарии для работы с петлями (loops), поддержка DirectX, а также управление SMPTE/MTC, поддержка работы с видео и MIDI и прочее.

Скриншот 1

Основные возможности редактора Sound Forge 6.0a (см. Скриншот 2 - пример рабочего окна программы): мощные возможности не деструктивного редактирования, многозадачная фоновая обработка заданий, поддержка файлов с параметрами до 32 бит / 192 КГц, менеджер предустановок, поддержка файлов более 4 Гб, работа с видео, большой набор эффектов обработки, восстановление после зависаний, предпрослушивание примененных эффектов, спектральный анализатор и прочее.

Скриншот 2

Не менее важная в функциональном смысле группа программ – секвенсоры (программы для написания музыки). Чаще всего, такие программы используют MIDI-синтезатор (аппаратный внешний или встроенный почти в любую звуковую карту, либо программный, организуемый специальным программным обеспечением). Такие программы предоставляют пользователю либо привычный нотный стан (как, например, программа Finale от CODA), либо более распространенный способ редактирования аудио на компьютере, так называемый, piano-roll (это более понятное представление музыки для людей, не знакомых с нотами; в таком представлении вертикально имеется ось с изображением клавиш пианино, а горизонтально откладывается время, таким образом, ставя на пересечении штрихи разной длинны, добиваются звучания определенной ноты с определенной продолжительностью). Встречаются и программы, позволяющие просматривать и редактировать аудио в обоих представлениях. Развитые секвенсоры помимо редактирования аудио во многом могут дублировать возможности редакторов цифрового аудио – осуществлять запись на CD, совмещать MIDI-дорожки с цифровыми сигналами и осуществлять мастеринг. Яркие представители такого класса программ: Cubase (Steinberg), Logic Audio (Emagic), Cakewalk (Twelve Tone Systems) и уже упомянутый Finale.

Основные возможности редактора Cubase 5.1 (см. Скриншот 3 – пример рабочего окна программы в режиме просмотра MIDI дорожек): редактирование музыки в реальном времени используя графическое представление информации, высокое разрешение редактора (15360 пульсов на четверть), практически не лимитированное количество дорожек, 72 аудио канала, поддержка VST32, 4 эквалайзера на канал и другие поканальные эффекты, встроенные инструменты обработки с использованием аналогового моделирования (виртуальные инструменты, эффект процессоры, инструменты микширования и записи) и множество других возможностей.

Скриншот 3

Основные возможности редактора Logic Audio 5 (см. Скриншот 4 – пример рабочего окна программы): работа со звука при точности в 32 бита, высокое временное разрешение событий, самоадаптируемый микшер аудио и MIDI, оптимизируемый интерфейс пользователя, синхронизация с видео, виртуально неограниченное число MIDI-дорожек, обработка звука в реальном времени, полная синхронизация с MTC, MMC, SMPTE, встроенные модули обработки и автоинструменты, поддержка большого количество аппаратного оборудования, а также множество других возможностей.

Скриншот 4

В наборе программ пользователя, занимающегося обработкой звука, имеется множество разных инструментов, так было раньше и так будет впредь – универсальных комбайнов для работы со звуком не бывает. Однако, не смотря на все разнообразие ПО, в программах часто используются схожие механизмы для обработки звука (например, процессоры эффектов и прочие). На каком-то этапе разработки аудио ПО, производители поняли, что удобнее сделать в своих программах возможность подключения внешних инструментов, чем каждый раз создавать заново инструменты для каждой отдельной программы. Так что многие программы, относящиеся к той или иной группе ПО, позволяют подключать так называемые «плаг-ины» - внешние подключаемые модули, расширяющие возможности обработки звука. Это стало возможным в результате появления нескольких стандартов на интерфейс между программой и подключаемым модулем. На сегодняшний день существуют два основных стандарта на интерфейс: DX и VST. Существование стандартов позволяет подключать один и тот же плаг-ин к совершенно разным программам, не заботясь о возникновении конфликтов и неполадок. Говоря о самих плаг-инах, надо сказать, что это просто огромное семейство программ. Обычно, один плаг-ин является механизмом, реализующим какой-то конкретный эффект, например, реверберацию или низкочастотный фильтр. Из интересных плаг-инов можно вспомнить, например iZotope Vinyl, - он позволяет придать звучанию эффект виниловой пластинки (см. Скриншот 5 – пример рабочего окна плаг-ина в среде Cool Edit Pro), Antares AutoTune позволяет в полуавтоматическом режиме корректировать звучание вокала, а Orange Vocoder являет собой замечательный вокодер (механизм для придания звучанию различных инструментов схожести со звучанием голоса человека).

Скриншот 5

Обработка звука и написание музыки – это не только творческий процесс. Иногда нужен скрупулезный анализ данных, а также осуществление поиска огрехов их звучания. Кроме того, аудио материал, с который приходится иметь дело, не всегда желаемого качества. В этой связи нельзя не вспомнить о целом ряде программ-анализаторов аудио, специально предназначенных для осуществления измерительных анализов аудио данных. Такие программы помогают представить аудио данные удобнее, чем обычные редакторы, а также внимательно изучить их с помощью различных инструментов, таких как FFT-анализаторы (построители динамических и статических амплитудно-частотных характеристик), построители сонограмм, и прочих. Одна из наиболее известных и развитых программ подобного плана – программа SpectraLAB (Sound Technology Inc.), чуть более простые, но мощные – Analyzer2000 и Spectrogram.

Программа SpectraLAB – наиболее мощный продукт подобного рода, существующий на сегодня (см. Скриншот 6 – пример рабочего окна программы, на экране: спектральная картина в трез представлениях и фазовая картина). Возможности программы: 3 режима работы (пост режим, режим реального времени, режим записи), основной инструментарий – осциллограф, спектрометр (двухмерный, трехмерный, а также построитель сонограмм) и фазометр, возможность сравнения амплитудно-частотных характеристик нескольких сигналов, широкие возможности масштабирования, измерительные инструменты: нелинейных искажений, отношения сигнал/шум, искажений и прочие.

Скриншот 6

Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудио-кассет, и провести другую корректировку аудио. Программы подобного рода: Dart, Clean (от Steinberg Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.

Основные возможности реставратора Clean 3.0 (см. Скриншот 8 – рабочее окно программы): устранение всевозможных потрескиваний и шумов, режим автокоррекции, набор эффектов для обработки скорректированного звука, включая функцию «surround sound» с наглядным акустическим моделированием эффекта, запись CD с подготовленными данными, «интеллигентная» система подсказок, поддержка внешних VST плаг-инов и другие возможности.

Скриншот 8

Трекеры – это отдельная категория звуковых программ, предназначенных именно для создания музыки. Ранее мы рассмотрели два принципиально отличных способа хранения звуковых данных (музыки): первый - хранение звука в виде сжатого или несжатого потока аудио, второй - хранение музыки в виде MIDI-файлов (в виде набора команд MIDI-синтезатору). Структура и концепция построения трекерных файлов очень похожа на принцип хранения MIDI-информации. В трекерных модулях (файлы, созданные в трекерах, принято называть модулями), также, как и в MIDI-файлах, содержится партитура в соответствии с которой должны проигрываться инструменты. Кроме того, в них содержится информация о том, какие эффекты и в какой момент времени должны быть применены при проигрывании того или иного инструмента. Однако, принципиальное отличие трекерных модулей от MIDI-файлов заключается в том, что проигрываемые в этих модулях инструменты (или, точнее сказать, сэмплы) хранятся в самих модулях (то есть внутри файлов), а не в синтезаторе (как это происходит в случае с MIDI). Такой способ хранения музыки имеет массу преимуществ: размер файлов невелик по сравнению с непрерывной оцифрованной музыкой (поскольку записываются только использованные инструменты и партитура в виде команд), нет зависимости звучания от компьютера, на котором происходит воспроизведение (в MIDI, как мы говорили, есть зависимость звучания от используемого синтезатора), имеется большая свобода творчества, поскольку автор музыки не ограничен наборов инструментов (как в MIDI), а может использовать в качестве инструмента любой оцифрованный звук. Основные программы-трекеры Scream Tracker, Fast Tracker, Impulse Tracker, OctaMED SoundStudio, MAD Tracker, ModPlug Tracker.

Программа ModPlug Tracker является сегодня одним из тех трекеров, сумевших стать универсальной рабочей средой для множества типов трекерных модулей (см. Скриншот 7 – пример рабочего окна программы, на экране: содержание дорожек одного загруженного модуля и рабочее окно сэмплов другого модуля). Основные возможности: поддержка до 64 физических каналов аудио, поддержка почти всех существующих форматов трекерных модулей, импорт инструментов во множестве форматов, 32-битное внутреннее микширование, высококачественный ресэплирующий фильтр, поддержка MMX/3dNow!/SSE, автоматическое удаление потрескиваний, расширение басов, ревербератор, расширение стерео, 6-полосный графический эквалайзер и другие возможности.

Скриншот 7

На последок следует упомянуть о существовании огромного количества другого аудио ПО: проигрыватели аудио (наиболее выдающиеся: WinAMP, Sonique, Apollo, XMPlay, Cubic Player), подключаемые модули для проигрывателей (из «улучшателей» звучания аудио - DFX, Enhancer, iZotop Ozone), утилиты для копирования информации с аудио CD (ExactAudioCopy, CDex, AudioGrabber), перехватчики аудио потоков (Total Recorder, AudioTools), кодеры аудио (кодеры MP3: Lame encoder, Blade Encoderб Go-Go и другие; кодеры VQF: TwinVQ encoder, Yamaha SoundVQ, NTT TwinVQ; кодеры AAC: FAAC, PsyTel AAC, Quartex AAC), конвертеры аудио (для перевода аудио информации из одного формата в другой), генераторы речи и множество других специфических и общих утилит. Безусловно, все перечисленное – только малая толика из того, что может пригодиться при работе со звуком.

8. Перспективы и проблематика

Перспективы развития и использования цифрового аудио видятся авторам статьи очень широкими. Казалось бы, все, что можно было сделать в этой области, уже сделано. Однако это не так. Остается масса еще совсем незатронутых проблем.

Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона. Такая работа приносит не столько удобств, сколько огорчений. Еще куда более сложной задачей (вполне возможно, что и неразрешимой вовсе) является распознавание общих звуков, например, звучания скрипки в звуках оркестра или выделение партии рояля. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.

В области синтеза звука также есть пространство для изучения. Способов синтеза звука сегодня существует несколько, однако ни один из них не дает возможности синтезировать звук, который нельзя было бы отличить от настоящего. Если, скажем, звуки рояля или тромбона еще более-менее поддаются реализации, до правдоподобного звучания саксофона или электрогитары добиться еще так и не смогли – существует масса нюансов звучания, которые почти невозможно воссоздать искусственно.

Таким образом, можно смело сказать, что в области обработки, создания и синтеза звука и музыки еще очень далеко до того решающего слова, которое поставит точку на развитии этой отрасли человеческой деятельности.

Глоссарий терминов

1) DSP – Digital Signal Processor (цифровой сигнальный процессор). Устройство (или программный механизм) предназначенное для цифровой обработки сигналов.

2) Битрейт – применительно к потокам данных - количество бит в секунду (bits per second). Применительно в звуковым файлам (например, после lossy-кодирования) – каким количеством бит описывается одна секунда аудио.

3) Звук - акустическая волна, распространяющаяся в пространстве; в каждой точке пространства может быть представлена функцией амплитуды от времени.

4) Интерфейс - совокупность программных и аппаратных средств, предназначенных для организации взаимодействия различных устройств.

5) Интерполяция - отыскание промежуточных значений величины по некоторым известным ее значениям; отыскание значений функции f(x) в точках x, лежащих между точками xo

6) Кодек – программа либо устройство, предназначенное для кодирования и/или декодирования данных.

7) Ресэмплинг (re-sampling) – изменение частоты дискретизации оцифрованных аудио данных.

8) Сонограмма – график, способ представления спектра сигнала, когда по оси абсцисс откладывается время, по оси ординат частота, а амплитуды гармонических составляющих на соответствующих частотах отражает насыщенность цвета на пересечении временной и частотной координат.

9) Формат файла (звукового) - структура данных в файле.

Традиционное аналоговое представление сигналов основано на подобии (аналогичности) электрических сигналов (изменений тока и напряжения) представленным ими исходным сигналам (звуковому давлению, температуре, скорости и т.п.), а также подобии форм электрических сигналов в различных точках усилительного или передающего тракта. Форма электрической кривой, описывающей (переносящей) исходный сигнал, максимально приближена к форме кривой этого сигнала.

Такое представление наиболее точно, однако малейшее искажение формы несущего электрического сигнала неизбежно повлечет за собой такое же искажение формы и сигнала переносимого. В терминах теории информации, количество информации в несущем сигнале в точности равно количеству информации в сигнале исходном, и электрическое представление не содержит избыточности, которая могла бы защитить переносимый сигнал от искажений при хранении, передаче и усилении.

Любой природный звук имеет аналоговую природу: кожа барабана, струны рояля, голосовые связки плавно перемещаются в пространстве, вызывая упругие волны (области сжатия/разрежения воздуха), которые распространяются в атмосфере. Звуком называются механические волны, частоты которых лежат в пределах от 17-20 до 20000 Гц. Механические волны таких частот производят ощущение звука. Механические волны с частотами ниже 17 Гц называют инфразвуками ,

а свыше 20000 Гц - ультаразвуками . Звуковые волны, улавливаемые ушной раковиной, вызывают вибрацию барабанной перепонки (рис.7.1) и затем через систему слуховых косточек, жидкостей и др. образований передаются воспринимающим рецепторным клеткам, вызывающим в мозгу челеовека звуковые ощущения. При этом громкость звука определяется силой, с которой звуковые волны воздействуют на ухо человека (амплитудой звуковой волны), а высота тона определяется частотой колебаний. Сила ощущения звуковых волн органами слуха субъективна, зависит от чувствительности органа слуха, но непосредственно связана с интенсивностью волн. При определенной минимальной интенсивности человеческое ухо не воспринимает звука. Эта минимальная интенсивность называется порогом слышимости . Порог слышимости имеет различные значения для звука различных частот. При больших интенсивностях ухо испытывает болевое ощущение. Наименьшая интенсивность при болевом восприятии звука называется порогом болевого ощущения .

Уровень интенсивности звука определяется в децибелах (дБ). Количество децибел равно десятичному логарифму отношения интенсивностей, умноженному на 10, т.е. 10lg(I/I 0).

Для преобразования звуковых колебаний в электрические в телефонных аппаратах, устройствах звукозаписи, системах радиовещания и др. областях используются микрофоны. При этом на выходе микрофонов образуется непрерывно изменяющееся аналоговое напряжение (аналог давления и частоты колебаний звуковой волны).

Однако компьютер оперирует нулями и единицами. Процесс оцифровки звука заключается в мгновенной регистрации величины напряжения в различные моменты времени и последующем "склеивании" полученных значений. При просмотре фильма, глаза и мозг связывают цепочку неподвижных изображений в непрерывное движение. В случае цифрового звука "кадры" сливаются в проигрывающем устройстве: непрерывно изменяющееся напряжение более или менее точно воссоздается и подается на громкоговоритель. Если все сделано правильно, то динамик воспроизводит оригинальное движение струны рояля или кожи барабана. Аналогия с фильмом верна в принципе, однако, аудио-"кадры" (samples) записываются в сотни и тысячи раз чаще, чем кадры фильма.

Возможно, аудио-"кадры" нагляднее сравнивать с точками, из которых состоит газетная фотография. Чем плотнее расположены точки (чем выше линиатура), тем более детально воспроизводится изображение. Высокая линиатура требует более качественной бумаги и более аккуратной печати, а большая частота сэмплирования приводит к сильной загрузке компьютера: за один и тот же промежуток времени обрабатывается больше значений, а для хранения и передачи данных требуется большая память и полоса пропускания. В обоих случаях приходится искать компромисс между практичностью и точностью воспроизведения.

При аналоговом способе записи сохраняются величины, непрерывно изменяющиеся по амплитуде и во времени, то есть изменение параметров может происходить на любую бесконечно малую величину. Для сигналов, изменяющихся во времени, важную роль играет частота измерений. Рассмотрим это утверждение на примере цифровой звукозаписи. Оцифрованный звук представляет собой существенную часть мультимедиа. Поэтому представляется рациональным принципиально разобраться в оцифровке звуковой информации.

Как и при оцифровке изображения, для цифровой звукозаписи требуется наличие технического аналога органа чувств. Только здесь это не «электронный глаз», а «электронное ухо», в качестве которого обычно используют микрофон. В микрофоне имеется мембрана, в которой под воздействием звуковой волны возбуждаются колебания, и с помощью катушки на магнитном сердечнике звуковая информация преобразуется в численные значения. Таким образом, мы должны иметь дело с изменяющимся во времени сигналом, а именно, с электрическим напряжением, величина которого изменяется с течением времени.

При цифровом способе записи сохраняются величины, измеренные через определенные последовательные промежутки времени и принимающие фиксированные значения.

Звуковые колебания преобразуются в аудиоадаптере в цифровой сигнал, записываются на каком-либо носителе информации, например, на магнито-оптическом компакт-диске, а затем, если потребуется, через аудиоадаптер преобразуются обратно в аналоговый сигнал и воспроизводятся через громкоговоритель. На рис.7.2 повышение и спад звукового давления представлены в виде кривой.

Обычно уже в аналоговом представлении имеется ошибка, появляющаяся из-за несовершенства преобразований. Так как при обработке, передаче и записи возникают искажения и помехи, то при воспроизведении сигнала нет точного совпадения с оригиналом. Сигнал ухудшается при каждой последующей обработке. Чем чаще повторять этот процесс, тем хуже и хуже будут результаты. Как правило, потеря качества отчетливо ощущается уже после первой обработки. Потеря качества с каждой новой копией может зайти так далеко, что на копии Х вообще нельзя будет ничего различить. Для того чтобы при обработке уменьшить эти ошибки, приходится применять дорогое и сложное оборудование.

Вернемся к примеру со звуковыми волнами. Чтобы характеристики звука (например, его высоту) описать более точно, нужны определенные физические понятия. Первоначально звук существует как аналоговый сигнал (воспринимаемый микрофоном), причем в виде чередования возрастания и спада звукового давления на мембрану микрофона, что вызывает в ней колебательный процесс.

Первая гармоника колебаний мембраны может быть представлена в виде синусоиды. Максимальное отклонение от положения покоя (как вверх, так и вниз) называется амплитудой.

Число колебаний в течение одной секунды называется частотой и измеряется в герцах (Гц). Одно колебание совершается в течение промежутка времени, называемого периодом колебаний, за который процесс, начиная от положения покоя, побывает в верхней и нижней максимальных точках и снова вернется в положение покоя (рис.7.3).

Если представить звуковые волны в виде колебаний на осциллографе, то можно заметить, что большей громкости звука соответствует большая амплитуда колебаний. Точно также и частота колебания зависит от того, низкий звук или высокий (рис.7.4).

Если рассмотреть на осциллографе реакцию микрофона на речь или музыку, то мы увидим не регулярную синусоиду, а более сложную кривую, которая возникает как результат наложения и взаимодействия разных колебаний; это наложение также называют интерференцией.

Цифровое представление выглядит совершенно иначе. При цифровом представлении изменение величины происходит дискретно и как бы заморожено в некоторые моменты времени для измерения значений. Таким образом, эти значения описывают процесс, определяя его состояние в определенные моменты времени последовательностью дискретных чисел. Аналоговый сигнал преобразовывается в цифровой (дискретизируется) при помощи аналого-цифрового преобразователя (АЦП). В нем аналоговый сигнал после измерения на входе квантуется и кодируется. Чем короче временные промежутки между отдельными измерениями, тем точнее описывается и затем воспроизводится процесс. Частота, с которой дискретизируется аналоговый сигнал, называется частотой дискретизации. Преимущество этого способа представления очевидно: так как измеренная величина существует в форме числа, то копирование происходит без потери качества, так как переписывается лишь число. Не наблюдается потеря качества и для копии X, если, разумеется, копирование происходит без ошибок.

Теперь давайте выясним, как часто в единицу времени требуется измерять величину напряжения, поступающего от микрофона, чтобы получить наилучшее качество оцифровки. В качестве важнейшего граничного условия здесь выступает чувствительность человеческого уха к звуковым волнам различной длины

В молодом возрасте порог чувствительности находиться на частоте около 20000 герц, а со временем существенно снижается, и человек не способен их воспринимать звуковые волны с частотами выше 20000 герц. При этом происходило бы только бесполезное увеличение объема данных. Из критерия Найквиста следует, что для оцифровки без искажений замеры следует производить с шагом вдвое меньше, чем самая тонкая деталь информации. При звукозаписи самой тонкой деталью является колебание с частотой 20000 герц, поэтому замеры напряжения должны производиться не реже 40000 раз в секунду. Фактически берут несколько большее значение и производят замеры с частотой 44100 герц.

Это некруглое значение обусловлено тем, что для осуществления первых цифровых записей применялся видеомагнитофон. Такой магнитофон, работающий по стандарту цветного телевидения PAL, записывает 50 изображений (полей) в секунду, и в каждом поле записывается по 294 телевизионных строки, причем это значение стандартизовано. В противоположность этому, число замеров звукового сигнала на строку может изменяться и до определенной верхней границы может быть любым целым числом. При трех замерах на строку в секунду получается 50 х 294 х 3 замеров, что и составляет точно 44100. Интересно, что видеомагнитофон, работающий по американскому стандарту NTSC, также пригоден для такой звукозаписи, поскольку в нем записывается 60 полей в секунду по 245 строк (60 х 245 х 3 также дает 44100).

Однако звуковой сигнал, получаемый, например, от музыкального инструмента, вполне может содержать обертоны с частотой 22000 герц. Это вызывает определенные трудности. Так же как при сканировании изображений со слишком низким разрешением, недостаточное разрешение при оцифровке в случае звукозаписи может привести к искажениям. Из-за низкого числа замеров в оцифрованном сигнале возникают новые колебания, которых не было в исходном сигнале. Этот эффект называют помехой дискретизации, а саму помеху - ложными частотами (по-английски используется термин aliasing). На начальном этапе цифровой звукотехники ложные частоты создавали значительные трудности для инженеров. Между тем появились фильтры с очень резким срезом, которые устраняют в звуковом сигнале частоты выше допустимого значения около 22000 герц, перед тем как сигнал будет подан на аналого-цифровой преобразователь. В этой связи говорят, что перед оцифровкой сигнал ограничивается по полосе частот.

Остается еще проблема точности измерений. Хотя при заниженной точности ложные частоты и возникают, качество записи явно ухудшается. АЦП сравнивает измеренную величину со шкалой числовых значений и присваивает этой величине дискретное значение из имеющихся на шкале. Присвоенное дискретное значение настолько точно отражает состояние процесса, насколько малы по величине деления на шкале.

Если, например, имеется довольно грубая шкала от 1 до 16 (всего 16 значений), то неизбежно возникает относительно большое отклонение значения дискретизируемой величины от квантованного присвоенного значения. Это отклонение называется ошибкой квантования или искажением квантования. Если же шкала имеет 256 значений, то, следовательно, ошибка квантования уменьшается в четыре раза. Так как для записи используется лишь двоичное представление числа, то это означает, что 16 (2 4) степеней сравнения требуют для описания четыре бита. Следовательно, для 256 (2 8) потребуется 8 бит. При допустимой ошибке менее 0,1 процента необходимо иметь 1000 степеней сравнения, для чего потребуется 10 бит.

Цифровая запись музыки в стереофоническом режиме, используемая, например, на компакт-дисках, выполняется с частотой отсчетов 44,1 килогерц и точностью измерений 16 бит (2 байта). Это соответствует объему данных 44100 х 2 х 2 = 176400 байт в секунду, что весьма немало. В мультимедиа-приложениях такой поток данных приемлем только в определенных условиях. Обычно качество записи для этих целей снижают, используя частоту отсчетов 22 килогерц и разрешение 8 бит, причем ограничиваются монофоническим воспроизведением. Благодаря этому поток данных снижается до 22 Кбайт в секунду. Однако дальнейшее снижение уже недопустимо, поскольку оно привело бы к слишком сильному снижению качества звука.

Высококачественный (Hi-Fi) проигрыватель компакт-дисков имеет разрядность 16 бит; это позволяет различать при сравнении 65536 различных состояний. Аудиоадаптер может иметь разрядность 8 бит и 256 различных состояний. Так как при записи приходится обрабатывать огромные объемы данных, то, чтобы не загружать микропроцессор, используется так называемый метод DMA(Direct Memory Access - прямой доступ к памяти). Данные, минуя микропроцессор, прямо попадают в память Чтобы устранить конфликт между аудиоадаптером и микропроцессором, в компьютере имеется специальная микросхема которая называется контроллер прямого доступа к оперативной памяти Контроллер управляет доступом к памяти со стороны микропроцессора или других адаптеров через каналы прямого доступа (номер такого канала требуется задать при инсталляции аудиоадаптера).

Преобразование цифровой величины в аналоговый сигнал который может слышать ухо, происходит в цифро-аналоговом преобразователе (ЦАП - Digital-to-Analog Converter - DAC).

Подводя итог, можно сказать, что цифровая аудиозапись (digital audio) - это цифровое представление аналогового звукового сигнала. Для формирования цифрового представления звукового сигнала используется процесс выборки (sampling). Данный процесс заключается в периодическом измерении амплитуды (громкости) аналогового звукового сигнала и преобразовании полученного значения в последовательность битов. Для осуществления такого преобразования используется специальное устройство, которое называется аналого-цифровой преобразователь - АЦП (Analog-to-Digital Converter - ADC). На выходе АЦП формируется последовательность байтов, которая может быть записана либо на магнитную ленту, либо на другое цифровое устройство в двоичной форме.

Запись в двоичной форме позволяет избежать появления помех во время записи на магнитный носитель, так как записываются только два уровня сигнала - логический ноль и логическая единица, в отличие от аналогового способа записи, при котором записывается много различных уровней сигнала.

Такие системы записи звука обычно называют системами цифровой аудиозаписи с импульсно-кодовой модуляцией (Pulse Code Modulation - PCM). Однако в компьютерной терминологии такой процесс принято называть волновой аудиозаписью (waveaudio или waveform audio).

Цифровой звук характеризуется следующими параметрами:

частотой дискретизации (sampling rate), которая определяет, сколько раз оцифровывается звуковой сигнал за единицу времени и измеряется в килогерцах (килогерц - тысяча выборок в секунду). Данная характеристика показывает, как часто измеряется значение амплитуды входного звукового сигнала в момент записи звука, а тем самым - насколько правильно цифровое представление звука отражает скорость изменения амплитуды звукового сигнала (рис.7.6).

звуковым разрешением (audio resolution), характеризующим правильность представления амплитуды исходного аналогового сигнала. Обычно цифровые аудиосистемы бывают 8- и 16-разрядными.

Наиболее часто используют частоты дискретизации 11,025; 22,05 и 44,1 кГц. При частоте 11,025 кГц достаточно хорошо воспроизводится человеческая речь. При частоте 22,05 кГц неплохо звучит не только человеческая речь, но и музыкальные фрагменты. А для очень хорошего представления музыкального звучания необходимо использовать частоту дискретизации не менее 44,1 кГц.

Частота дискретизации сильно влияет на количество информации, необходимое для хранения звука. Так, например, воспроизведение 16-разрядного стереозвука с частотой дискретизации 44,1 кГц требует хранить для одной секунды звучания 176,2 Кбайт, а для воспроизведения секунды такого же звука с частотой дискретизации 22,05 кГц требуется 90 К байт, что почти в два раза меньше.

8-разрядные системы осуществляют преобразование амплитуды аналогового сигнала только в 256 фиксированных значений (рис.7.8). Такое представление аналогового сигнала не является очень точным, а, следовательно, выходной сигнал, восстановленный по 8-разрядному представлению, будет отличаться от оригинального звукового сигнала. Такое отличие обычно хорошо заметно на слух.

16-разрядные системы осуществляют преобразование амплитуды аналогового сигнала уже в 65536 фиксированных значений. В таких системах качество оцифрованного звука намного лучше и практически не отличается от оригинального звучания. Кроме того обеспечивается широкий динамический диапазон (выраженная в децибелах разность между самым сильным сигналом, который устройство в состоянии пропустить, и самым слабым, еще различимым на фоне остаточных шумов). Благодаря этому современные цифровые системы воспроизведения звука, такие как цифровые аудио компакт-диски и цифровые аудиомагнитофоны, обычно используют 16-разрядные системы (рис.7.9).

Аудиофайлы, как и графические данные, можно уплотнять. Это позволяет значительно сократить объем передаваемой информации. Для этого используются кодеки (рис.7.10).