Об аналого-цифровом и цифро-аналоговом преобразовании.

Для начала немного мутной теории. Читать может быть будет тяжело, но это действительно нужно.
Итак,  есть 2 типа сигналов - аналоговый и цифровой. Пример аналогового сигнала - разговор в мегафон: там нет никакого преобразования звука. Там есть лишь только усиление исходного сигнала. Цифровой же сигнал - совершенно иное. Вся музыка в наших компьютерах, плеерах, на сотовых хранится в виде единиц и нулей выстроенных в определенной последовательности. Как же происходит это преобразование?


Нам предстоит работать с цифровым звуком. Для того, чтобы лучше понять его природу, нам нужно познакомиться с процессами преобразования звука из аналоговой формы в цифровую и наоборот. Имея даже весьма примерное представление о том, что происходит в вашей звуковой карте, вы убережетесь от множества ошибок. Итак, звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Этот сигнал проходит через звуковой тракт и попадает в аналого-цифровой преобразователь (АЦП) - устройство, которое переводит сигнал в цифровую форму. В упрощенном виде принцип работы АЦП можно описать так: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность чисел, несущих информацию об изменениях величины амплитуды. Во время аналого-цифрового преобразования на самом деле никакого физического преобразования не происходит. С электрического сигнала как бы снимается отпечаток или образец, являющийся цифровой моделью колебаний напряжения в аудиотракте. На схеме 2 эта модель представлена в виде последовательности серых столбиков, каждый из которых соответствует определенному числовому значению.
На этой схеме видно, что цифровая модель не совсем точно соответствует форме аналогового сигнала. Поэтому говорят, что цифровой сигнал по своей природе дискретен - то есть, прерывист. Собственно, дискретность цифрового звука и вызывает до сих пор споры о том, какая технология лучше: аналоговая или цифровая. Многие аудиофилы и звукорежиссеры утверждают, что отлично слышат разницу между аналоговым оригиналом и цифровой копией, сделанной даже при помощи очень дорогих преобразователей. Действительно, на высококлассных студийных и бытовых Hi-End (хай-энд) акустических системах эта разница слышна. Однако в большинстве случаев дискретность цифрового звука проявляется в мельчайших деталях звуковой картины, которые интересны лишь специалистам. Поэтому для подавляющего большинства слушателей все эти проблемы мало интересны - к музыке они не имеют никакого отношения. Промежуток времени между двумя измерениями амплитуды аналогового сигнала называется семплом. С английского слово Sample дословно переводится как «образец». Поэтому это слово в мультимедийной и профессиональной звуковой терминологии имеет несколько значений. Кроме промежутка времени семплом называют любую последовательность цифровых данных, полученных в результате аналого-цифрового преобразования, а сам процесс преобразования - семплированием. В традиционном русском техническом языке принята другая терминология. Например, процесс преобразования называется дискретизацией. Однако за последние несколько лет произошла стихийная замена традиционной терминологии на более удобную - англоподобную. Вы вряд ли встретите в современных журнальных публикациях такой термин как частота дискретизации, зато в изобилии столкнетесь с частотой семплирования, хотя эти термины обозначают одно и то же. Вывод цифрового звука осуществляется при помощи цифро-аналогового преобразователя (ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды (схема 3). А в акустических системах этот сигнал преобразуется в звуковые волны, которые мы слышим.
Частота семплированияОдним из двух ключевых параметров процесса оцифровки является частота семплирования - количество измерений амплитуды аналогового сигнала в секунду. Так как диапазон колебаний звуковых волн лежит в пределах от 20 Гц до 20 кГц, то количество измерений сигнала в секунду должно быть больше, чем количество колебаний звуковой волны за тот же промежуток времени. На следующем рисунке показано, что происходит, если частота семплирования гораздо ниже, чем частота звуковой волны: за время между измерениями амплитуда сигнала успевает несколько раз измениться, в результате чего цифровой отпечаток несет хаотичный набор данных. При цифро-аналоговом преобразовании такой семпл выдаст только шум, а основной сигнал передаваться не будет. Поэтому для качественного преобразования применяют частоты, более чем в два раза превышающие верхнюю границу частотного диапазона: 44.1 и 48 кГц. А в новом формате компакт-дисков под названием Audio DVD (ди-ви-ди) применяется частота семплирования 96 кГц. То есть за 1 секунду сигнал измеряется 96 тысяч раз! В мультимедийных приложениях очень часто применяют меньшие частоты: 11, 22 и 32 кГц для экономии места на жестком диске. Но с уменьшением частоты семплирования сразу уменьшается слышимый диапазон частот, а то, что слышно, довольно сильно искажается.
Семплирование с разной частотойНа следующем рисунке представлены четыре графика, показывающие с одинаковым масштабом один и тот же звук высотой 1 кГц (этой частоте примерно соответствует нота До седьмой октавы фортепиано), но семплированный с разной частотой (нижняя часть синусоиды на всех рисунках не показана). Одно деление на горизонтальной оси, показывающей время, соответствует 10 семплам. Все эти рисунки были получены при помощи аудиоредактора Sound Forge 4.5 (саунд форж). Вы видите, что на частоте 11 кГц на каждые 50 семплов приходятся примерно 5 колебаний звуковой волны, то есть один период синусоиды отображается всего лишь при помощи 10 значений. При таком отображении ни о какой точной передаче говорить не приходится. Зато при частоте оцифровки 44 кГц на каждый период синусоиды приходится уже почти 50 семплов - такая точность отображения позволяет получить сигнал хорошего качества. Процесс аналого-цифрового преобразования называется семплированием. Одним из ключевых параметров этого процесса является частота семплирования - количество измерений амплитуды аналогового сигнала в секунду. Для того, чтобы оцифровка была действительно качественной, нужно использовать частоту семплирования, которая более чем в два раза превышает частоту верхней границы звукового диапазона. Если частота семплирования будет меньше, то начнут происходить потери на высоких частотах. Исходя из этих соображений, стандартной для звукового компакт-диска выбрана частота 44.1 кГц.
Теперь давайте разберемся с другим ключевым параметром цифрового преобразования - разрядностью сэмплирования. Этот параметр указывает, с какой точностью происходят измерения амплитуды аналогового сигнала. Посмотрите еще раз на первый рисунок. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени (серые столбики на первом рисунке, схема №2), фактически определяет качество сигнала после цифро-аналогового преобразования. От этой точности зависит достоверность восстановления формы волны. Любое цифровое устройство, в том числе и компьютер, на аппаратном уровне может оперировать только с двоичным кодом. Этот код позволяет представить любую информацию в виде нулей и единиц. Такой способ обмена информацией гораздо проще реализовать технически - ведь любое цифровое устройство представляет из себя электрический «ящик». Например, одна величина напряжения соответствует нулю, а другая величина - единице. Сделайте побольше разницу между этими двумя величинами и вероятность ошибки практически сводится к нулю. А если бы тот же компьютер на аппа¬ратном уровне оперировал десятичными цифрами, нам пришлось бы вводить десять значений напряжения, чтобы закодировать цифры с 0 до 9. Это уменьшает надежность системы. Минимальной информационной единицей в двоичной системе является бит. Он может принимать два значения - 0 и 1, то есть одним битом можно представить два десятичных числа. Двумя битами - уже четыре числа (используя все возможные комбинации нолей и единиц: 00, 01, 10, 11). Тремя битами - восемь чисел и т.д. Именно такой принцип и применяется для кодирования значения амплитуды сигнала. Обычно используется 8 или 16-битное представление значений амплитуды. Давайте остановимся на этом моменте подробней. Если при оцифровке используется 8-битное кодирование, то измерения амплитуды аналогового сигнала будут производиться с точностью до 1/256 от динамического диапазона цифрового устройства (8 бит позволяют представить 28 чисел - 256). Такая точность недостаточна для достоверного восстановления исходного сигнала: будут велики нелинейные искажения. Поэтому 8-битное кодирование применяется преимущественно в мультимедиа - приложениях, где не требуется высокое качество звука. Если же мы повысим разрядность представления значений амплитуды аналогового сигнала до 16 бит, то точность измерения возрастет не в два раза, а в 256. Ведь 16 бит позволяют закодировать уже 216=65536 значений амплитуды. Такая точность кодирования позволяет нелинейные искажения свести к минимуму.
Именно разрядность 16 бит используется при записи компакт- дисков. В современных же преобразователях используется 20-битное кодирование сигнала. Такая разрядность позволяет получить 220=Ю48576 значений амлитуды, что более чем достаточно для высококачественной оцифровки звука. Здесь надо остановиться и поговорить об одной особенности оцифровки. Все приведенные выше данные справедливы только для сигнала, имеющего мак¬симальный уровень 0 дБ. Если семплируется сигнал, имеющий уровень -6 дБ с разрядностью 16 бит, то реально для кодирования его амплитуды будет оставаться 15 бит. Для сигнала с уровнем -12 дБ эта цифра будет составлять 14 бит. То есть с уменьшением уровня сигнала будет уменьшаться разрядность его оцифровки и, соответственно, увеличиваться уровень нелинейных искажений (в технической литературе эти искажения иногда называются шумом квантования). Уменьшение уровня на каждые 6 дБ будет «съедать» 1 бит. В результате, для кодирования амплитуды сигнала с уровнем -90 дБ у нас останется всего 1 бит. Этот недостаток 16-битного кодирования и является основным катализатором введения нового бытового цифрового формата Audio DVD, у которого помимо частоты семплирования 96 кГц используется разрядность 24 бита. Ожидается, что через несколько лет он полностью вытеснит с рынка обычные компакт-диски. Из всего сказанного следует важный практический вывод: когда вы работаете с цифровым звуком, уровень записи должен быть максимально возможным, если вы хотите получить звук действительно хорошего качества. А любую обработку нужно начинать только после приведения вашей записи к уровню 0 дБ для того, чтобы цифровые алгоритмы работали с разрядностью, близкой к 16 битам, а не 10 или 8. Для этого в любой компьютерной программе записи и редактирования «живого» звука есть соответствующие алгоритмы. Как уже говорилось выше, на современные цифровые звуковые устройства устанавливают не 16-битные, а 18 или 20-битные преобразователи. Это не означает, что звук становится 20-разрядным. Он так и остается 16-битным. Преобразователи повышенной разрядности устанавливаются для борьбы с понижением качества записи на низких уровнях. Принцип работы таких устройств довольно прост. Исходный аналоговый сигнал оцифровывается с разрядностью 20 бит. Однако на своем пути он встречает мощный процессор (его называют DSP (дэ-эс-пэ) - цифровой сигнальный процессор), который в реальном времени понизит разрядность до 16 бит. При этом используется специальный алгоритм вычислений, который помогает снизить искажения низкоуровневых сигналов. При цифро-аналоговом преобразовании происходит обратный процесс: повышение раз¬рядности с 16 до 20 бит. При этом опять используется специальный алго¬ритм, который позволяет более точно определить значения амплитуды. В результате мы получаем общее улучшение качества звучания, несмотря на то, что звук остается 16-разрядным.
Разрядность семплирования показывает точность представления значений амплитуды аналогового сигнала. Чем выше разрядность, тем меньше нелинейных искажений в сигнале после цифро-аналогового преобразования. Одним из недостатков цифровой записи является ухудшение качества звука, записанного с малыми уровнями. Для борьбы с этим эффектом лучше оцифровывать звук с максимально возможным уровнем. А при выборе цифровых устройств следует отдавать предпочтение тем из них, на которых установлены преобразователи повышенной разрядности (18 или 20 бит). Давайте подсчитаем, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе. Если мы за¬писываем моносигнал с частотой 44.1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 44100x2x60=5292000 байт, т.е. около 5 Мб данных об амплитуде аналогового сигнала, которые в компьютере записываются на жесткий диск. Стереосигнал уже будет занимать 10584000 байт или около 10 Мб. Объем данных для 11, 22 или 32 кГц вы можете подсчитать самостоятельно.
автор: Дубровский Д.Ю.

Комментарии

Популярные сообщения из этого блога

Мастеринг звука для цифровых площадок

О джазовой импровизации. Обзор теории

Организация записи вокала