Разработка оптимального алгоритма очистки речевого сигнала, методы, основанные на вычитании амплитудных спектров, Методы, основанные на оценке спектральных характеристик шума - Разработка и исследование алгоритма очистки речевого сигнала

В настоящей главе анализируются особенности методов, основанных на вычитании амплитудных спектров, для очистки речевых сигналов от стационарных и квазистационарных шумов непрерывных импульсных помех и искажений. Разрабатываются эффективные вычислительные схемы и алгоритм очистки речевого сигнала для такого рода шумов, помех и искажений в программной среде MatLab, а так же приводится качественный анализ эффективности разработанного алгоритма.

Методы, основанные на оценке спектральных характеристик шума

Звуковой сигнал, записываемый в реальных акустических условиях, часто содержит нежелательные шумы, которые могут порождаться окружающей средой или звукозаписывающей аппаратурой. Один из классов шумов - Аддитивные Стационарные Шумы.

Аддитивность означает, что шум суммируется с "чистым" сигналом и не зависит от него, сигнал, в этом случае определяется выражением (2.1.)

(2.1.)

Стационарность означает, что свойства шума (мощность, спектральный состав) не меняются во времени.

Примерами таких шумов могут являться постоянное шипение микрофона или усилительной аппаратуры, гул электросети. Работа различных приборов, не меняющих звучания по времени (вентиляторы, компьютеры) также может создавать шумы, близкие к стационарным. Не являются стационарными шумами различные щелчки, удары, шелест ветра, шум автомобилей.

Для подавления аддитивных стационарных шумов существует алгоритм Спектрального Вычитания. Он состоит из следующих стадий:

    1. Разложение сигнала с помощью быстрого преобразования Фурье или другого преобразования, компактно локализующего энергию сигнала. 2. Оценка спектра шума. 3. "Вычитание" амплитудного спектра шума из амплитудного спектра сигнала. 4. Обратное преобразование - синтез результирующего сигнала.

Исследования качества и разборчивости речи, получаемой в результате применения описанной методики, показали [3], что в тех случаях, когда шум или помеха имеют стационарный (или квазистационарный) характер и их спектр имеет гармоническую структуру, достигается значительное на слух повышение как качества, так и разборчивости речи. По мнению аудиторов, такая речь звучит чище и приятнее, чем до обработки, даже, несмотря на наличие характерных эффектов обработки - так называемых "музыкальных тонов", заключающихся в случайных кратковременных выбросах в спектре обработанного сигнала. Однако, в случае шумов с быстроизменяющимися спектральными характеристиками такая обработка малоэффективна.

В целом, методы, основанные на вычитании спектров, считаются одними из лучших - они приводят к удовлетворительным результатам обработки и не требуют больших вычислительных ресурсов. Что же касается музыкальных тонов, которые существенно ухудшают восприятие обработанного сигнала, то для их подавления разработаны различные алгоритмы, основанные на эмпирических и эвристических соображениях [5,3].

К классу методов, основанных на оценке спектральных характеристик шума, относятся также методы коррекции спектра речевого сигнала, основанные на Виннеровской фильтрации [6].

В этих методах зашумленный речевой сигнал фильтруется фильтром с частотной характеристикой, рассчитанной из условия минимизации среднеквадратической ошибки фильтрации, то есть, если - частотная характеристика такого фильтра определяется выражением (2.2.)

(2.2.)

Где - спектральная плотность мощности сигнала

- спектральная плотность мощности шума

В реальных условиях применения частотную характеристику (2.2.) аппроксимируют выражением (2.3.):

, (2.3.)

Где и - усредненные квадраты амплитудных спектров сигнала и шума соответственно, причем оценка величин и осуществляется так же как и в методе вычитания амплитудных спектров.

Как было упомянуто, одним из основных недостатков спектрального вычитания является наличие артефактов в обработанном сигнале. Музыкальные тона существенно ухудшают качество сигнала, поэтому неудивительно, что одним из приоритетных направлений в развитии этого подхода стало создание постпроцессоров, снижающих эффект музыкальных тонов без дальнейших искажений в сигнале.

В большинстве случаев речь идет о пост-обработке сигнала в спектрально-временной области. Идея состоит в том, что музыкальные тона в спектрально-временном представлении представляют собой локальные (во времени и по частоте) спектральные максимумы. В работе [7] поиск спектральных максимумов, соответствующих музыкальным тонам осуществляется методами обработки изображений.

Анализируя проводимые авторами упомянутых работ результаты, характеризующие эффективность очистки сигнала от шума, следует отметить, что практически во всех случаях, при использовании методик типа вычитания спектров в качестве характеристики работоспособности алгоритма используются меры качества звучания сигнала или объективные меры типа усредненных евклидовых расстояний между отфильтрованным сигналом и незашумленным сигналом (предполагается, что он доступен). Следует отметить, что такая оценка методов, не всегда является объективной и обоснованной, поэтому актуальной является задача оценки предлагаемых методов в соответствии с существующими государственными стандартами.

Интересная модификация вычитания спектров - вычитание сигналов во временной области предложена в работе [9]. Там же продемонстрировано, что этот метод, в отличие от вычитания амплитудных спектров и винеровской фильтрации дает хорошие результаты (в том числе, повышает как качество, так и разборчивость сигнала при исходных соотношениях сигнал/шум -10дб и -30 дб) на нестационарных и коррелированных с речевым сигналов шумах типа мешающего диктора, гармонических помехах, одновременном фоновом разговоре (бормотании) нескольких дикторов.

Метод предполагает доступ к передаваемому незашумленному сигналу на передающей стороне и основан на технике добавления нулевых отсчетов в передаваемый речевой сигнал (то есть сигнал квантуется с удвоенной частотой, причем каждый второй отсчет - нулевой). На принимающей стороне характеристики шума оцениваются исходя из величин дополнительных (нулевых в начале передачи) отсчетов. Поскольку большинство практически встречающихся шумов (например, все речеподобные сигналы) коррелированны на интервалах между соседними отсчетами, оценка шума выполненная для дополнительных отсчетов вполне пригодна для фильтрации сигнала.

Очевидными недостатками предлагаемой методики является условие доступа к данным на передающей стороне и удвоение скорости передачи данных, поэтому область практического применения алгоритма существенно сужена.

Похожие статьи




Разработка оптимального алгоритма очистки речевого сигнала, методы, основанные на вычитании амплитудных спектров, Методы, основанные на оценке спектральных характеристик шума - Разработка и исследование алгоритма очистки речевого сигнала

Предыдущая | Следующая