С использованием аппарата скрытых марковских моделей - Разработка и исследование алгоритма очистки речевого сигнала

Другим классом методов обработки зашумленных речевых сигналов основанных на использовании статистических моделей речевого сигнала являются методы, в которых речевой сигнал моделируется скрытой Марковской цепью. То есть для моделирования речевого сигнала использован наиболее эффективный для распознавания речи подход.

Известно, что традиционно используемые методы фильтрации (вычитание спектров или фильтр Винера) не используют фонетическую информацию, переносимую речевым сигналом. Недавние исследования показали, что знание и применение в процессе обработки фонетической структуры сигнала приводит к улучшению качества фильтрации. Поэтому вполне естественным является применение в процессе очистки речевого сигнала от шумов его статистической модели в виде скрытой марковской цепи, которая связана с фонетической структурой сигнала.

Идея реализации такого подхода заключается в том, что первоначально, по записям незашумленного речевого сигнала строятся статистические модели единиц речевого потока (фонов либо более широких классов звуков). После того, как статистическая модель для множества состояний построена, по ней можно рассчитать оптимальный фильтр Винера.

При обработке зашумленного сигнала сначала оценивается (по отфильтрованному на предыдущем шаге сигналу) текущее состояние Марковской модели, в соответствии с которым выбирается оптимальный фильтр, который затем используется для фильтрации сигнала и получения очередной оценки.

алгоритм фильтрации речевого сигнала с использованием скрытой марковской модели

Рис. 1.6.Алгоритм фильтрации речевого сигнала с использованием скрытой Марковской модели.

Для эффективной обработки нестационарных сегментов отдельно оценивалась Марковская модель шума. В отличие от простых моделей состояний полезного сигнала шум моделировался набором состояний, каждое из которых содержало несколько гауссовских компонент. Во время обработки зашумленного сигнала при определении отсутствия полезного сигнала выполнялось декодирование сегмента паузы процедурой Виттерби для выбора оптимальной модели шума. Модель шума, обеспечивающая максимальное правдоподобие наблюдаемой последовательности использовалась далее для обработки сигнала. Для сохранения "преемственности" между итерациями применялись инерционная схема фильтра Винера.

В современном мире методы, основанные на использовании статистических моделей речевых сигналов являются наиболее перспективными и их дальнейшая разработка, и усовершенствование поможет достигнуть новых результатов в сфере очистки речевых сигналов от шума. Это можно заметить даже на начальных этапах: уже сейчас использование этого метода позволяет в среднем увеличить отношение сигнал/шум на 4 дБ.

Похожие статьи




С использованием аппарата скрытых марковских моделей - Разработка и исследование алгоритма очистки речевого сигнала

Предыдущая | Следующая