Методы, основанные на использовании закономерностей восприятия речевого слуха человеком - Разработка и исследование алгоритма очистки речевого сигнала

В основе развития этого класса методов лежит утверждение, что анализ речи, основанный на модели слуха человека, будет более успешным, чем анализ, основанный на абстрактных моделях речеобразования или статистических марковских моделях. Базой одного метода является принцип, по которому слух человека наиболее чувствителен к модуляциям в спектральном огибающем сигнале с частотой 2-3 Гц. Экспериментальная проверка этой методики показала, что существенного увеличения разборчивости речевого сигнала можно добиться путем увеличения модуляционной глубины речевого сигнала до зашумления. Применение же метода к зашумленному сигналу показало, что разборчивость речи не повысилась.

На базе другого метода лежит принцип частотной маскировки, согласно которому сигнал низкого уровня становится неслышимым (замаскированным) при звучании одновременно с ним более сильного сигнала при условии, если маскирующий и маскируемый сигналы достаточно близки друг другу по частоте.

Еще один метод заключается: речевой сигнал сначала подвергался высокочастотной фильтрации (для ослабления первой форманты, повышения удельного веса высших формант в спектре речевого сигнала). Далее отфильтрованный сигнал подвергался клиппированию. Операция клиппирования увеличивает амплитуду речевой волны на участках, которые соответствуют важным для восприятия согласным по отношению к амплитуде гласных звуков.

Потенциально многообещающие результаты получены при испытаниях систем анализа и обработки зашумленных речевых сигналов, построенных на представлении речевых сигналов с помощью волновых функций - вейвлетах.

Волновой (вейвлетный) анализ речи применяется последние 10-15 лет.

Основная идея данного метода фильтрации заключается в моделировании эффекта массировки, когда слуховая система суммирует сигналы разного уровня, сигнал с более высоким уровнем подавляет сигнал меньшего уровня.

Применение изложенной методики обеспечило выигрыш около 26 дБ в случае гауссовского шума. В результате испытаний на собранной базе данных выигрыш при использовании метода составляет не менее 18 дБ. Эти результаты представляются достаточно высокими и заслуживающими внимания, хотя не совсем понятно как можно пересчитать эти цифры в привычную методику оценки выигрыша в отношение сигнал/шум.

Обзор методов повышения качества и разборчивости зашумленных сигналов показывает, что существует много различных подходов к обработке зашумленной речи. Такое разнообразие говорит о том, что проблема очистки сигнала важна, а также об отсутствии достаточно надежных и оптимальных методов решения этой проблемы. Объективное сравнение этих методов и выбор наиболее приемлемого сделать весьма затруднительно, так как перед системами коррекции речи ставятся разные задачи. Например, в качестве главного критерия можно использовать повышение разборчивости речи, допуская при этом появления артефактов в виде структурированного шума и др. Можно поставить цель: снизить утомляемость аудитора или сохранение натуральности голоса, что достигается за счет повышения качества речевого сигнала.

Важно отметить, что универсальных методов обработки, которые одинаково хорошо бы боролись со стационарными и нестационарными, аддитивными и мультипликативными шумами, существенно повышали бы качество и одновременно разборчивость речи сейчас нет. Исходя из проведенного анализа основных видов шумов акустических помех и искажений, а так же особенности их воздействия на речевые сигналы, было установлено, что наиболее распространенными, а потому наиболее важными для практики являются квазистационарные шумы: шум толпы, моря, станков, двигателей, эфира (при передаче по каналам связи). Поэтому, при выборе основного метода очистки речевых, сигналов от шумов, будем, в первую очередь, руководствоваться качеством очистки именно от квазистационарных шумов, так как такой класс методов представляет больший практический интерес. Исходя из предложенной характеристики методов очистки речевых сигналов от шума и можно сделать вывод о том, что наиболее удобным, качественным, часто используемым, перспективным для реализации методом является метод на основе вычитания амплитудных спектров. В целом, методы, основанные на вычитании амплитудных спектров считаются одними из лучших - они приводят к удовлетворительным результатам и не требуют больших вычислительных ресурсов. Поэтому разработку наиболее эффективного метода очистки речевого сигнала, будем вести на основе метода вычитания амплитудных спектров.

Похожие статьи




Методы, основанные на использовании закономерностей восприятия речевого слуха человеком - Разработка и исследование алгоритма очистки речевого сигнала

Предыдущая | Следующая