Возбуждение синтезатора и выбор коэффициента усиления - Вокодеры с линейным предсказанием

Атал и Ханауэр предложили способ согласования энергии синтезированной речи в пределах периода основного тона с соответствующей энергией речевого сигнала с помощью передачи энергии входного сигнала, измеренной за один период ОТ. Хотя они ограничились рассмотрением ковариационного метода без предыскажающей фильтрации, однако этот способ применим как в ковариационном, так и в автокорреляционном методах и легко может быть модифицирован для случая применения предыскажения и прямой формы синтезирующего фильтра.

Способ основан на том, что каждый отсчет синтезированной речи имеет две основные составляющие: 1). затухающие комплексные экспоненты {q(n)} предшествующего синтезированного периода ОТ и 2). выходной сигнал синтезатора {и(п)}, являющийся откликом на возбуждающую последовательность {е(п)}, без учета влияния предшествующего сегмента.

В нашем случае источником возбуждения является либо последовательность периодических единичных отсчетов (следующий за нулевыми отсчетами) при синтезе вокализованных звуков, либо последовательность выходных отсчетов генератора псевдослучайных чисел при синтезе невокализованных звуков (период ОТ для невокализованных звуков считается постоянным). Если ввести коэффициент усиления g, то полный отклик синтезатора {s(n)} для нового сегмента определяется выражением

S(n) = q(n) + gu(n).

Если использовать черту для обозначения суммы N отсчетов, например,

__ N-1

U(n) = У u(n)

n=0

То требование равенства энергий исходного и синтезируемого сигналов запишется в следующем виде:

____ _____ ______________ ___________ ______________ _____

S2(n)= s2(n) = [q(n)+gu(n)]2 = g2u2(n) + 2gq(n)u(n) + q2(n)

Это уравнение второго порядка может быть решено относительно g. Приведем алгоритм вычисления отклика синтезирующего фильтра прямой формы.

Вычислить выходной сигнал фильтра q(n) при n=0, 1, ..., М--1 в отсутствие возбуждения (используя только данные из памяти о предшествующем периоде) и без обновления коэффициентов фильтра.

Вычислить выходной сигнал фильтра и(п) при n=0, 1, 1, ..., N--1 по сигналу возбуждения {е(п)}, а память фильтра обнулить.

Вычислить коэффициенты уравнения второго порядка относительно g и решить его:

___________ ______________ _____ _____

G2u2(n) + 2gq(n)u(n) + q2(n) - s2(n) = 0

4. Предполагая, что g действительно и неотрицательно, определить выходной сигнал синтезатора в соответствии с выражением

S(n) = q(n) + gu(n) при n = 0, 1, .... N--1.

5. Записать в память фильтра прямой формы значения

S(N-- 1), s(N--2),..., s(N--M).

Вернемся к третьему шагу. Если s2(n)>q2(n), то корни квадратного уравнения будут иметь противоположные знаки и, следовательно, всегда будет положительный действительный корень. Это условие выполняется, когда истинная энергия больше, чем энергия затухающего переходного процесса. Если это условие не удовлетворяется, что может случиться с сигналом, амплитуда которого уменьшается, то необходимо, чтобы

___________ _____

Q(n)u(n) / u2(n) было отрицательным и, кроме того,

При отсутствии действительных положительных корней модель не имеет физического смысла. Если решения не существует, то Атал и Ханауэр предложили устанавливать g=0. Такая процедура требует моделирования работы синтезирующего фильтра дважды, в дополнение к трем суммам по N отсчетов и решению квадратного уравнения. Передаваемый коэффициент усиления а определяется по формуле a2=s2(n). Алгоритм, описанный выше, затем полностью реализуется в приемнике.

Такой подход можно распространить и на другие структуры синтезирующих фильтров. При этом необходимо осуществлять дополнительные вычисления при преобразовании значений задержанной синтезированной речи в сигналы, содержащиеся в элементах памяти фильтров. Изменение алгоритма при использовании предыскажения заключается в замене коэффициентов A(z) коэффициентами A(z)--(1--мz -1), где (1-- мz -1) определяет характеристику предыскажающего фильтра.

Несколько более простой (и менее точный) метод заключается в возбуждении синтезирующего фильтра входной последовательностью {е(п)}, чтобы вычислить и(п), где и(п) теперь содержит отклик как от предшествующего сегмента, так и от текущего сигнала возбуждения

Поскольку в указанных методах непосредственно согласуется энергия сигналов на входе и выходе, то можно ожидать точного согласования огибающих исходной и синтезированной речи. Однако необходимо тщательно следить за тем, чтобы величина разрывов непрерывности была минимальна, поскольку на коэффициенты усиления в конце одного периода ОТ и начале следующего не накладывается никаких энергетических ограничений, кроме косвенных.

Похожие статьи




Возбуждение синтезатора и выбор коэффициента усиления - Вокодеры с линейным предсказанием

Предыдущая | Следующая