Исследование причин снижения эффективности базовых алгоритмов компенсации эха

Со значительной долей уверенности можно констатировать, что одной из наиболее важных проблем, решаемых в рамках современной техники компенсации эха, является зависимость эффективности работы эхокомпенсаторов от большого количества факторов. Естественно, ее актуальность побуждает специалистов искать методы усовершенствования эхокомпенсационных механизмов, что приносит свои плоды в виде достаточно широкого круга специализированных элементов и алгоритмов их адаптации, позволяющих решить ряд локальных задач. Например, увеличение устойчивости к аддитивным шумам или подавление эхосигналов, прошедших через нелинейный эхотракт.

Ввиду многогранности обозначенной проблемы большой интерес представляет задача выявления основных факторов, влияющих на эффективность работы устройств компенсации эха, их структуризация и формализация. В качестве объектов исследования целесообразно выбрать алгоритмы адаптации по нормализованному методу наименьших средних квадратов (НМНСК) и корреляционный. Первый является наиболее востребованным при проектировании современных устройств компенсации эха, а второй представляет интерес как один из перспективных алгоритмов адаптации.

Как известно, качественные показатели эффективности эхокомпенсаторов неразрывно связаны с характеристиками эхотракта, а именно наличием в нем так называемых дестабилизирующих воздействий. К ним относятся всевозможные эффекты, выходящие за рамки линейной стационарной модели эхотракта, используемой в теории винеровского оценивания, — аддитивные шумы, нелинейные искажения, параметрические воздействия и т. п.

Анализ соотношений, лежащих в основе теории компенсации эха, показывает, что импульсная характеристика (ИХ) эхотракта может быть с заданной точностью определена даже в условиях наличия аддитивных не коррелированных с сигналом прямого направления передачи (ПНП) шумов. Однако для этого необходимо вычислять функцию взаимной корреляции (ВКФ) сигнала ПНП и остаточного эхосигнала, причем устойчивость к аддитивным шумам будет определяться точностью ее оценки.

К сожалению, в основе многих алгоритмов адаптации, в том числе НМНСК, лежит аппроксимация ВКФ, что предопределяет их низкую устойчивость к аддитивным шумам. Следует отметить, что, несмотря на оперирование мгновенным значением остаточного эхосигнала, в рамках поставленного эксперимента алгоритм НМНСК проявляет некоторую устойчивость к воздействию белого шума. Однако при воздействии речевого или гармонического сигнала уровень подавления эха сильно падает, а его пульсации возрастают. Практические реалии таковы, что в некоторые моменты времени уровень остаточного эхосигнала может превышать уровень аддитивной помехи.

Корреляционный алгоритм, идея которого заключается в непосредственном вычислении ВКФ, значительно более устойчив к воздействию аддитивных шумов. Разумеется, устойчивость к данному виду дестабилизирующих воздействий определяется интервалом усреднения ВКФ. Типовая зависимость уровня аддитивной помехи относительно уровня остаточного эхосигнала при использовании корреляционного алгоритма представлена на рис. 1.

VS_ris1_07_12

Интересно, что уровень подавления эха во многом зависит от статистических свойств аддитивного шума, это легко объяснимо влиянием автокорреляционных связей в нем. С другой стороны, проведенные исследования показывают, что уровень подавления эха для обоих алгоритмов зависит от выбора параметра адаптации, т. е. фактически — от скорости адаптации.

В целом, чем больше скорость адаптации, тем ниже устойчивость к воздействию аддитивного шума. Данный эффект, в принципе, интуитивно понятен, так как, чем быстрее эхокомпенсатор сходится, тем быстрее он расходится при наличии дестабилизирующих воздействий. Поэтому приведенные результаты можно считать оценочными для случая умеренной скорости адаптации (время адаптации порядка 10 с).

Следующим видом дестабилизирующего воздействия, оказывающим значительное влияние на эффективность работы устройств компенсации эха, является нелинейность эхотракта. Следует отметить, что в это понятие объединено большое количество преобразований эхосигнала, приводящих к появлению в нем новых гармонических составляющих (прохождение сигнала через элементы с нелинейной вольт-амперной характеристикой (ВАХ), эффект наложения спектров при дискретизации сигнала, сдвиг спектра сигнала и т. п.). В рамках исследования мы ограничимся рассмотрением наиболее распространенного случая — прохождение эхосигнала через элементы с нелинейной ВАХ.

Очевидно, что линейные исполнительные элементы ЭК принципиально не могут повторить эхосигнал, прошедший через нелинейный эхотракт. Вследствие этого продукты нелинейного преобразования остаются неподавленными. Можно показать, что нелинейные искажения влияют и на динамику адаптации. Действительно, поскольку функция взаимной корреляции подразумевает линейную связь сигнала ПНП и эхосигнала, наличие нелинейных составляющих в последнем будет приводить к росту ошибки при адаптации отводов трансверсального фильтра.

Все это вызовет повышение уровня остаточного эхосигнала, снижение стабильности сходимости эхокомпенсатора и приобретение эхосигналом специфического звучания. Практические исследования выявили зависимость уровня подавления эха от коэффициента нелинейных искажений (КНИ), вносимых эхотрактом, представленную на рис. 2 (для случая сосредоточенной нелинейности).

VS_ris2_07_12

На нем случай 1 соответствует перегибу проходной характеристики нелинейного элемента в середине динамического диапазона входного сигнала (симметрично относительно нуля входного сигнала), а в случае 2 она смещена к нулю проходной характеристики и соответствует 1/4 динамического диапазона сигнала.

При проведении экспериментов был получен легко прогнозируемый результат, а именно зависимость уровня подавления эха от КНИ. С другой стороны, интересна зависимость уровня подавления эхосигнала от характера искажений, а именно — от того, в каком месте динамического диапазона лежит точка перегиба проходной характеристики нелинейного элемента. Снижение степени влияния нелинейных искажений при перемещении точки перегиба ближе к максимальным значениям сигнала объясняется динамикой речевого сигнала, который обладает нестационарным уровнем и значительным пикфактором. Ввиду этих особенностей в случае расположения точки перегиба в диапазоне больших сигналов речевой сигнал весьма редко достигает значений, при которых сказывается нелинейность эхотракта.

В связи с этим можно сделать вывод, что наиболее опасными являются искажения, происходящие вблизи нулевых значений динамического диапазона сигнала, например, «ступенька» при переходе сигнала через ноль.

Еще одним немаловажным видом дестабилизирующих воздействий являются параметрические изменения ИХ эхотракта. Причины возникновения подобных изменений весьма обширны. Естественно, что изменение импульсной характеристики эхотракта с неизбежностью приводит к необходимости «отслеживания» эхокомпенсатором этих изменений, что сказывается на уровне подавления остаточного эхо-сигнала. На рис. 3 представлена типовая зависимость уровня подавления эхосигнала от скорости изменения ИХ эхотракта (при изменении одного отсчета ИХ).

VS_ris3_07_12

Она получена при непрерывном изменении одного отсчета импульсной характеристики эхотракта по «пилообразному» закону. Очевидно, что уровень подавления эха при наличии параметрических воздействий такого рода будет зависеть от соотношения скорости адаптации эхокомпенсатора и скорости изменения эхотракта. Поэтому данные на рис. 3 следует интерпретировать как зависимость от скорости изменения ИХ эхотракта при фиксированной скорости адаптации эхокомпенсатора. Отдельного внимания заслуживает вопрос влияния характера параметрических воздействий. Так, например, в случае импульсного изменения эхотракта уровень остаточного эхосигнала с неизбежностью будет возрастать в моменты изменения ИХ эхотракта.

Следует отметить, что теоретические данные позволяют прогнозировать некоторую зависимость устойчивости алгоритмов к параметрическим воздействиям от глубины памяти алгоритма адаптации, так как использование отсчетов остаточного эхосигнала, полученных на уже не существующей ИХ, будет негативно сказываться на работе алгоритма адаптации. Однако в условиях поставленного эксперимента влияние этого эффекта незначительно.

Переходя к рассмотрению вопроса влияния статистических свойств сигнала ПНП, прежде всего, стоит отметить, что аппроксимация его функции автокорреляции, которая используется в обоих исследуемых алгоритмах адаптации, приводит к зависимости динамики адаптации от статистических свойств сигнала, что наглядно демонстрирует рис. 4.

VS_ris4_07_12

Из представленных данных видно, что при адаптации на речевом сигнале степень подавления эхосигнала растет значительно медленнее, чем при адаптации на белом шуме, и сопровождается большими пульсациями.

Интересно, что ввиду наличия автокорреляционных связей в сигнале ПНП стабильность сходимости и максимальная скорость адаптации зависят от количества отводов трансверсального фильтра, что отображено на рис. 5.

VS_ris5_07_12

Для наглядности по оси ординат отложены минимальное время и минимальный параметр адаптации, при котором эхокомпенсатор стабилен. При проведении всех экспериментов в рамках этого исследования использовался эхотракт, максимальная концевая задержка эхосигнала в котором, с целью исключения влияния формы и длительности импульсной характеристики эхотракта, не превышала 1 мс. Если провести этот же эксперимент при адаптации на белом шуме, можно показать, что полученная зависимость является следствием наличия автокорреляционных связей в речевом сигнале.

Рассмотренные зависимости эффективности работы устройств компенсации эха от характеристик эхотракта и сигнала ПНП достаточно прогнозируемы, так как обусловлены допущенными упрощениями при разработке алгоритма адаптации, принципиальными ограничениями самой идеи адаптивного моделирования ИХ эхотракта и ограничениями функциональных возможностей исполнительных элементов. Однако существует ряд более тонких факторов, влияющих на работу устройств компенсации эха. Из них наиболее интересным является влияние памяти рекурсивных алгоритмов адаптации на ее стабильность и скорость.

Нетрудно заметить, что алгоритм НМНСК обладает памятью о сигнале ПНП, которая определена интервалом усреднения дисперсии. В то же время корреляционный алгоритм адаптации имеет память, как об остаточном эхосигнале, так и о сигнале ПНП, в силу вычисления функции ВКФ остаточного эхосигнала и сигнала ПНП, а также дисперсии сигнала ПНП. Полученная на практике зависимость минимального времени и минимального значения параметра адаптации от времени усреднения дисперсии и/или ВКФ представлена на рис. 6.

VS_ris6_07_12

Обращаясь к вопросу механизма влияния памяти рекурсивных вычислений, следует обратить внимание на то, что для рассмотренных алгоритмов адаптации он несколько различается.

Для алгоритма НМНСК данный эффект обусловлен тем, что динамическая нормировка шага адаптации на дисперсию сигнала ПНП не успевает «следить» за изменением уровня сигнала прямого направления передачи и эхосигнала. При увеличении уровня сигнала, «инерционность» расчетов дисперсии методом скользящего окна приводит к тому, что знаменатель формулы адаптации растет значительно медленнее, чем числитель. Это означает временное повышение шага адаптации, что может привести к потере эхокомпенсатором стабильности.

Стоит отметить, что для речевого сигнала характерны пульсации уровня. Из вышесказанного можно сделать вывод, что степень влияния описанного эффекта будет зависеть, в том числе, от соотношения времени вычисления дисперсии и задержки сигнала в эхотракте.

При использовании корреляционного алгоритма описанный для НМНСК эффект также действует, однако его влияние нивелировано наличием в числителе расчетов функции ВКФ, которая вычисляется по тому же количеству отсчетов и также имеет «инерцию».

В заключение следует отметить, что степень влияния того или иного дестабилизирующего фактора зависит от особенностей реализации функциональных блоков эхокомпенсатора. Так, например, при использовании рекуррентного алгоритма наименьших квадратов (РНК) влияние свойств сигнала ПНП окажется незначительным.

Журнал «Вестник связи», №07 2012 г.