Устранение негативного влияния пауз на работу устройств компенсации эха

Широко известно, что наличие пауз в активном речевом сигнале оказывает значительное негативное влияние на динамику адаптации устройств компенсации эха и приводит к увеличению уровня остаточного эхосигнала [1]. Стандартным подходом к задаче устранения данного негативного влияния является включение в состав эхокомпенсатора (ЭК) детектора сигнала прямого направления передачи (ПНП) [2].

Сигнал с этого детектора управляет адаптацией, запрещая ее в моменты действия пауз. То есть структурная схема эхокомпенсатора может быть представлена как на рис. 1 (базовая конфигурация, в которой не отображены нелинейный процессор и детектор встречного разговора).

ris1_042013

Следует отметить, что применение детектора речевого сигнала (далее просто детектор) является эффективным, надежным и проверенным временем решением для большинства прикладных задач. И это не случайно, так как представленная структурная схема реализует «вырезание» пауз из сигнала, используемого для адаптации, что, на первый взгляд, должно обеспечивать полное исключение влияния пауз на работу ЭК. Однако, в силу параллельной работы детектора и алгоритма адаптации существует два серьезных нюанса. Во-первых, ввиду конечного быстродействия детектора алгоритм адаптации некоторое время продолжает адаптацию в условиях отсутствия сигнала ПНП при появлении паузы (переход сигнал — пауза). Во-вторых, из-за необходимости оценки интегральных величин при адаптации (наличие «памяти» алгоритма), при появлении сигнала (переход пауза — сигнал) возможно искажение этих оценок из-за большого количества нулевых отсчетов сигнала ПНП и остаточного эхосигнала. Оба эти обстоятельства, безусловно, негативно влияют на работу ЭК, приводя к кратковременному повышению уровня остаточного эхосигнала при возобновлении адаптации. Описанные явления можно лаконично назвать «краевыми эффектами».

Следует отметить, что степень их влияния зависит от скорости адаптации эхокомпенсатора, «памяти» алгоритма и быстродействия детектора и для большинства задач можно принять ее незначительной. Однако в ряде специфических задач, а именно при оптимизации скорости адаптации ЭК и его работе в условиях наличия аддитивных шумов в эхотракте (они многократно «усиливают» негативное влияние пауз), описанные эффекты могут оказывать заметное негативное влияние на работу ЭК, что побуждает к разработке дополнительных мер по их устранению.

Намечая пути решения обозначенной проблемы, можно заметить, что улучшить работу ЭК можно, оптимизировав задержку сигнала управления адаптацией по отношению к сигналу с выхода детектора. Так, очевидно, что при детектировании паузы (переходе сигнал — пауза) разумно останавливать адаптацию как можно быстрее. А при детектировании сигнала (переход пауза — сигнал) следует выждать некоторое время перед началом адаптации, необходимое для накопления достаточного количества отсчетов сигнала на входе и выходе эхотракта. Вышесказанное иллюстрирует рис. 2.

ris2_042013

К сожалению, озвученный подход, обладая крайней простотой, не решает проблему кардинально. Очевидно, что влияние паузы при переходе сигнал — пауза может быть минимизировано при помощи минимизации времени детектирования, но является неизбежным в классической схеме эхокомпенсатора (при параллельной работе детектора и алгоритма адаптации).

Немаловажно уточнить, что для надежного детектирования сигнала необходимо время порядка нескольких миллисекунд, что относительно немного. В связи с этим озвученное простое мероприятие может оказаться весьма эффективным на практике. Однако представляется более целесообразным исследовать возможность полного устранения описанных выше «краевых эффектов».

Нетрудно заметить, что для дальнейшего улучшения работы эхокомпенсатора и полного исключения влияния пауз необходимо менять саму идею интеграции детектора в состав эхокомпенсатора. Естественно, что альтернативой параллельной во времени работе детектора и алгоритма адаптации может быть их последовательная работа. То есть детектор сначала должен оценивать сигнал, а уже потом, при условии его наличия и достаточности его уровня, должна происходить адаптация. Для осуществления этой идеи разумно задержать адаптацию на необходимое для анализа сигнала ПНП время. Структурная схема эхокомпенсатора, в котором реализована эта идея, а также средства оптимизации управления (внесена задержка в сигнал управления адаптацией), представлена на рис. 3.

ris3_042013

Как видно, сигналы X(i) и Z(i), поступающие в алгоритм адаптации, задержаны на одинаковое время (L*ТД). Таким образом, для алгоритма адаптации создается аддитивная задержка по отношению к остальным блокам ЭК (в том числе и детектору сигнала ПНП). Очевидно, такой подход позволяет обеспечить своевременное выключение адаптации при возникновении паузы. Отдельно следует подчеркнуть, что сигналы X(i) и Z(i) не задерживаются в сигнальном тракте, а только для работы алгоритма адаптации. Таким образом, для абонентов задержка сигнала никак не изменяется.

Итак, перейдем к выбору задержки сигналов X(i) и Z(i). Очевидно, что для озвученной идеи задержка этих сигналов должна быть не менее времени детектирования паузы в сигнале, т. е.:

При этом чрезмерное увеличение задержки также не рекомендуется. Во-первых, она прибавляется ко времени адаптации (впрочем, речь идет о значениях порядка нескольких миллисекунд, поэтому этим эффектом можно пренебречь).

Во-вторых, слишком большая задержка потребует достаточно большой памяти данных для хранения отсчетов сигналов, что может привести к увеличению стоимости устройства. Поэтому разумно выбрать задержку адаптации (тад) равной времени детектирования паузы (отсутствия сигнала):

Теперь имеет смысл определить оптимальные задержки подачи сигнала управления адаптацией при детектровании паузы (переход сигнал — пауза) и при детектировании сигнала (переход пауза — сигнал). Очевидно, что при детектировании паузы нужно как можно быстрее выключить адаптацию, поэтому задержку сигнала управления по отношению к моменту детектирования паузы вносить не нужно. То есть:

С другой стороны, ранее говорилось, что при детектировании сигнала (переход сигнал — пауза) имеет смысл внести задержку для сигнала управления адаптацией с целью накопления необходимого количества отсчетов о сигналах X(i) и Z(i) (рис. 2). Ее логично выбрать в диапазоне от тад до значения равного сумме «памяти» алгоритма (время оценки интегральных величин), задержки сигнала в эхотракте и задержки сигналов X(i) и Z(i):

Оптимальное значение тзапуска зависит от «памяти» алгоритма и задержки сигнала в эхотракте и может быть определено эмпирически для каждого конкретного случая. В качестве рекомендации можно указать верхний передел, так как в этом случае алгоритм адаптации начинает работу после паузы с момента, когда для отвода с самой большой задержкой из окна оценки интегральных величин исключен последний нулевой отсчет, обусловленный наличием паузы. Дальнейшее увеличение этой задержки нецелесообразно и может сказаться негативно на скорости адаптации эхокомпенсатора.

Отдельно следует сказать несколько слов о реализации самого детектора сигнала. Основное требование к этому узлу — надежное детектирование сигнала и паузы за приемлемое время (порядка нескольких миллисекунд). Естественно, что такая постановка задачи не предполагает какой-либо сложности в реализации данного узла. Вследствие невысоких требований к детектору сигнала возможно использование различных подходов к задаче его разработки. В целом, при реализации детектора речевого сигнала имеет смысл задаваться целью оптимизации объема вычислений и стоимости. Однако, поскольку в реальных условиях эксплуатации всегда присутствуют фоновые (в том числе и импульсные) шумы, то крайне рекомендуется использование детектора с интегральной оценкой сигнала и гистерезисом. В заключение имеет смысл отметить, что описанный способ позволяет реализовать адаптацию эхокомпенсатора только на активных участках речи таким образом, чтобы режим работы алгоритма адаптации был полностью эквивалентен адаптации на сигнале с искусственно удаленными паузами.

Литература

1. ITU-T. Digital Network Echo Cancellers. Draft text of revised Recommendation G.168 including changes agreed at SG15 Plenary. Geneva, 3-14 April 2000.

2. Шаврин С.С., Мусатова О.Ю. Влияние пауз в речевом сигнале на сходимость алгоритмов адаптации эхокомпенсаторов // Материалы 16-й межрегиональной научно-технической конференции «Обработка сигналов в системах наземной радиосвязи и оповещения», Пушкинские Горы — Москва, июль 2008 г. -М.:.МТУСИ, 2008.- С. 192-193.