Пороги і методи фільтрації мовного сигналу в вейвлет області

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

МІНІСТЕРСТВО ОСВІТИ
"Білоруський державний університет
ІНФОРМАТИКИ І РАДІОЕЛЕКТРОНІКИ "
кафедра Мереж і пристроїв телекомунікацій
РЕФЕРАТ
На тему:
«Пороги та методи фільтрації мовного сигналу в вейвлет області»
МІНСЬК, 2008

Жорсткий поріг фільтрації мовного сигналу.
Жорсткий поріг фільтрації встановлюється для кожної рівня вейвлет розкладу.
Даний поріг реалізується наступним чином:
- На i-му рівні розкладання обчислюється рівень порогу за формулою
, (1)
де - Значення вейвлет-відліку з максимальною амплітудою; * -Кількість ненульових вейвлет-відліків.
У процентному співвідношенні цей вираз має вигляд
, (2)
де - Величина порогу у відсотках;
- Поелементне порівняння всіх ненульових елементів N-го рівня з заданим порогом і обнулення всіх звітів, рівних або менше цього рівня.
Переваги даного методу порогової обробки:
- Найменша обчислювальна складність зі розглянутих методів.
Недоліки цього методу порогової обробки:
- Можливість повної втрати корисного сигналу при високому рівні
шуму;
- Можливість втрати корисного сигналу також і при малому рівні шуму.

Блок схема алгоритму фільтрації з жорстким порогом представлена ​​на рис. 1.

Рис. 1. Блок схема алгоритму фільтрації з жорстким порогом
На рис. 2 зліва представлені графіки двох рівнів вейвлет розкладання-мовного сигналу (першого і другого деталізують рівня і другого апроксимаційного рівня), а праворуч - графіки вейлет-коефіцієнтів після порогової обробки.

Рис. 2 Графіки двох рівнів вейвлет-розкладу мовного сигналу і вейлет-коефіцієнтів після порогової обробки

Гнучкий поріг фільтрації мовного сигналу.
При даному виді фільтрації для завдання порога використовується кількісна оцінка вейвлет-коефіцієнтів на кожному рівні розкладання.
Даний метод полягає в наступному:
- На i-му рівні розкладання обчислюється кількість ненульових вейвлет-коефіцієнтів ;
- Обчислюється кількість Обнуляємо вейвлет-коефіцієнтів на i-му рівні за наступною формулою
, (3)
де - Кількість рівнів вейвлет-розкладу; - Номер рівня розкладання;
- Встановлюється порядок обнулення вейвлет-коефіцієнтів: видалення елементів з мінімальною або максимальною амплітудою.
Переваги даного методу порогової обробки:
- Можливість досягнення компромісу між якістю мовного сигналу та обчислювальної складністю;
- Гнучкість фільтрації зашумленного мовного сигналу.
Недоліки цього методу порогової обробки:
- Неможливість точно визначити межі сигналу і шуму.

Блок схема алгоритму фільтрації з гнучким порогом представлена ​​на рис. 3.

Рис. 3. Блок схема алгоритму фільтрації з гнучким порогом
На малюнку 4 зліва представлені графіки двох рівнів вейвлет-розкладу мовного сигналу (першого і другого деталізують рівня і другого апроксимаційного рівня), а праворуч - графіки вейлет-коефіцієнтів після порогової обробки.

Рис. 4 Графіки двох рівнів вейвлет-розкладу мовного сигналу і вейлет-коефіцієнтів після граничної обробки

Статистичний метод фільтрації мовного сигналу.
Запропоновано ефективний метод фільтрації мовного сигналу, що використовує статистику розподілу амплітуди вейвлет-коефіцієнтів на кожному i-му рівні розкладання.
Суть реалізація методу полягає в наступному:
- Визначення на i-му рівні вейвлет-коефіцієнта з однаковою амплітудою (з або без урахування знака) і максимальною частотою повторення;
- Обнулення даних коефіцієнтів на кожному i-му рівні розкладання,
- Повторення попередніх кроків з урахуванням досягнення необхідного коефіцієнта стиску при збереженні прийнятної якості відновленого мовного сигналу.
Переваги даного методу порогової обробки:
- Поліпшення коефіцієнта стиснення та якості відновленого мовного сигналу;
- Найменша втрата корисного сигналу;
- Можливість ефективного усунення надмірності в частотній області;
- Ефективність фільтрації шумів, з великою тривалістю.
Недоліки цього методу граничної обробки: - висока обчислювальна складність.
Блок схема алгоритму фільтрації статистичним методом представлена ​​на рис. 5.

Рис. 5. Блок схема алгоритму фільтрації статистичним методом
На рис. 6 зліва представлені графіки двох рівнів вейвлет-розкладу мовного сигналу (першого і другого деталізують рівня і другого апроксимаційного рівня), а праворуч - графіки вейлет-коефіцієнтів після порогової обробки.


Рис. 6 Графіки двох рівнів вейвлет-розкладу мовного сигналу і вейлет-коефіцієнтів після порогової обробки

Оцінка якості відновленого мовного сигналу.
Оцінка якості мовного сигналу є важливим завданням. Відношення сигнал / шум (ЗОШ), яке є однією з найбільш поширених об'єктивних заходів для оцінки якості фільтрації зашумленного мовного сигналу, задається виразом
, (4)
де s (n) і - Вибіркові значення вихідного і відновленого мовного сигналу відповідно; M - загальна кількість вибірок в межах мовного сигналу.
Дане ЗСШ є інтегральною мірою якості відновлення мови. Більш точною мірою, враховує присутність в мовному сигналі низько амплітудних компонент, є сегментне ЗСШ (СЕГОСШ), засноване на обчисленні короткочасного ЗСШ для кожного N-точкового сегмента мови
, (5)
де L і N - число сегментів і відліків в сегменті мовного сигналу відповідно; i - номер сегмента мовного сигналу; M = LN - число відліків мовного сигналу, що складається з L сегментів з N відліками.
Так як операція усереднення здійснюється після логарифмування, то СЕГОСШ більш точно оцінює якість фільтрації нестаціонарного мовного сигналу.
На рис. 7 представлений графік залежності ЗСШ сигналу і коефіцієнта стиснення при фільтрації мовного сигналу статистичним методом.
З рис. 7 видно що ЗСШ експоненціально зменшується зі збільшенням коефіцієнта стиснення. Наприклад при коефіцієнті стиснення 3 ЗСШ одно 3,2.

Рис. 7. Графік залежності ЗСШ сигналу і коефіцієнта стиску при фільтрації мовного сигналу статистичним методом
Огляд методів підвищення якості і розбірливості зашумлених мовних сигналів показує, що існує багато різних підходів до обробки зашумленной мови. Така різноманітність методів зумовлено як важливістю проблеми так і відсутністю достатньо надійних методів її вирішення. Об'єктивне порівняння цих методів і вибір найбільш прийнятних зробити дуже важко, так як перед системами корекції мовних сигналів ставляться різні завдання. Наприклад, можна в якості головного критерію використовувати підвищення розбірливості мови, допускаючи при цьому можливість спотворень у тембрі голосу або поява артефактів у вигляді структурованого шуму. Можна поставити за мету зниження стомлюваності аудитора або збереження натуральності голосу диктора, що досягається в основному за рахунок підвищення якості мовного сигналу. Нарешті, можуть бути відомі заздалегідь важливі апріорні відомості, наприклад тип та параметри шуму, характеристики голосу диктора, нарешті, гіпотези про вимовному тексті, що також може визначальним чином вплинути на вибір методу фільтрації. Важливо зазначити, що універсальних методів обробки, які однаково добре боролися б із суттєво нестаціонарними та стаціонарними, адитивними та мультиплікативними шумами, істотно підвищували б якість і одночасно розбірливість мовлення, зараз немає, і можливо не буде. Як типова (за рідкісними, зазначеними в огляді винятками, спостерігається зворотна тенденція: якщо порівнювати системи обробки зашумленной промові з двома показниками - підвищенню якості звучання мовних сигналів та підвищення розбірливості, то системи, підвищують якість і натуральність звучання, швидше за все знижують розбірливість і навпаки, підвищення розбірливості призводить до зниження якості і натуральності звучання. Тому, багато хто з названих методів фільтрації потрібно розглядати як взаємодоповнюючі, і в ідеальному випадку потрібно мати бібліотеку з декількох методів фільтрації. Розглядаючи останні тенденції в області обробки зашумлених сигналів, слід особливо виділити високі результати, отримані за рахунок використання математичних моделей мовних сигналів, а також використання нейроподібних структур для фільтрації адитивних стаціонарних шумів, хоча перші результати в цьому напрямку програють більш традиційним методам типу мінімальної середньоквадратичної оцінки.

Література
1. Шелухін О.І., Лукьянцев Н.Ф. Цифрова обробка і передача мови .- М.: Радіо і зв'язок, 2000.
2. Рабинер Л.Р., Шафер Р.В. Цифрова обробка мовних сігналов.-М.: Радіо і зв'язок, 20011.
3. Секунь Н.Ю. Обробка звуку на PC .- СПб.: БХВ-Петербург, 2001.
4. Нейрокомп'ютери в системах обробки зображень. - М.: Радіотехніка, 2003.
5. Назаров М.В., Прохоров Ю.М. Методи цифрової обробки і передачі мовних сигналів .- М.: Радіо і зв'язок, 2005.
Додати в блог або на сайт

Цей текст може містити помилки.

Комунікації, зв'язок, цифрові прилади і радіоелектроніка | Реферат
21.1кб. | скачати


Схожі роботи:
Кодер - декодер мовного сигналу
Система обробки аудіоінформації Підсистема фільтрації і обробки сигналу
Шкідливі речовини на робочому місці та методи їх фільтрації
Поляризаційна структура випроміненого сигналу прийнятого сигналу Когерентне об`єднання накопичення
Вейвлет-перетворення
Види та порядок проведення вейвлет-аналізу
Особливості гель-фільтрації
Програма фільтрації шумів
Висновок рівняння Лапласа Плоскі задачі теорії фільтрації
© Усі права захищені
написати до нас