Борискевич А.А. Сжатие речевых сигналов на основе вейлетного и фрактального преобразований лабораторная работа
скачать (1170 kb.)
Доступные файлы (1):
1.doc | 1170kb. | 16.12.2011 09:01 | ![]() |
содержание
- Смотрите также:
- Борискевич А.А. Цифровая обработка речи и изображений [ документ ]
- Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов [ документ ]
- Пашенцев В.Н., Струков Ю.Н. Измерительный комплекс на основе персонального компьютера и измерительных модулей [ документ ]
- Лабораторная по Сопромату [ лабораторная работа ]
- по курсу сопротивления материалов [ лабораторная работа ]
- 1-3 [ лекция ]
- Лабораторная работа по исследованию аппаратуры [ лабораторная работа ]
- Молодой ученый 2010 №1-2. Том 1 [ документ ]
- Алгоритмы фильтрации сигналов в АСУТП [ документ ]
- Сигналы и линейные системы [ лекция ]
- Формирование и передача сигналов [ лекция ]
- Преобразование формы и спектра сигналов безынерционным нелинейным элементом [ документ ]
1.doc
Министерство образования Республики БеларусьУчреждение образования
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ
Кафедра сетей и устройств телекоммуникаций
А.А. Борискевич, О.В. Холев, В.Ю. Цветков
СЖАТИЕ РЕЧЕВЫХ СИГНАЛОЛВ НА ОСНОВЕ
ВЕЙЛЕТНОГО И ФРАКТАЛЬНОГО ПРЕОБРАЗОВАНИЙ
Методические указания
к лабораторной работе по курсу
«Цифровая обработка речи и изображений»
для студентов специальности «Сети телекоммуникаций»
дневной формы обучения
Минск 2004
УДК 621.391.23 (075.8)
ББК 32.811.3 я 73
Б82
Борискевич А.А.
С33 | Сжатие речевыхсигналов на основе вейвлетного и фрактального преобразований: Метод. пособие к лаб. работе по дисц. «Цифровая обработка речи и изображений» для студ. спец. «Сети телекоммуникаций» дневной формы обуч. / Сост. А.А. Борискевич, О.В. Холев, В.Ю. Цветков – Мн.: БГУИР, 2004. – 35 с.: ил. ISSN 985-444-701-4 |
| В данном методическом пособии рассмотрены вопросы спектрального анализа и сжатия речевых сигналов на основе дискретного вейвлет-преобразования и фрактального преобразования. При сжатии речевого сигнала используются вейвлеты Добеши с 4-го по 40-й порядок и доменно-ранговое сопоставление. Сведения, представленные в настоящем пособии, могут быть использованы для решения задач обработки и защиты речевых сигналов. УДК 621.391.23 (075.8) ББК 32.811.3 я 73 |
©.Борискевич А.А., Холев О.В., Цветков В.Ю.
составление, 2004
© БГУИР, 2004
^
Изучение вопросов спектрального анализа и сжатия речевых сигналов на основе вейвлет-преобразования и фрактального преобразования.
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1. Введение
Поскольку речевой сигнал представляет собой нестационарный случайный процесс, то для его обработки целесообразно применять методы вейвлет-анализа, позволяющие разложить сигнал по функциям, локализованным как в частотной области, так и во временной области. В силу этого алгоритмы вейвлет-анализа могут эффективно выделять временные и частотные особенности речевого сигнала.
Вейвлетом называется некоторая функция, хорошо локализованная (т.е. сосредоточенная в небольшой окрестности некоторой точки и резко убывающая до нуля по мере удаления от нее) как во временной, так и в частотной области. Эти функции могут быть симметричными и несимметричными. Некоторые функции имеют аналитическое выражение, другие – быстрый алгоритм вычисления связанного с ними вейвлет-преобразования. Термин вейвлет (wavelet), введенный впервые Морле (J. Morlet), образован из двух частей – корня wave (волна) и уменьшительного суффикса – let. Таким образом, непосредственный перевод звучит как маленькая, или короткая волна. Малость относится к условию, что эта функция имеет конечную длину (компактный носитель). Волна относится к условию, что функция колебательная (осциллирующая). К вейвлету можно применить две операции: сдвиг, т.е. перемещение области его локализации во времени; масштабирование (растяжение или сжатие), т.е. перемещение области его локализации по частоте. Использование этих операций, с учетом свойства локальности вейвлета в частотно-временной области, позволяет анализировать данные на различных масштабах и точно определять положение их характерных особенностей во времени.
Вейвлеты обладают существенными преимуществами по сравнению с преобразованием Фурье, потому что с их помощью можно анализировать кратковременные локальные особенности сигналов, например, короткие всплески или провалы, разрывы и ступеньки и т.д. Уникальные свойства вейвлетов позволяют сконструировать базис, в котором представление данных может выражаться небольшим количеством ненулевых коэффициентов. Это свойство делает вейвлеты привлекательными для сжатия данных, в том числе видео- и аудиоинформации. Вейвлет-преобразование можно представить как один из методов первичной обработки сигнала для повышения эффективности его сжатия. Непосредственно сжатие выполняется после этой предобработки классическими методами. При этом сжатие выполняется для коэффициентов вейвлет-разложения сигнала, а его реконструкция по этим коэффициентам производится на этапе восстановления (декомпрессии). Сжатие вейвлет-разложения сигнала более эффективно, чем сжатие исходного сигнала.
Один из перспективных методов сжатия речевых сигналов основан на использовании дискретного вейвлет-преобразования и фрактального преобразования. Фрактально-вейвлетное преобразование пытается объединить самое лучшее из двух подходов: вейвлет-представления сигналов и фрактального преобразования.
Слово фрактал образовано от латинского fractus, от которого происходят английские термины fraction, fractional - дробь, дробный. Фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому. Фрактал - это грубая или фрагментированная геометрическая форма, которая может быть разделена на части, каждая из которых, по крайней мере приблизительно, уменьшенная копия целого. Одним из основных свойств фракталов является самоподобие, т.е. когда форма фрактальных объектов не изменяется в геометрическом или статистическом смысле при изменении масштаба. Это свойство резко отличает фракталы от объектов классической геометрии, которые упрощаются при увеличении их изображения. В то время как фракталам присуща внутренняя бесконечность, т.е. при увеличении масштаба изображения фрактала увеличивается число невидимых деталей.
^
Интегральное вейвлет-преобразование
Важнейшим средством спектрального анализа непериодических сигналов является интегральное преобразование Фурье, которое вычисляется как скалярное произведение сигнала s(t) с комплексными экспонентами или синусоидами


где ^ () – преобразование Фурье или спектральная функция сигнала s(t).
Из (1) видно, что спектральный коэффициент вычисляется путем умножения временного сигнала s(t) на комплексную синусоиду с частотой и интегрирования в пределах всего времени. Чтобы преобразование было применимо, сигнал s(t) должен удовлетворять следующим требованиям: должны выполняться условия Дирихле и сигнал должен быть абсолютно интегрируемым, т.е. существует интеграл

С практической точки зрения непрерывное преобразование Фурье имеет ряд недостатков. Во-первых, для получения преобразования требуется вся временная информация. Поскольку частота сигнала обратно пропорциональна его продолжительности, то для получения высокочастотной информации с достаточной точностью важно извлекать ее из относительно малых временных интервалов, а не из всего сигнала, и наоборот, низкочастотную спектральную информацию – извлекать из относительно широких временных интервалов сигнала. Во-вторых, частотное наполнение сигнала известно, но появление частотных составляющих во времени не известно. Таким образом, данное преобразование позволяет увидеть частотное наполнение сигналов, но не позволяет определить, в какой момент времени существует та или иная частота. Поэтому преобразование Фурье непригодно для анализа нестационарных сигналов, в которых в разные моменты времени присутствуют различные частотные компоненты. В стационарных же сигналах все частотные компоненты присутствуют в течение всего времени, т.е. различные частоты имеются на всем временном интервале. Преобразование Фурье может использоваться для анализа нестационарных сигналов, когда важна лишь частотная информация, а время существования спектральных составляющих неважно.
Для частотно-временной локализации структурных элементов сигнала используется кратковременное, или оконное, преобразование Фурье:

где S(,b) – преобразование Фурье сигнала s(t), умноженного на оконную (локальную) функцию w(t-b).
Таким образом, S(,b) – разложение сигнала по семейству функций

Интегральное вейвлет-преобразование дает сходное частотно-временное описание с некоторыми существенными отличиями и представляет собой скалярное произведение сигнала s(t) и двухпараметрической вейвлет-функции






где a – параметр временного масштаба, определяемый как (1/частота) и отвечающий за ширину вейвлета, b – параметр сдвига, определяющий положение вейвлета на оси времени.
Нормализация





Сущность интегрального вейвлет-преобразования заключается в разбиение сигнала s(t) на масштабированные и сдвинутые по оси времени версии материнского вейвлета и вычислении коэффициентов корреляции участков исходного сигнала s(t) и версий вейвлета


На рис.1,б представлено разбиение частотно-временной плоскости для оконного преобразования Фурье, а на рис.2,б – для интегрального вейвлет-преобразования.

Рис.1. Оконное преобразование Фурье в плоскости время-частота:
а – пример базисных функций



Рис.2. Вейвлет-преобразование в плоскости время-частота:
а – пример базисных вейвлет-функций при различных масштабах: (а=2k, k=0,1,2);
б – условное изображение вейвлет-функций на заданном масштабе (заштрихованные прямоугольники)
В соответствии с принципом неопределенности сужение окна анализа во временной области вызывает расширение его в частотной. Таким образом, площадь окна (прямоугольника) остается постоянной. При оконном преобразовании Фурье окно анализа строго локализовано по времени и частоте, а при непрерывном вейвлет-преобразовании локализация изменяется в зависимости от масштаба. Деление t и b на масштабный коэффициент позволяет сохранить относительную плотность расположения базисных функций по оси t при расширении/сжатии самой функции и при b/a=const. Каждый прямоугольник (рис.2) соответствует значению вейвлет-преобразования на частотно-временной плоскости. Все точки, принадлежащие одному прямоугольнику, представляются одним значением вейвлет-преобразования. Прямоугольники разной ширины и высоты имеют одинаковую площадь. На нижних частотах высота прямоугольников меньше (что соответствует лучшему разрешению по частоте), а ширина прямоугольников больше (что соответствует худшему разрешению по времени). На высоких частотах разрешение по времени улучшается, а по частоте - ухудшается. Таким образом, вейвлет-преобразование позволяет получить хорошее разрешение по времени (плохое по частоте) на высоких частотах и хорошее разрешение по частоте (плохое по времени) на низких частотах. Этот подход становится особенно эффективным, когда сигнал имеет высокочастотные компоненты короткой длительности и протяженные низкочастотные компоненты. В случае оконного преобразования Фурье частотно-временная плоскость состоит из прямоугольников одинакового размера.
Из (2) и (3) видно, что оба преобразования представляют скалярное произведение s(t) и семейства функций, снабженных двумя индексами,








Важным различием является то, что в случае вейвлет-преобразования в наиболее общей постановке не конкретизируется не только сам порождающий вейвлет, но и то, какие его копии участвуют в разложении. Таким образом, термин вейвлет-преобразование является обозначением целого класса разложений. Преобразование Фурье является разложением по фиксированной системе функций.
При базисных параметрах (a,b) обратное вейвлет-преобразование имеет вид

где

Условие конечности константы C ограничивает класс функций (t), которые могут быть использованы в качестве базисных вейвлетов. Из определения C следует, что Фурье-образ () должен быть равен нулю в начале координат =0 и, следовательно, должен быть равен нулю по крайней мере нулевой момент:

Условие (5) не накладывает много ограничений, так как может быть найдено множество вейвлет-функций, удовлетворяющих (5).
Признаками, которыми обязательно должна обладать функция, чтобы быть вейвлетом, являются следующие.
Локализация. Вейвлет-преобразование в отличие от преобразования Фурье использует локализованную базисную функцию. Вейвлет должен быть локализован и во времени, и по частоте. Для этого достаточно, чтобы выполнялись условия


Нулевое среднее. Среднее значение вейвлета должно быть равным нулю (5), т.е. значения функции быстро сходятся к нулю при увеличении абсолютного значения аргумента. Это условие является общим для всех вейвлетов. Оно называется условием осцилляций, или знакопеременности. Налагаемое на функцию



В частотной области спектры многих вейвлетов напоминают всплеск, пик которого приходится на частоту

Часто для практических приложений оказывается необходимым, чтобы не только нулевой, но и все первые p моментов были равны нулю:

где p =0,1,…,M-1 (M – число нулевых моментов). Это условие ортогональности вейвлета полиномам до степени M-1, определяющее его гладкость и знакопеременность. Такой вейвлет называется вейвлетом p-го порядка. Он позволяет анализировать более тонкую структуру сигнала, подавляя медленно изменяющиеся (полиномиальные) его составляющие сигнала вида

Ограниченность. Вейвлет должен быть достаточно быстро убывающей функцией временной переменной:

^ Характерным признаком базиса вейвлет-преобразования является его самоподобие. Все вейвлеты данного семейства

Основной при работе с вейвлет-преобразованием является проблема выбора наиболее подходящего вейвлета. Выбор конкретного семейства вейвлетов диктуется прикладными задачами и типом информации о сигнале, который требуется максимально проявить (распознать). Не существует каких-то жёстких правил, но лучше всего выбирать вейвлет таким образом, чтобы он принадлежал такому же классу функций, что и анализируемый сигнал. Если исходную функцию можно аппроксимировать полиномом, то количество нулевых моментов вейвлета должно примерно равняться степени полинома. В качестве возможных критериев для выбора конкретного вейвлета можно использовать число нулевых моментов вейвлета и число вейвлет-коэффициентов, превышающих некоторое пороговое значение.
Число нулевых моментов более важно для достижения более высокого коэффициента сжатия сигнала, который при большом числе нулевых моментов увеличивается. Гладкость вейвлета становится важнее при обратном преобразовании, когда необходимо сгладить ошибки, вызванные сжатием (отбрасыванием малых вейвлет-коэффициентов).
Располагая вейвлет-спектром, можно рассчитать полную энергию сигнала

и глобальный спектр энергии - распределение полной энергии по масштабам (скейлограмму вейвлет-преобразования)

Скейлограмма соответствует спектру мощности Фурье-преобразования сигнала, сглаженному на каждом масштабе спектром Фурье анализирующего вейвлета:

Интегральное вейвлет-преобразование обладает следующими недостатками. Во-первых, оно дает избыточную информацию при анализе сигналов из-за перекрытия носителей вейвлета, во-вторых, оно может быть проведено аналитически лишь для простейших функций, а его компьютерное вычисление требует больших временных и вычислительных ресурсов. Поэтому в приложениях обычно используется дискретный вариант, который при специальном выборе базисных функций может быть выполнен достаточно эффективно и без дополнительных затрат памяти.
Примеры часто используемых вейвлетов
1. HAAR-вейвлет:


2. FHAT-вейвлет (French hat):



3. Wave-вейвлет:


4. MHAT-вейвлет (Mexican hat):


5. Вейвлет Морле ( комплексный базис):


^
Для лучшей частотно-временной локализации (t) должен быть отличен от нуля только в конечном интервале, называемом компактным носителем. Параметры масштаба а и сдвига b меняются непрерывно, и поэтому множество базисных функций избыточно. Для устранения этого недостатка необходима дискретизация значений а и b при сохранении возможности восстановления сигнала из его преобразования. В связи с этим для a берутся целые (отрицательные и положительные) степени фиксированного параметра a0 >1, т.е.


Для дискретных значений а и b вейвлет-функции представляются в виде

и образуют ортонормированный базис для квадратично интегрируемых функций на действительной оси. Свойство ортогональности позволяет получать независимую информацию на разных масштабах. Нормируемость обеспечивает сохранение величины информации на разных этапах преобразования.
Прямое дискретизированное вейвлет-преобразование сводится к вычислению коэффициентов


Здесь



для всех s(t) L2(R), где L2(R) означает множество функций, интегрируемых с квадратом в интервале R; R:=(-, +) – бесконечный интервал определения значений независимой переменной; Z –…-1,0,1,2,…– множество целых чисел. Из (12) следует, что хотя реконструкция s(t) из ее вейвлет-коэффициентов может не совпадать точно с s(t), она будет близка к ней в смысле обеспечения минимума средней квадратической погрешности восстановления. Из (4) и (11) следует выражение для обратного дискретизированного вейвлет-преобразования

Если базисные функции нормализованы таким образом, что C = 1, то окончательная формула реконструкции сигнала записывается в виде

Дискретизированное вейвлет-преобразование наиболее эффективно в задачах сжатия сигналов и изображений, задаче очистки сигнала от шумов. Непрерывное вейвлет-преобразование в основном используется для анализа переходных процессов, обнаружения резких изменений в сигнале и исследования нестационарностей.
Особой разновидностью непрерывного вейвлет-преобразования является диадное (dyadic) вейвлет-преобразование (a0=2), которое часто называют дискретным и с помощью которого согласно (13) при j= -m/2; n=k любой квадратично-интегрируемый сигнал s(t)L2(R) может быть представлен в виде суммы

Важной особенностью подобной дискретизации является исключение перекрытия носителей вейвлетов, т.е. устранение избыточности в ходе вейвлет-преобразования. Выбор знака или при степени a0 зависит от выбора исходного размера вейвлета – растянутый или сжатый. Если растягиваем (сжимаем) материнский вейвлет (t) относительно сигнала в процессе преобразования, то выбирается () при степени a0. Индекс j является параметром масштаба и называется уровнем разрешения, индекс k является параметром сдвига. В частности, коэффициенты



Частичную сумму ряда (14)

называют приближением сигнала s(t) c разрешением j0. Сигнал можно представить в виде суммы начального приближения (т.е. приближение с некоторым начальным разрешением j0) и оставшихся членов ряда (14):

Такое разложение обеспечивает многомасштабный анализ s(t). Первый член ряда является грубым представлением сигнала. При добавлении к нему членов ряда степень детализации увеличивается, т.е. увеличивается разрешение, с которым представлен сигнал.
Скачать файл (1170 kb.)