Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Борискевич А.А. Цифровая обработка речи и изображений - файл тема12.doc


Борискевич А.А. Цифровая обработка речи и изображений
скачать (5335.1 kb.)

Доступные файлы (16):

Литература.doc34kb.28.04.2007 17:48скачать
Содержание.doc68kb.28.04.2007 17:09скачать
тема10.doc1416kb.28.04.2007 17:42скачать
тема11.doc917kb.28.04.2007 17:47скачать
тема12.doc1926kb.28.04.2007 17:45скачать
Тема 13.doc5561kb.28.04.2007 17:46скачать
тема14.doc177kb.28.04.2007 17:46скачать
Тема 1.doc182kb.28.04.2007 17:34скачать
Тема 2.doc549kb.28.04.2007 17:41скачать
Тема 3.doc243kb.28.04.2007 17:33скачать
тема 4.doc297kb.28.04.2007 17:34скачать
Тема 5.doc1150kb.28.04.2007 17:35скачать
Тема 6.doc3287kb.28.04.2007 17:41скачать
Тема 7.doc529kb.28.04.2007 17:38скачать
Тема 8.doc985kb.28.04.2007 17:39скачать
тема 9.doc1022kb.28.04.2007 17:42скачать

тема12.doc

  1   2   3
Тема 12. Вейвлет-преобразования речи и изображений (4 часа) [10, 17]

    1. Интегральное вейвлет-преобразование

Важнейшим средством спектрального анализа непериодических сигналов является интегральное преобразование Фурье, которое вычисляется как скалярное произведение сигнала s(t) с комплексными экспонентами или синусоидами :

, (12.1)

где S() – преобразование Фурье или спектральная функция сигнала s(t).

Из (12.1) видно, что спектральный коэффициент вычисляется путем умножения временного сигнала s(t) на комплексную синусоиду с частотой  и интегрирования в пределах всего времени. Чтобы преобразование было применимо, сигнал s(t) должен удовлетворять следующим требованиям: должны выполняться условия Дирихле и сигнал должен быть абсолютно интегрируемым, т.е. существует интеграл. Подобные условия значительно сужают класс допустимых сигналов.

С практической точки зрения непрерывное преобразование Фурье имеет ряд недостатков. Во-первых, для получения преобразования требуется вся временная информация. Поскольку частота сигнала обратно пропорциональна его продолжительности, то для получения высокочастотной информации с достаточной точностью важно извлекать ее из относительно малых временных интервалов, а не из всего сигнала, и наоборот, низкочастотную спектральную информацию – извлекать из относительно широких временных интервалов сигнала. Во-вторых, частотное наполнение сигнала известно, но появление частотных составляющих во времени не известно. Таким образом, данное преобразование позволяет увидеть частотное наполнение сигналов, но не позволяет определить, в какой момент времени существует та или иная частота. Поэтому преобразование Фурье непригодно для анализа нестационарных сигналов, в которых в разные моменты времени присутствуют различные частотные компоненты. В стационарных же сигналах все частотные компоненты присутствуют в течение всего времени, т.е. различные частоты имеются на всем временном интервале. Преобразование Фурье может использоваться для анализа нестационарных сигналов, когда важна лишь частотная информация, а время существования спектральных составляющих неважно.

Для частотно-временной локализации структурных элементов сигнала используется кратковременное, или оконное, преобразование Фурье:

(12.2)

где S(,b) – преобразование Фурье сигнала s(t), умноженного на оконную (локальную) функцию w(t-b).

Таким образом, S(,b) – разложение сигнала по семейству функций , образованному из единственной функции с помощью переносов b по времени и переносов по частоте. Преобразование становится зависимым от времени, и в результате получается частотно-временное представление сигнала. Данный подход позволяет определить факт присутствия в сигнале любой частоты и интервал ее присутствия. Это значительно расширяет возможности метода по сравнению с классическим преобразованием Фурье, но существуют и определенные недостатки. Согласно принципу неопределенности Гейзенберга, при использовании данного преобразования нельзя утверждать факт наличия частоты 0 в сигнале в момент времени t0 – можно лишь определить, что определенный спектр частот (1, 2) присутствует в интервале (t1, t2). Таким образом, в результате спектрального анализа можно определить только временные интервалы, в течение которых в сигнале существуют полосы частот. Эта проблема называется проблемой разрешения. Данная проблема связана с шириной использующейся оконной функции. Эта ширина называется еще носителем функции. Если окно достаточно узкое, то говорят о компактном носителе. Узкое окно обеспечивает лучшее временное разрешение, а широкое - лучшее частотное. Проблема состоит в том, что приходится выбирать окно с фиксированной шириной для анализа всего сигнала, тогда как разные его участки могут требовать применения разных окон.

Интегральное вейвлет-преобразование дает сходное частотно-временное описание с некоторыми существенными отличиями и представляет собой скалярное произведение сигнала s(t) и двухпараметрической вейвлет-функции заданного вида. Причем любая вейвлет-функция данного семейства получается из единственной материнской функции путем растяжения/сжатия и сдвига . Термин «материнский» означает, что функции с различной шириной носителя, используемые в преобразовании, порождаются одной базовой функцией – материнским вейвлетом. Интегральное вейвлет-преобразование функции имеет вид

, (12.3)

где a – параметр временного масштаба, определяемый как (1/частота) и отвечающий за ширину вейвлета, b – параметр сдвига, определяющий положение вейвлета на оси времени.

Нормализация на множитель гарантирует, что интегральная энергия каждого вейвлета не зависит от а. Для вейвлет-преобразования анализирующая функция получается из одной материнской (или порождающей) функции , причем большие значения а соответствуют низким частотам, малые – высоким. Двухпараметрическая функция S(a,b) дает информацию об изменении относительного вклада компонент разного масштаба во времени и называется спектром коэффициентов вейвлет-преобразования. Масштаб является в определенном смысле аналогом частоты в Фурье-преобразовании. Однако в отличие от него каждому значению масштаба соответствует бесконечное количество сдвинутых друг относительно друга локализованных во времени вейвлет-функций. Довольно грубо можно представить вейвлеты как некоторые волновые функции (модулированные импульсами синусоиды), способные осуществлять преобразование Фурье не по всей временной оси, а локально по месту своего расположения. Для этого, кроме изменения средней частоты, маленькие волны должны перемещаться к тому месту сигнала, в котором должно осуществляться локальное преобразование Фурье.

Сущность интегрального вейвлет-преобразования заключается в разбиение сигнала s(t) на масштабированные и сдвинутые по оси времени версии материнского вейвлета и вычислении коэффициентов корреляции участков исходного сигнала s(t) и версий вейвлета на заданном масштабе. В результате получается набор коэффициентов, показывающих, насколько поведение сигнала в данный момент времени похоже на поведение вейвлета на данном масштабе, т.е. вейвлет-коэффициенты отражают близость сигнала к вейвлету данного масштаба. Чем ближе вид анализируемого сигнала в окрестности данного момента времени к виду вейвлета, тем большую абсолютную величину имеет соответствующий коэффициент. Отрицательные коэффициенты показывают, что сигнал похож на зеркальное отражение вейвлета. Таким образом, данное представление зависит от параметра масштаба a и вида функции , причем вейвлет-коэффициенты содержат информацию об анализирующем вейвлете и анализируемом сигнале.

На рис.12.1,б представлено разбиение частотно-временной плоскости для оконного преобразования Фурье, а на рис.12.2,б – для интегрального вейвлет-преобразования.



Рис.12.1. Оконное преобразование Фурье в плоскости время-частота:

а – пример базисных функций при сдвиге и k=1,2,3 (действительная часть); б – условное изображение базисных функций при заданных k (заштрихованные прямоугольники)



Рис.12.2. Вейвлет-преобразование в плоскости время-частота:

а – пример базисных вейвлет-функций при различных масштабах: (а=2k, k=0,1,2);

б – условное изображение вейвлет-функций на заданном масштабе (заштрихованные прямоугольники)
В соответствии с принципом неопределенности сужение окна анализа во временной области вызывает расширение его в частотной. Таким образом, площадь окна (прямоугольника) остается постоянной. При оконном преобразовании Фурье окно анализа строго локализовано по времени и частоте, а при непрерывном вейвлет-преобразовании локализация изменяется в зависимости от масштаба. Деление t и b на масштабный коэффициент позволяет сохранить относительную плотность расположения базисных функций по оси t при расширении/сжатии самой функции и при b/a=const. Каждый прямоугольник (рис.12.2) соответствует значению вейвлет-преобразования на частотно-временной плоскости. Все точки, принадлежащие одному прямоугольнику, представляются одним значением вейвлет-преобразования. Прямоугольники разной ширины и высоты имеют одинаковую площадь. На нижних частотах высота прямоугольников меньше (что соответствует лучшему разрешению по частоте), а ширина прямоугольников больше (что соответствует худшему разрешению по времени). На высоких частотах разрешение по времени улучшается, а по частоте - ухудшается. Таким образом, вейвлет-преобразование позволяет получить хорошее разрешение по времени (плохое по частоте) на высоких частотах и хорошее разрешение по частоте (плохое по времени) на низких частотах. Этот подход становится особенно эффективным, когда сигнал имеет высокочастотные компоненты короткой длительности и протяженные низкочастотные компоненты. В случае оконного преобразования Фурье частотно-временная плоскость состоит из прямоугольников одинакового размера.

Из (12.2) и (12.3) видно, что оба преобразования представляют скалярное произведение s(t) и семейства функций, снабженных двумя индексами, и . Когда а меняет свои значения, то а,0 (t) меняет свою частоту. Причем большие значения параметра а соответствуют малым частотам или большому масштабу, а малые параметры а соответствуют высоким частотам или мелкому масштабу. Различие между вейвлет-преобразованием и оконным преобразованием Фурье состоит в форме анализирующих функций и . Все функции , вне зависимости от значения , имеют одну и ту же ширину во времени. Наоборот, все имеют ширину во времени, соответствующую частоте : высокочастотные являются узкими, низкочастотные – широкими.

Важным различием является то, что в случае вейвлет-преобразования в наиболее общей постановке не конкретизируется не только сам порождающий вейвлет, но и то, какие его копии участвуют в разложении. Таким образом, термин вейвлет-преобразование является обозначением целого класса разложений. Преобразование Фурье является разложением по фиксированной системе функций.

При базисных параметрах (a,b) обратное вейвлет-преобразование имеет вид

, (12.4)

где – нормализующий коэффициент (аналогичный коэффициенту (2)1/2, нормализующему преобразование Фурье), зависящий от используемой вейвлет-функции.

Условие конечности константы C ограничивает класс функций (t), которые могут быть использованы в качестве базисных вейвлетов. Из определения C следует, что Фурье-образ () должен быть равен нулю в начале координат =0 и, следовательно, должен быть равен нулю по крайней мере нулевой момент:

(12.5)

Условие (12.5) не накладывает много ограничений, так как может быть найдено множество вейвлет-функций, удовлетворяющих (5).

Признаками, которыми обязательно должна обладать функция, чтобы быть вейвлетом, являются следующие.

Локализация. Вейвлет-преобразование в отличие от преобразования Фурье использует локализованную базисную функцию. Вейвлет должен быть локализован и во времени, и по частоте. Для этого достаточно, чтобы выполнялись условия и , где 0.

Нулевое среднее. Среднее значение вейвлета должно быть равным нулю (12.5), т.е. значения функции быстро сходятся к нулю при увеличении абсолютного значения аргумента. Это условие является общим для всех вейвлетов. Оно называется условием осцилляций, или знакопеременности. Налагаемое на функцию условие (12.5) означает, что . В силу чего Фурье-образ смещен по оси времени и будет расположен вокруг некоторой ненулевой частоты , которую можно рассматривать как среднюю круговую или центральную частоту вейвлета, которая определяет положение пика Фурье-образа вейвлета на оси частот.

В частотной области спектры многих вейвлетов напоминают всплеск, пик которого приходится на частоту. Если приближенно трактовать вейвлет как модулированную синусоиду, то ее частота и будет средней частотой вейвлета.

Часто для практических приложений оказывается необходимым, чтобы не только нулевой, но и все первые p моментов были равны нулю:

, (12.6)

где p =0,1,…,M-1 (M – число нулевых моментов). Это условие ортогональности вейвлета полиномам до степени M-1, определяющее его гладкость и знакопеременность. Такой вейвлет называется вейвлетом p-го порядка. Он позволяет анализировать более тонкую структуру сигнала, подавляя медленно изменяющиеся (полиномиальные) его составляющие сигнала вида . Порядок применяемых вейвлетов зависит от формы исходного сигнала: в случае наличия сильных флуктуаций лучше брать низкий порядок вейвлета, для более гладких сигналов следует применять вейвлеты высокого порядка. Выбор порядка вейвлета определяется гладкостью сигнала, требуемым уровнем сжатия и стоимостью вычислений, которая растет с ростом порядка.

Ограниченность. Вейвлет должен быть достаточно быстро убывающей функцией временной переменной:

. (12.7)

^ Автомодельность базиса. Характерным признаком базиса вейвлет-преобразования является его самоподобие. Все вейвлеты данного семейства имеют то же число осцилляций, что и базисный вейвлет (t), поскольку получены из него посредством масштабных преобразований и сдвигов.

Основной при работе с вейвлет-преобразованием является проблема выбора наиболее подходящего вейвлета. Выбор конкретного семейства вейвлетов диктуется прикладными задачами и типом информации о сигнале, который требуется максимально проявить (распознать). Не существует каких-то жёстких правил, но лучше всего выбирать вейвлет таким образом, чтобы он принадлежал такому же классу функций, что и анализируемый сигнал. Если исходную функцию можно аппроксимировать полиномом, то количество нулевых моментов вейвлета должно примерно равняться степени полинома. В качестве возможных критериев для выбора конкретного вейвлета можно использовать число нулевых моментов вейвлета и число вейвлет-коэффициентов, превышающих некоторое пороговое значение.

Число нулевых моментов более важно для достижения более высокого коэффициента сжатия сигнала, который при большом числе нулевых моментов увеличивается. Гладкость вейвлета становится важнее при обратном преобразовании, когда необходимо сгладить ошибки, вызванные сжатием (отбрасыванием малых вейвлет-коэффициентов).

Располагая вейвлет-спектром, можно рассчитать полную энергию сигнала

(12.8)

и глобальный спектр энергии - распределение полной энергии по масштабам (скейлограмму вейвлет-преобразования)

. (12.9)

Скейлограмма соответствует спектру мощности Фурье-преобразования сигнала, сглаженному на каждом масштабе спектром Фурье анализирующего вейвлета:, где знак ^ обозначает Фурье-образ функции.

Интегральное вейвлет-преобразование обладает следующими недостатками. Во-первых, оно дает избыточную информацию при анализе сигналов из-за перекрытия носителей вейвлета, во-вторых, оно может быть проведено аналитически лишь для простейших функций, а его компьютерное вычисление требует больших временных и вычислительных ресурсов. Поэтому в приложениях обычно используется дискретный вариант, который при специальном выборе базисных функций может быть выполнен достаточно эффективно и без дополнительных затрат памяти.

Примеры часто используемых вейвлетов

1. HAAR-вейвлет:



2. FHAT-вейвлет (French hat):


3. Wave-вейвлет:


4. MHAT-вейвлет (Mexican hat):



5. Вейвлет Морле ( комплексный базис):


12.2. Дискретизированное (дискретное избыточное) вейвлет-преобразование

Для лучшей частотно-временной локализации (t) должен быть отличен от нуля только в конечном интервале, называемом компактным носителем. Параметры масштаба а и сдвига b меняются непрерывно, и поэтому множество базисных функций избыточно. Для устранения этого недостатка необходима дискретизация значений а и b при сохранении возможности восстановления сигнала из его преобразования. В связи с этим для a берутся целые (отрицательные и положительные) степени фиксированного параметра a0 >1, т.е. , причем разные значения m соответствуют разной ширине вейвлетов. В этом случае дискретизация параметра сдвига b должна зависеть от m: узкие (высокие частоты) вейвлеты сдвигаются малыми шагами, чтобы покрыть весь временной спектр, в то время как более широкие (низкие частоты) вейвлеты сдвигаются большими шагами. Следовательно, , где b0 >0; m, n - целые. Возможен произвольный выбор параметра b0, например, b0 =1. С увеличением масштаба увеличивается размер шага сдвига, так как при анализе с большим масштабом детали не так важны.

Для дискретных значений а и b вейвлет-функции представляются в виде

(12.10)

и образуют ортонормированный базис для квадратично интегрируемых функций на действительной оси. Свойство ортогональности позволяет получать независимую информацию на разных масштабах. Нормируемость обеспечивает сохранение величины информации на разных этапах преобразования.

Прямое дискретизированное вейвлет-преобразование сводится к вычислению коэффициентов на основе дискретизации непрерывного вейвлет-преобразования (4):

(12.11)

Здесь – детализирующие коэффициенты для вейвлет-декомпозиции сигнала уровня m. Восстановление s(t) из последовательности возможно в том случае, если существуют числа A > 0 и B <  такие, что

(12.12)

для всех s(t) L2(R), где L2(R) означает множество функций, интегрируемых с квадратом в интервале R; R:=(-, +) – бесконечный интервал определения значений независимой переменной; Z –…-1,0,1,2,…– множество целых чисел. Из (12.12) следует, что хотя реконструкция s(t) из ее вейвлет-коэффициентов может не совпадать точно с s(t), она будет близка к ней в смысле обеспечения минимума средней квадратической погрешности восстановления. Из (12.4) и (12.11) следует выражение для обратного дискретизированного вейвлет-преобразования

(12.13)

Если базисные функции нормализованы таким образом, что C = 1, то окончательная формула реконструкции сигнала записывается в виде .

Дискретизированное вейвлет-преобразование наиболее эффективно в задачах сжатия сигналов и изображений, задаче очистки сигнала от шумов. Непрерывное вейвлет-преобразование в основном используется для анализа переходных процессов, обнаружения резких изменений в сигнале и исследования нестационарностей.

Особой разновидностью непрерывного вейвлет-преобразования является диадное (dyadic) вейвлет-преобразование (a0=2), которое часто называют дискретным и с помощью которого согласно (12.13) при j= -m/2; n=k любой квадратично-интегрируемый сигнал s(t)L2(R) может быть представлен в виде суммы

. (12.14)

Важной особенностью подобной дискретизации является исключение перекрытия носителей вейвлетов, т.е. устранение избыточности в ходе вейвлет-преобразования. Выбор знака  или  при степени a0 зависит от выбора исходного размера вейвлета – растянутый или сжатый. Если растягиваем (сжимаем) материнский вейвлет (t) относительно сигнала в процессе преобразования, то выбирается  () при степени a0. Индекс j является параметром масштаба и называется уровнем разрешения, индекс k является параметром сдвига. В частности, коэффициенты несут информацию о s(t) в окрестности частоты 1/ и моменты времени .

Частичную сумму ряда (12.14)



называют приближением сигнала s(t) c разрешением j0. Сигнал можно представить в виде суммы начального приближения (т.е. приближение с некоторым начальным разрешением j0) и оставшихся членов ряда (12.14):

. (12.15)

Такое разложение обеспечивает многомасштабный анализ s(t). Первый член ряда является грубым представлением сигнала. При добавлении к нему членов ряда степень детализации увеличивается, т.е. увеличивается разрешение, с которым представлен сигнал.
  1   2   3



Скачать файл (5335.1 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации