Пошук навчальних матеріалів по назві і опису в нашій базі:

Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5




152.65 Kb.
НазваЛабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5
Дата конвертації10.11.2012
Розмір152.65 Kb.
ТипЛабораторная работа
Зміст
Нормирование, латентные периоды
Лабораторная работа 2
Дискретне перетворення Фур'є (ДПФ)
Швидке перетворення Фур'є (ШПФ). Алгоритм Рейдера-Бреннера
Лабораторная работа 4 Полосы
Дискретное вейвлет-преобразование
Преобразование Уолша Преобразование Уолша-Адамара
Дискретное преобразование Уолша (ДПУ)
Двумерное БПУ
Преобразование Чебышева


Зміст

Лабораторная работа 1 2

Общая схема 2

Нормирование, латентные периоды 3

Лабораторная работа 2 5

Дискретне перетворення Фур'є (ДПФ) 5

Швидке перетворення Фур'є (ШПФ). Алгоритм Рейдера-Бреннера 7

Лабораторная работа 4 10

Полосы 10

Фільтрація 11

Дискретное вейвлет-преобразование 11

Преобразование Уолша 12

Преобразование Уолша-Адамара 12

Преобразование Чебышева 16

Лабораторная работа 1

Общая схема


Процес розпізнавання мови можливо представити у вигляді блок-схеми (мал.5.1).



Мал.5.1. Процес роспiзнавання мовного сигналу.

Загальна схема проектування пристроїв розпізнавання мови може бути наступною:

  • Блок аналізу мовних сигналів.

  • Первинний опис базисними функціями (СЕТ, РПФ, ППФ, Фур’є, Чебишева).

  • Вторинний опис за допомогою інтерполяційних та згладжуючих сплайнов.

  • Аналіз у фазовій площині (диференціювання сплайн-описів, перетворення Гільберта для сплайн-описів).

  • Вибір типів мовних одиниць (сегменти, склади, фонеми, слова, сегментно-складове представлення).

  • Сегментація за допомогою фільтрації огибаючих спектра або РПФ, застосування порогових методів для групових ознак, диференціювання функцій параметрів.

  • Обрання метрики та критеріїв порівняння (евклідова відстань, хемінгова відстань та ін.).

  • Обрання методів порівняння (марковські процеси, нейронні мережі, сплайн-ідентифікація і сплайн-синтез).

Нормирование, латентные периоды


Введення даних здійснюється за допомогою зчитування з wav файлу. Також було проведено дослідження у галузі отримання звукового сигналу безпосередньо з мікрофону (через саунд-бластер). Було з’ясовано, що в обох випадках повинна забезпечуватися належна якість аудіо сигналу, тому що додавання шумів або зниження якості сигналу, відповідно знизить надійність розпізнавання. Проте, не варто записувати сигнал із частотою дискретизації більшою 22кГц, тому що мова по своїй суті рідко містить сигнал із більшою частотою. І, крім того, надмірність інформації приведе до збільшення діапазону аналізованих значень, що істотно вплине на швидкість роботи всієї системи.

В даній випускній роботі введення здійснюється із звукового потоку с частотою квантування fкв=22кГц (файлів *.wav), який містить 16-ти бітні дані, кожне з яких є рівнем сигналу в даний момент часу.

Для wav-файлів формати займають перші 44 слова. Квантований мовний сигнал являє собою знакозмінну послідовність цілих чисел. У розглянутому варіанті частота квантування fкв=22КГц, із розрядністю 16 битий (формат слова) із межами значень ±32767(8). Реально діапазон значень для різних реалізацій може бути ±1000 до ±32767.

Внаслідок цього мовні реалізації непорівнянні за рівнем енергії (амплітудна, частотна, тимчасова нестаціонарності). Для послаблення частотної нестаціонарності мовний сигнал необхідно нормалізувати. Процес нормалізації реалізується в декілька етапів. Це пов'язано з тим, що на початку і в кінці мовного висловлення існують латентні періоди, що мають розмір рівня шуму з можливими сплесками, викликаними шумами різної природи.

Видалення латентних періодів пов'язано з вибором порогів видалення. На першому етапі задача нормування реалізує рішення підгонки мовного сигналу під деякий наперед заданий поріг (або спосіб його формування).

Припустимо, заданий мовний сигнал з числом відліків , з латентними періодами довільної довжини і з нульовим середнім значенням, тоді дисперсія має вигляд

.

Перший варіант завдання порога полягає в тому, що поріг обчислюється як

.

Всі значення сигналу нижче з початку і з кінця мовного сигналу відтинаються і формується сигнал із числом відліків N2, для якого знаходиться дисперсія виду

.

Нормований сигнал



буде мати діапазон значень у межах ±5 із числом відліків N2.

Однак завдання порога виконує свою задачу частково. Це пов'язано з тим, що усередині латентних періодів з'являються сплески від стукоту, пихтіння або плямкання губами.

Другий варіант - це обчислення спектрально-часової функції сигналу разом із латентними періодами. У спектрально-часовій функції знаходиться максимальне значення, відносно якого нормується , у результаті чого утвориться спектрально-часове уявлення в діапазоні значень (01). У цьому випадку досить для відтинання латентних періодів.

Лабораторная работа 2


Для початку, необхідно вибрати інтервали, на яких буде проводитись аналіз мовного сигналу, тому що нам необхідно перейти від аналогового сигналу до кінцевого числа дискретних значень. У теорії розпізнавання мови звичайно обирають інтервал від 10 до 20 мсек., тобто в два або більше разів довше інтервалу основного тону. Далі, на кожному отриманому інтервалі аналізу (відліку), необхідно визначити параметри мовного сигналу.

Таким чином, постановка задачі побудови первинного опису буде мати наступний вигляд: задано функцію вхідного сигналу F(t) із дискретними значеннями fi. Необхідно знайти частотне перетворення для цієї дискретно заданої функції.

Первинний опис мовного сигналу здійснюється за допомогою однієї з наступних базисних функцій: Фур`є, Мат`є, Чебишева, Ерміта, Лежандра або іншої. Значущою проблемою, яка підлягає вирішенню під час первинного аналізу мови є проблема гаяння часу при використанні ортогональних методів, що для описання мовного сигналу залучають дискретне перетворення Фур'є. У даній роботі ця проблема була вирішена шляхом використання ШПФ [13], а саме, алгоритму Рейдера-Бреннера, перевагою якого, на відміну від звичайного перетворення Фур'є, є значна швидкодійнсть.

Дискретне перетворення Фур'є (ДПФ)


Як відомо, просте гармонійне коливання описується функцією

Asin(t+0),

де s – відхилення коливної крапки від положення рівноваги, t – година, A – амплітуда коливання,  – кругова частота й 0 – початкова фаза. Нагадаємо , що період коливання Т дорівнює .

Функція Asin(t+0) називається простою гармонікою. Коливання накладення, що виходять у результаті, декількох простих гармонійних коливань, називаються складними гармонійними коливаннями.

Виникає питання: чи не можна так підібрати прості гармонійні коливання, щоб їхнє накладення викликало заздалегідь даний періодичний рух, тобто чи не можна представити всякий періодичний рух як складні гармонійне коливання?

Виявилося, що цього, як правило, зробити не можна, якщо обмежитися кінцевою сумою простих гармонік. Якщо ж залучити до розгляду нескінченні суми простих гармонік, тобто виряджай, то практично бу-якові періодичну функцію можна розкласти на прості гармоніки.

Тригонометричним поруч називається функціональний ряд

,

членами якого є синуси й косинуси від цілих кратних значень аргументу x.

Коротко тригонометричний ряд будемо записувати так:

.

Іноді зручно записувати ряд у вигляді суми простих гармонік



де – амплітуда, – n-та гармоніка.

Нехай тепер f(x) – довільна періодична функція з періодом 2. Постараємося розкласти цю функцію в тригонометричний ряд, тобто представити її у вигляді суми ряду



Якщо функція задана аналітичним вираженням, то за допомогою інтегрування можна обчислити її коэфициенті Фур'є (an,bn) і побудувати відповідний тригонометричний ряд. Але на практиці часто зустрічаються випадки, коли функція задається графічно або таблично.

Так звичайно одержують функцію, що описує досліджуваний процес, у результаті експерименту. Дані цього експерименту заносяться в таблицю або на графік, що іноді утвориться автоматично в самописних приладах. Задача, що виникає перед дослідником , складається у відшуканні відповідного аналітичного вираження для функції. Для цієї мети можуть бути вжиті тригонометричні ряди, оскільки є впевненість, що ця функція приблизно й досить точно може бути виражена сумою кінцевого числа перших членів її ряду Фур'є. Все питання полягає в знаходженні коефіцієнтів Фур'є у функції. Він може бути вирішений застосуванням одного зі способів наближеного обчислення інтегралів.

Нехай в інтервалі (0,2) задана функція y=f(x). Ми вважаємо, що при будь-якім завданні функції графік її нам відомий.

Наближене подання функції у вигляді багаточлена Фур'є вимагає відшукання перших коэфициентов Фур'є



Для обчислення інтегралів застосовується одна з формул для чисельного інтегрування, звичайно найпростіша з них – формула прямокутників. Інтервал (0, 2?) ділиться на n рівних частин за допомогою крапок



Тоді

,

де
А теперь как же это можно применить к системе распознавания речи.

Введем некоторые обозначения.

Пусть s(t) – исходный (считанный) сигнал, size = length(s(t)) – длинна исходного массива.

Сделаем некоторые несложные подсчеты.

Первое! Разобьем наш сигнал на кусочки длинной 256:

N = (int)size/256

То есть N – наше количество спектров. Заметим, что это число целое.

Вводим еще одно значение 256/2 = 128 – количество гормоник.

Теперь для каждого кусочка будем строить его спектральное представление.

Начинаем строить.


Швидке перетворення Фур'є (ШПФ). Алгоритм Рейдера-Бреннера


Значущою проблемою, яка підлягає рішенню під час первинного аналізу мови є проблема гаяння часу при використанні ортогональних методів, що для описання мовного сигналу залучають дискретне перетворення Фур'є. У даній роботі ця проблема була вирішена шляхом використання ШПФ, а саме, алгоритму Рейдера-Бреннера, перевагою якого, на відміну від звичайного перетворення Фур'є, є значна швидкодієвість.

Цей ШПФ-алгоритм є модифікацією алгоритму Кулі-Тьюкі, яка посилається на те, що за допомогою переупорядкування рівнянь ШПФ деякі множення на комплексні константи можна замінити множенням на дійсні константи.

Алгоритм Рейдера-Бреннера можна будувати виходячи з рівнянь для алгоритму з прорідженням за часом, але надамо перевагу рівнянням для алгоритму з проріджуванням за частотою:



Визначимо робочий вектор а рівностями



Так нехай



то величини V2k+1 та Ak зв'язані рівностями



Таким чином, множення на комплексні константи i вдалося замінити на множення на уявні константи , що зменшує обчислювальну складність. Необхідно, однак, прослідкувати, щоб не сталося переповнення за довжиною слова тому, що коли n досить велике, а i мале, нові константи стають занадто великими.

Коротко алгоритм Рейдера-Бреннера задається слідучою системою рівнянь









В результаті використання ШПФ до нормованих параметрів отримуємо матрицю спектральних коефіцієнтів , якою будемо користуватися при подальшому аналізі.

Лабораторная работа 4

Полосы


Для послаблення частотної нестаціонарності зі спектрально-часового уявлення, , будується спектрально-смугасто-часове уявлення в 9 смугах. Смуги будуються з коефіцієнтів спектрального розкладання по їхніх номерах за правилом:

  • 1,2 – (100–200) Гц;

  • 3,4 – (200–400) Гц;

  • 5,6 – (400–600) Гц;

  • 7,8 – (700–800) Гц;

  • 9,10 – (900–1000) Гц;

  • 11-15 – (1100–1500) Гц;

  • 15-25 – (1500–2500) Гц;

  • 26-50 – (2600–5000) Гц;

  • 50-110 – (5000–11000) Гц.

Енергія в кожній смузі обчислюється як результуючої суми векторів

,

,

,

,

,

,

,

,

.




У смугах 1-9 по параметру l утворяться сигнали , що в свою чергу є зашумленими і для кожного з них необхідно виконати фільтрацію виду (5.1), (5.2) із параметром частоти fcp≤0.1 і кількістю відліків N=7.

У підсумку утвориться двомірний масив , для котрого необхідно вирішити задачу сегментації на деякі одиниці мови (звуки). Один з варіантів надійної сегментації полягає в перегляді сукупності сигналів у смугах по параметру l, як різниці d значень двомірного масиву і визначення екстремумів функції різниці. У точках екстремумів знаходяться межі сегментів. Це так званий метод верифікації.

Фільтрація


Сигнали в смугах, отримані в спектрально-смужному уявленні дуже зачумлені за рахунок перерозподілу енергії зі смуги в смугу. Як вже було сказано вище, вторинне уявлення ми будемо формувати зі спектрального за допомогою низькочастотного фільтру. Вибір саме цього фільтру обумовлений тим, що мова містить саме низькочастотні шуми, а шуми високих частот у ній подані мало і не несуть істотного впливу на спектр.

Низькочастотні фільтри будуються для реалізації ковзного середнього з параметрами усереднення, що відповідають частоті зрізу і крутизні спадаючої ділянки частотної характеристики, за допомогою симетричного набору коефіцієнтів виду:

(5.1)

де fcp – частота зрізу фільтра. (fcp[0,0.5])

Тоді функція самого фільтра визначається як:

(5.2)

де – сигнал у смузі, що фільтрується; NP – половина числа точок, по яких будується фільтр (на практиці NP = 4, 5, 6).

Даний фільтр істотно залежить від частоти зрізу: при fcp=0,5 – низькочастотний фільтр перетворюється у високочастотний.

В подальшому, для одержання високих показників надійності розпізнавання, крім фільтрації застосовують ще декілька методів підвищення якості параметрів мовного сигналу.

Дискретное вейвлет-преобразование


В численном анализе и функциональном анализе дискретные вейвлет-преобразования (ДВП) относятся к вейвлет-преобразованиям, в которых вейвлеты представлены дискретными сигналами (выборками).

Первое ДВП было придумано венгерским математиком Альфредом Хааром. Для входного сигнала, представленного массивом 2n чисел, вейвлет-преобразование Хаара просто группирует элементы по 2 и образует от них суммы и разности. Группировка сумм проводится рекурсивно (в случае чётной длины последовательности сумм) для образования следующего уровня разложения. В итоге получается 2n - 1 разность и 1 общая сумма.

Это простое ДВП иллюстрирует общие полезные свойства вейвлетов. Во-первых, преобразование (один уровень) можно выполнить за O(n) операций. Во-вторых, оно не только раскладывает сигнал на некоторое подобие частотных полос (путём анализа его в различных масштабах), но и представляет временну́ю область, т. е. моменты возникновения тех или иных частот в сигнале. Вместе, эти свойства характеризуют быстрое вейвлет-преобразование — альтернативу обычному быстрому преобразованию Фурье.

Самый распространенный набор дискретных вейвлет-преобразований был сформулирован бельгийским математиком Ингрид Добеши (Ingrid Daubechies) в 1988 году. Он основан на использовании рекуррентных соотношений для вычисления всё более точных выборок неявно заданной функции материнского вейвлета, с удвоением разрешения при переходе к следующему уровню (масштабу). В своей основополагающей работе Добеши выводит семейство вейвлетов, первый из которых является вейвлетом Хаара. С тех пор интерес к этой области быстро возрос, что привело к созданию многочисленных потомков исходного семейства вейвлетов Добеши.

Другие формы дискретного вейвлет-преобразования включают непрореженное вейвлет-преобразование (где не выполняется прореживания сигналов), преобразование Ньюлэнда (где ортонормированный базис вейвлетов выводится из специальным образом построенных фильтров типа "top-hat" в частотной области). Пакетные вейвлет-преобразования также связаны с ДВП. Другая форма ДВП - комплексное вейвлет-преобразование.

У дискретного вейвлет-преобразования много приложений в естественных науках, инженерном деле, математике (включая прикладную). Наиболее широко ДВП используется в кодировании сигналов, где свойства преобразования используются для уменьшения избыточности в представлении дискретных сигналов, часто - как первый этап в компрессии данных.

Преобразование Уолша

Преобразование Уолша-Адамара


Существуют различные способы определения функций Уолша. Рассмотрим способ, основанный на взаимосвязи функций Уолша с функциями Радемахера. Последние определяются так:



где – безразмерное время (), k є N – порядок (номер) функции,



Система функций Радемахера ортонормированна на интервале (0,1), то есть



однако неполна.

Функции Уолша, образующие полную ортонормированную систему, теперь можно определить так:



(5)

где «(+)» – сложение по модулю 2; w – порядок (номер) функции; n=log2 N, где N=2n – количество функций системы; wii-тый разряд двоичного представления порядка функции w (отсчёт слева, начиная с 0).

Функции Уолша могут служить базисом для спектрального представления сигнала, то есть любую интегрируемую на интервале функцию можно представить рядом по системе функций Уолша:



с коэффициентами



Способ нумерации функций в системе называется упорядочением. Функции Уолша, сформированные в соответствии с выражением (5), упорядочены по Уолшу. На практике также применяется упорядочение по Адамару (had(h,Эта)) и по Пэли (pal(p,Эта)).

Функции had(h,Эта) можно сформировать с помощью матрицы Адамара. Матрицей Адамара HN порядка N=2n, n є N называется квадратная матрица размера N x N с элементами +1 такая, что

HN x HNT = N x E,

где HNT – транспонированная матрица, E – единичная матрица; при этом H1=1.

Матрицу Адамара легко построить рекурсивно, так как:



Функция Уолша, упорядоченная по Адамару (had(h,Эта)) с номером h, является последовательностью прямоугольных импульсов длительностью 1/N от интервала (0,1) с единичными амплитудами и полярностями, соответствующими знакам элементов h-той строки матрицы Адамара.

Для цифрового анализа сигнала используются дискретные функции Уолша, которые являются отсчётами соответствующих непрерывных функций. Каждый отсчёт расположен в середине связанного с ним элемента непрерывной функции длительностью 1/N от интервала (0,1). Дискретные функции Уолша, упорядоченные по Уолшу, можно определить так:



где xkk-тый разряд в представлении номера отсчёта x в двоичной системе счисления:



Другой формой представления дискретных функций Уолша является матрица Адамара, номера столбцов которой соответствуют номерам дискретных значений (отсчётов) функций Уолша, а номера строк – номерам функций Уолша.

Дискретное преобразование Уолша (ДПУ)

Дискретное преобразование Уолша (ДПУ) определяется так:



что в матричном виде (дискретное преобразование Уолша-Адамара, ДПУ) выглядит так:



Соответственно, обратное ДПУ:



так как



где – обратная матрица Адамара, а Hn*Hn-1=E – единичная матрица, при домножении на которую никакая матрица не изменяется.

Быстрое преобразование Уолша-Адамара (БПУ)

Схема быстрого преобразования Уолша-Адамара (БПУ) полностью аналогична схеме БПФ. Отличие в следующем:

поскольку базисные функции являются последовательностями прямоугольных импульсов единичной амплитуды, то коэффициенты в разложении будут +/-1, то есть вместо множителя W будет только сложение/вычитание;

упорядочение элементов выходного вектора зависит (определяется) упорядочением системы функций Уолша (по Уолшу, по Адамару).

Двумерное БПУ определяется так:



где X – матрица N x N, где N=2n, n є N. Соответственно, обратное двумерное БПУ:



Практическая реализация

На практике БПУ строится на основе ранее написанных процедур БПФ, в которых удаляется работа с мнимыми частями, переупорядочение перед рекурсивным вызовом и домножение на W при сборке.

Преобразование Чебышева


Фильтр Чебышёва — один из типов линейных аналоговых или цифровых фильтров, отличительной особенностью которого является более крутой спад амплитудно-частотной характеристики (АЧХ) и существенные пульсации амплитудно-частотной характеристики на частотах полос пропускания (фильтр Чебышёва I рода) и подавления (фильтр Чебышёва II рода), чем у фильтров других типов. Фильтр получил название в честь известного русского математика XIX века Пафнутия Львовича Чебышёва, так как характеристики этого фильтра основываются на многочленах Чебышёва.

Фильтры Чебышёва обычно используются там, где требуется с помощью фильтра небольшого порядка обеспечить требуемые характеристики АЧХ, в частности, хорошее подавление частот из полосы подавления, и при этом гладкость АЧХ на частотах полос пропускания и подавления не столь важна.

Это более часто встречающаяся модификация фильтров Чебышёва. Амплитудно-частотная характеристика такого фильтра n-го порядка задаётся следующим выражением:



где — показатель пульсаций, ω0частота среза, а Tn(x) — многочлен Чебышёва -го порядка.

В полосе пропускания такого фильтра видны пульсации, амплитуда которых определяется показателем пульсации (ripple factor) . В полосе пропускания многочлены Чебышёва принимают значения от 0 до 1, поэтому коэффициент усиления фильтра принимает значения от максимального до минимального . На частоте среза ω0 коэффициент усиления имеет значение , а на частотах выше неё продолжает уменьшаться с увеличением частоты.



Схожі:

Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №1. Изучение основ микроструктурного анализа металлов и сплавов с применением оптического микроскопа
...
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №1 Обработка растровой графики в Adobe PhotoShop
Охватывает доступный динамический диапазон
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconПрактикум по дисциплинам «информатика» И«информационные технологии»
Лабораторная работа Команды работы с дисками, файлами и каталогами ос ms dos 10
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №2 Ст гр. Ои-о71 Уваровой Наталии Задание
Напишите sql запросы для создания таблиц, которые были спроектированы в лабораторной работе №1
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №3 «Исследование измерителей параметров движения летательного аппарата вокруг центра масс»
Изучение методов численного интегрирования и дифференцирования непрерывных функций
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №1 техника химического эксперимента
...
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №1 ст гр. Ое-061 Спиваков О. Г. Одесса 2010
...
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №3 условный оператор в программах на паскале
Цель работы: приобрести навыки в решении задач с помощью условного оператора, усвоить назначение и правила его применения
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 icon№ урока Тема урока содержание Основные знания и умения сроки Лабораторная работа
С. Г. Мамонтова, В. Б. Захарова, Н. И. Сонина рассчитано на 34 учебных недели по 1 часу в неделю, всего 34 часа
Лабораторная работа 1 2 Общая схема 2 Нормирование, латентные периоды 3 Лабораторная работа 2 5 iconЛабораторная работа №3 Студ. Гр. Ои-071 Коляда Оксана 8 варіант
Відберіть та виведіть перелік проектів, в яких беруть участь організації тільки однієї країни. Відсортуйте результат за назвами...
Додайте кнопку на своєму сайті:
ua.convdocs.org


База даних захищена авторським правом ©ua.convdocs.org 2014
звернутися до адміністрації
ua.convdocs.org
Реферати
Автореферати
Методички
Документи
Випадковий документ

опубликовать
Головна сторінка