Классификация на основе сравнения с эталоном
8.3. Задача сравнения речевых команд
В обработке речи можно выделить следующие основные направления:
- Распознавание отдельных слов (IWR – Isolated Word Recognition),
- Распознавание слитной речи (CSR – Continuous Speech Recognition).
- CDR – Speaker Dependent Recognition,
- SIR – Speaker Independent Recognition.
Ядром IWR-систем является совокупность эталонов и мера. Отрезок сигнала (см. рис.) разбивается на сегменты, т.е. сигнал квантуется (с перекрытием). С каждым сегментом связывается вектор коэффициентов Фурье.
Обработка звука происходит в два этапа.
Первый этап. Строим цепочку , – разговорные сегменты. Далее строим преобразование Фурье с разбиением на отрезков. Обозначим через , – отчеты для -ого сегмента, . Тогда
Рассмотрим первые (пусть ), коэффициентов Фурье в качестве вектора признаков:
Второй этап. Определяем ограничения в графе соответствия сегментов эталонной и тестируемой команд.
Глобальные ограничения – ограничения поля для оптимального маршрута, например, (рис. слева).
Локальные ограничения – монотонность на сети маршрутов (рис. справа).
Ограничения конечной точки.
Стоимость – Евклидово расстояние между :
Таким образом, и эта задача также сводится к поиску кратчайшего пути на графе.
8.4. Динамическое программирование
Задача поиска кратчайшего пути на графе может быть решена методом динамического программирования. Пусть – начальный узел (отправной город), – конечный узел (город – пункт назначения). Тогда задача состоит в поиске оптимального маршрута через промежуточные узлы (города):
Пусть – промежуточный узел. Тогда по принципу оптимальности Беллмана имеем
причем .