Системы распознавания речи в текст

Системы преобразования речи в текст предназначены для автоматического преобразования речевого сигнала в текстовые данные. Как правило, система распознавания речи состоит из двух моделей: акустической и лингвистической. Акустическая модель отвечает за преобразование речевого сигнала в набор признаков, в которых отображена информация о содержании речевого сообщения.
Система решает задачу анализа речи, сравнивая фрагменты исходного сигнала с записанными образцами. Лингвистическая модель анализирует информацию, получаемую от акустической модели, и формирует окончательный результат распознавания. На основе вероятностного расчета определяется, что именно могло содержаться в исходном речевом сигнале. Интеллектуальные речевые системы, позволяющие автоматически синтезировать и распознавать речевой сигнал, являются следующей ступенью развития голосовых систем. Далее рассмотрим такие системы.