Исследование алгоритмов для автоматической обработки речи

Please download to get full document.

View again

All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
 18
 
  Исследование алгоритмов для автоматической обработки речи
Share
Transcript
  Правительство Российской Федерации   Федеральное государственное автономное образовательное учреждение высшего профессионального образования   Национальный исследовательский университет   «Высшая школа экономики - Нижний Новгород»   Факультет гуманитарных наук   Кафедра прикладной лингвистики и межкультурной коммуникации   Курсовая работа   Исследование алгоритмов для автоматической обработки речи   Выполнил студент группы 12ФПЛ2   Садов Михаил Александрович   Научный руководитель   к. т. н., преподаватель   Карпов Николай   Вячеславович   Нижний Новгород  2012  Содержание: 1.Введение : 1.1 Характеристика исследовательской проблемы. 1.2 Актуальность темы исследований.   1.3 Обзор литературы.   1.4 Объект, предмет и материал исследования.   1.5 Формулировка цели исследования.  1.6 Формулировка задач, которые необходимо решить для достижения цели.   1.7 Методы исследования.   2. Методы построения языковых моделей . 2.1 Базовые принципы модели языка. 2.2 Скрытая Марковская Модель.   2.2.1 СММ для последовательностей фиксированной длины. 2. 2.2 СММ для последовательностей нефиксированной длины. 2.3 N  –   граммы. 2.4 Проблема оценки «правильности» модели.  2.4.1 Maximum-Likelihood Estimates. 2.4.2 Показатель связности. 3. Технология построения языковых   моделей.  3.1 Обзор необходимых программ . 3.1.1Cygwin. 3.1.2 HTK. 3.1.3 Практическая база исследования  3.2 Настройка HTK при помощи Cygwin.  3.3 Распознавание речи при помощи HTK. 3.3. 1 Построение словаря и грамматики.  3.3. 2 Запись и кодирование обучающих данных.  3.3. 3 Обучение СММ.  3.3.4 Распознавание речи на основе созданной модели.  3.4 Анализ сферы применения технологии HTK. 4 . Список литературы.   1. Введение  1.1 Характеристика   исследовательской проблемы.   Автоматическая обработка речи  ( процесс преобразования речевого сигнала в цифровую информацию) является перспективным направлением   информационных технологий . Причиной начала разработки данной технологии   является непригодность   (неприемлемая скорость и неестественность) текстового командного интерфейса для взаимодействия с компьютером.   Первые работы в данной сфере   начались еще в пятидесятых годах двадцатого века, но коммерческие, доступные для обычного пользователя   программы появились лишь в девяностых. Изначально они были разработаны для использования людьми, которые не были способны набирать большое количество текста с клавиатуры ввиду различных травм руки.   Однако вскоре благодаря высокому темпу прогресса информационных технологий использование интерактивных голосовых систем ( IVR (  англ.  Interactive Voice Response ) —   система предварительно записанных голосовых сообщений, выполняющая функцию маршрутизации звонков внутри call- центра, пользуясь информацией, вводимой клиентом на клавиатуре телефона с помощью   тонального набора) стало жизненной   необходимостью, особенно для операторов телефонного обслуживания (а также операторов контакт - центров и секретарей ). Помимо очевидного упрощения деятельности, связанной с телефонными коммуникациями   (информационно - справочные системы, техника связи) , автоматическая обработка речи   получила широкое употребление в военной и космической технике, в робототехнике . В дальнейшем автоматическая обработка речи  может потребоваться во всех случаях, когда источником информации   будет являться человек.   Также применение вышеупомянутых технологий представляет особый интерес для одного из разделов языкознания, прикладной лингвистики.   Этот раздел   включает   направления:   1.Теория и практика преподавания языков и переводов  2. все виды деятельности, так или иначе связанные с автоматической обработкой естественного языка (Natural la nguage processing) 3. Регламентация и нормализация языка: лексикография, лингвистическая экспертиза, терминоведение и др.   Для направления под цифрой 2 автоматическая обработка речи является одним из ключевых методов в исследовании . Лингвистические знания (в частности, фонетические), наряду с такими дисциплинами, как цифровая обработка сигналов и математические основания распознавания образов создают теоретическую базу компьютерных речевых технологий (далее в тексте РТ), значимость которых для современного информационного и компьютеризованного общества трудно переоценить . 1.2 Актуальность темы исследований.   Распознавание речи не представляет ничего нового, если рассматривать его само по себе . Как уже упоминалось в первом абзаце   характеристики исследовательской проблемы, главная задача   РТ состоит в том, чтобы обеспечить удобное и естественное для человека общение с компьютерной техникой. Предполагается, что это должно быть голосовое общение на   естественном языке, подразумевающее создание средств автоматического ввода/вывода звучащей речи в компьютерные устройства . Следовательно, для того, чтобы создать технологию голосового общения необходимо использовать алгоритмы, позволяющие обрабатывать речь.   А для того, чтобы их использовать,   необходимо произвести его исследование по нескольким критериям: аккуратность и быстрота, пластичность, учёт особенности произношения, модуляции голоса и скорости речи.   1.3 Обзор литературы.    1) В пособии Всеволодовой А. В. «Компьютерная обработка лингвистических данных: учебное пособие»   изложены основы знаний по информатике и информационным технологиям, необходимые для изучения предмета. Помимо рассмотрения базовых понятий, методов и приемов использования средств вычислительной техники рассмотрены передовые информационные и коммуникационные технологии глобальных компьютерных сетей. Изложены основные направления фундаментальных исследований и коммерческих разработок, находящихся на пересечении лингвистики, методов представления, обработки знаний и самых современных информационных технологий. Рассмотрены типичные и специфические приложения компьютерной лингвистики. Значительное место отведено классификации лингвистических программ, детально описаны их свойства и назначение.   Данное пособие будет полезным на начальных стадиях работы.  2) В книге Налимова В.В. «Вероятностная модель языка: О соотношении естественных и искусственных языков» автор формулирует отдельные суждения о кибернетической лингвистике. При изложении своих взглядов Налимов широко использовал разносторонние публикации по вопросам языка, притом не пытаясь дать обзор научным концепциям языка или проанализировать их. Цель данной работы –   дать читателю понимание возникновения тех или иных особенностей языка с точки зрения кибернетики. Книга содержит в себе множество цитат, материал излагается «в виде диалога с теми, кто много думал и писал о языке».   В книге упомянуты работы многих известных отечественных и зарубежных учёных и представлены их точки зрения на вышеупомянутые аспекты, что поможет рассмотреть подходы к интересующей нас проблеме со всех ракурсов. 3) В книге В. В. Мартынова «Основы семантического кодирования. Опыт представления и преобразования знаний» описывается подход, направленный на структурное представление языка, позволяющее осуществить компьютерную поддержку исчисления на нём. Автор предлагает свою теорию построения формальной семантики естественного языка, которая и занимает большую часть работы, уделяя мало внимания обзору существующих методов.   Книга будет интересна тем, что в ней представлен многолетний опыт работы автора в сфере компьютерной лингвистике.  
Related Search
Similar documents
View more
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks
SAVE OUR EARTH

We need your sign to support Project to invent "SMART AND CONTROLLABLE REFLECTIVE BALLOONS" to cover the Sun and Save Our Earth.

More details...

Sign Now!

We are very appreciated for your Prompt Action!

x