Московский государственный технологический университет «Станкин»
Опубликован: 18.05.2005 | Доступ: свободный | Студентов: 4953 / 957 | Оценка: 3.93 / 3.84 | Длительность: 11:45:00
ISBN: 978-5-9556-0024-6
Специальности: Программист

Лекция 5: Общение с ЭВМ на естественном языке. Системы речевого общения

< Лекция 4 || Лекция 5: 12345 || Лекция 6 >

Анализ текстов на естественном языке

Как видно из рис. 5.1, разбор текстов на ОЕЯ состоит из четырех этапов.

Морфологический анализ

( МА ) определяет грамматические признаки для каждой словоформы. Грамматические признаки наиболее важных частей речи приведены в табл. 5.1.

Таблица 5.1. Грамматические признаки
Часть речи Грамматические признаки
Существительное Род, число, падеж, склонение
Прилагательное Род, число, падеж
Глагол Время, лицо, число, спряжение, вид
Местоимение Число, лицо

МА для предложения "На мельнице хранятся разные сорта пшеницы" дает следующие результаты разбора (цифрами обозначен порядок слов в предложении): ((на: предлог, 1) (мельница: существительное, жен. род, ед. число, предл. падеж, 2) (храниться: глагол, мн. число, наст. время, несовершенный вид, третье лицо, 3) (разный: прилагательное, мн. число, имен. падеж, 4) (сорт: существительное, муж. род, мн. число, имен. падеж, 5) (пшеница: существительное, жен. род, ед. число, родит. падеж, 6))

Таким образом, мы видим, что для МА необходим словарь основ слов и словоформ с их грамматическими признаками в зависимости от аффиксов и окончаний. МА состоит из выделения основы и флексий входной словоформы. По основе определяются основные характеристики данной лексемы, а по виду флексии определяются грамматические характеристики словоформы по словарю. Как правило, МА не вызывает больших трудностей на этом начальном этапе разбора, хотя и является достаточно трудоемким этапом из-за необходимости создания точных словарей.

Синтаксический анализ

( СА ) определяет синтаксическую структуру входного предложения. Основные правила синтаксического анализа, в большинстве случаев , следующие.

Подлежащим в предложении может быть

  1. существительное в именительном падеже;
  2. местоимение в именительном падеже;
  3. имя собственное в именительном падеже.

Сказуемое в предложении - это глагол, связанный с подлежащим и согласованный с ним в лице и числе. Подлежащее и сказуемое, как известно, это главные члены предложения.

Дополнение - это существительное, согласованное со сказуемым в падеже. Прямое дополнение - существительное в винительном падеже ("Я вижу окно"). Косвенное дополнение - дополнение не в винительном падеже, часто с предлогом ("Я ехала домой").

Определение - это прилагательное, связанное с подлежащим или дополнением (связь в роде, числе и падеже - это сильная связь).

Обстоятельство - это, как правило, наречие (неизменяемая часть речи - "далеко", "редко") или существительное с предлогом, связанное со сказуемым только семантически.

СА для нашего предложения о пшенице даст следующие результаты: (( На мельнице : обстоятельство места, 1) ( хранятся : сказуемое, 2) ( разные : определение, 3) ( сорта : подлежащее, 4) ( пшеницы : дополнение, 5)).

< Лекция 4 || Лекция 5: 12345 || Лекция 6 >
Дмитрий Черепанов
Дмитрий Черепанов

Неоднократно находил ошибки в тестах, особенно в экзаменационных вопросах, когда правильно данный ответ на вопрос определялся в итоге как не правильно отвеченный... Из-за этого сильно страдает конечный бал! Да еще в заблуждение студентов вводит! Они-то думают, что это они виноваты!!! Но они тут не причем! Я много раз проверял ответы на некоторые такие "ошибочные" вопросы по нескольким источникам - результат везде одинаковый! Но ИНТУИТ выдавал ошибку... Как это понимать?

Из-за подобных недоразумений приходиться часами перерешивать экзамен на отличную оценку...!!!

Исправьте, пожалуйста, такие "ошибки"...

Анжелика Шлома
Анжелика Шлома

Огромная просьба сделать проще тесты, это просто ужас какой-то! Слишком сложно!