Естественно-языковой интерфейс как элемент пользовательского взаимодействия
Аннотация
В работе рассматривается реализация взаимодействия пользователя с программной системой посредством естественно-языкового интерфейса. Описывается структура работы подобного интерфейса. Также представлен вариант реализации интерфейса с использованием ограниченного естественного языка.
Ключевые слова: естественный язык; пользовательское взаимодействие; обработка естественного языка
Abstract
This paper considers user's interaction to software system by using natural language interface. How it works is described. Also realization of interface with usage of limited natural language is presented.
Keywords: natural language; user's interaction; natural language processing (NLP).
УДК 004.5
На сегодняшний день в мире существует множество программных систем. Еще больше разработано принципов взаимодействия с ними. Разнообразие вариантов взаимодействия приводит к увеличению времени на обучение работы с системой, и, как следствие, затрудняет свободное использование этой системы.
Перспективным в данной ситуации является применение более привычного для пользователя естественного языка в процессе общения с машинами и компьютерными системами.
Данное решение обладает рядом преимуществ:
- - Минимальная подготовка пользователя для работы с системой. - Простота и высокая скорость задания произвольных запросов к системе.
Простота при работе с естественно-языковым интерфейсом достигается путем применения пользователем языка, используемого в ежедневной коммуникации.
Пользователи сети Интернет пытаются найти ответы на вопросы с помощью поисковых машин и форумов. В Интернете уже есть ответы на эти вопросы, вопрос только в том, насколько быстро может быть получен этот ответ.
Для решения подобной проблемы используется естественно-языковой интерфейс в составе диалоговой системы.
Поиск знаний, в отличии от простого поиска информации, требует учета семантики запросов. Для естественно-языкового пользовательского интерфейса вопросно-ответных систем можно также использовать ограниченную лексику и грамматику языка. При этом не происходит серьезного ухудшения функциональности и производительности вопросно-ответной системы.
Ограниченный естественный язык - это подмножество естественного языка, текст на котором успешно воспринимается носителем полного естественного языка без приложения дополнительных усилий.
Не требуется дополнительного изучения ограниченной версии языка для составления текстов. Данный язык обладает сокращенным набором лексики и грамматики. Это позволяет сократить время анализа естественно-языковых элементов в вопросно-ответной системе, а также помогает избежать неоднозначностей на лингвистическом уровне.
Цикл работы естественно-языкового интерфейса начинается с ввода пользователем сообщения на естественном языке путем ввода текста. По введенному в систему тексту строится его формальное описание. Все предшествующие результаты анализа используются при анализе последующих запросов, что позволяет системе сохранять ход диалога с пользователем и разрешать спорные моменты, связанные с использованием одних и тех же терминов в разных предметных областях [1].
В процессе обработки естественно-языкового текста происходит последовательное выполнение морфологического, синтаксического и семантического анализа (рис. 1).
Рисунок 1 - Схема обработки естественно-языкового текста
Интерфейс язык программный пользователь
Первым этапом обработки пользовательского запроса является морфологический и морфемный анализ. На данном этапе для каждого слова в формальной записи предложения строятся отношения, которые задают соответствия для значений грамматических категорий [3].
В результате морфологического анализа определяются морфологические характеристики каждого слова такие как падеж, склонение, часть речи и т. д. Количество и наличие морфологических характеристик слов и допустимых значений зависят от конкретного языка. Однако, некоторые характеристики (часть речи) существуют во многих языках.
Для проведения процедуры морфологического анализа текста существует три различных подхода:
- 1. "четкая" морфология; 2. "нечеткая" морфология; 3. вероятностный подход.
При обработке естественно-языковых (ЕЯ) текстов на русском языке в наиболее часто применяется подход, основанный на "четкой" морфологии. Данный подход базируется на словаре Зализняка [2].
В данном словаре описаны основные словоформы для русскоязычных слов. Каждой словоформе сопоставляется определенный код. Существует некая система правил, в соответствии с которой для данного слова возможно построить все остальные формы. При этом в качестве исходных данных используется начальная словоформа и соответствующий ей код. В случае использования "четкого" подхода в процессе морфологического анализа, необходимо иметь в наличии словарь всех словоформ и слов для данного языка. Данный словарь на входе принимает форму слова. На выходе словарь представляет морфологические характеристики конкретной словоформы. Возможно построение словаря на основе словаря Зализняка по следующему алгоритму: Первым шагом происходит перебор всех слов, содержащихся в словаре. Для каждого из этих слов необходимо определить все возможные словоформы. Полученные словоформы сохраняются в формируемом словаре. В процессе проведения морфологического анализа конкретного слова достаточно найти его в словаре. В результате будут получены точные значения всех морфологических характеристик анализируемого слова.
При морфемном анализе определяются конкретные морфемы в рамках каждого слова: приставка, корень, суффикс, окончание.
В словаре морфем русского языка [4, 6] для каждого слова указано разделение на составные части. Однако, в словаре не указываются типы каждой из составных частей. Таким образом, достоверно не может быть известно какая из частей является корнем, а какая суффиксом.
При этом совокупность всех возможных корней слов русского языка представляет собой открытое множество. В то же время, множество всех приставок, суффиксов и окончаний ограничено. Также известен порядок следования морфем в составе слова: сначала идут приставки, затем корни, далее суффиксы и окончания. Таким образом, с помощью словаря морфем русского языка возможно построить словарь, содержащий как разбиение слова на составные части, так и тип каждой из морфем. В результате для проведения морфемного анализа слова достаточно просто обратиться к разработанному словарю.
При этом морфемный анализ не ограничивается обращениями к словарю. В ситуации, когда слово отсутствует в словаре, возможно непосредственное проведение анализа на основе стандартного строения слов русского языка (приставка -- корень -- суффикс -- окончание) и множества всех приставок, суффиксов и окончаний [5].
На этапе синтаксического анализа внутри предложения определяются отношения синтаксических связей. Далее выявляются главные и второстепенные члены предложения, определяется тип предложения и т. д. Синтаксический анализ выполняется поэтапно: при описании формальной структуры предложения используется информация, которая была получена ранее на этапе морфологического анализа. На этом этапе применяются лексические и синтаксические правила для анализируемого языка.
Этап семантического анализа представляет наиболее сложную часть обработки естественно-языкового текста.
Семантический анализ можно представить как обработку семантической сети, которая отражает результат анализа на предыдущих этапах естественно-языкового текста, присутствующих в системе знаний о предметной области и языке программной системы. На данном этапе анализируются соотношения лингвистической конструкции и тех конструкций, которые хранятся в памяти системы для выявления отношений соответствия.
В процессе построения семантической модели слова учитывается его многозначность. Смысл слова рассматривается как некоторое множество различных значений. Каждое из этих значений или вся совокупность в целом реализуется в определенном контексте. Результатом семантического анализа является конструкция запроса к информационной системе.
Таким образом, применяя методы обработки естественно-языкового текста возможно создать интерфейс, позволяющий общаться с машиной на естественном языке.
Библиографический список
- 1. Житко В. А. Пользовательский интерфейс интеллектуальных вопросно-ответных систему // NB: Кибернетика и программирование. -- 2012. - № 1. - С.23-30. DOI: 10.7256/2306-4196.2012.1.13862. 2. Зализняк А. А. Грамматический словарь русского языка. Словоизменение. 3-е изд. М. Русский язык, 1987. 3. Кузнецова А. И., Ефремова Т. Ф. Словарь морфем русского языка. М. Русский язык, 1986. 4. Селезнев, К. Обработка текстов на естественном языке // "Открытые системы" , № 12, 2003. 5. Тихонов А. Н. Морфемно-орфографический словарь. М.: АСТ: Астрель, 2002. -- 704 с.
Похожие статьи
-
Человеко-машинный интерфейс обеспечивает связь между пользователем и компьютером - он позволяет достигать поставленных целей, успешно находить решение...
-
Элементы пользовательского интерфейса - Разработка Windows-приложений в среде Borland Delphi
Цель Работы: Закрепить навыки проектирования интерфейса приложения, получить навыки использования стандартных диалоговых окон и буфера обмена. Пояснения...
-
Интерфейс Пользовательский интерфейс программного обеспечения является неотъемлемой его частью. Именно через интерфейс конечный пользователь будет...
-
Назначение и состав платы КОВ. Плата коммутации и отключения видеосигналов за пределами рабочей части экрана (КОВ) предназначена для коммутации...
-
Для реализации вышеописанных пользовательских историй опишем функциональные требования, на которые будет опираться процесс разработки. Во-первых, самый...
-
Централизованный сервер как метод взаимодействия - Виды взаимодействия в Интернете вещей
Большинство интернет-вещей представляют собой самостоятельные устройства, передающие некоторую информацию в базу данных для последующей обработки и...
-
Интерфейс программы Главное окно. 1) Во вкладке Файл можно открыть файл, сохранить его и сохранить сетку. 2) Во вкладке Вид. Настраивается отображение...
-
Хорошо продуманный интерфейс, подобно хорошему учителю и учебникам, обеспечивает плодотворное взаимодействие пользователя и компьютера. Удачные...
-
Так как количество выявленных вредных факторов не превышает пяти, то степень напряженности трудового процесса пользователя при работе с программным...
-
Исходя из финансовых и временных сроков, руководство компании приняло решение о выборе между следующими информационными системами: - FlexbbyCRM - JIRA -...
-
Проблемы пользовательского интерфейса интернет-вещей - Виды взаимодействия в Интернете вещей
В настоящий момент интернет-вещей не так много, но ожидается, что их число значительно возрастет в ближайшие 10 лет. В связи с этим необходимо осознавать...
-
Несмотря на то, что к IoT Hub можно подключиться напрямую, используя протоколы HTTP или AMQP), Microsoft также предоставляет разные SDK для разных языков...
-
Разработка интеграционных платформ началась одновременно с исследованием и развитием Интернета Вещей. Это происходило по той причине, что сама концепция...
-
Сетевыми протоколами называют протоколы первого и второго уровней, определяющих архитектуру локальной сети, в том числе ее топологию, передающую среду,...
-
В программе присутствуют следующие основные модули: - PlatformManager - DeviceManager - ScenariosManager - ScenarioEngine - ExportManager - ImportManager...
-
Актуальность проблемы хранения и оперативного поиска данных привела к появлению такого понятия, как хранилище данных. Следует упомянуть о необходимости...
-
Пользовательский интерфейс "мифическая" часть программного продукта. При хорошем проекте пользователи даже не ощущают его "присутствия". Если он...
-
Срок морального старения продуктов и решений в области информационных технологий, как правило, составляет 3 -- 5 лет. По прошествии этого срока...
-
На текущий момент AMQP 1.0 официально поддерживается всеми сервисами Azure, которые являются частью шлюза соединения. Microsoft сориентировался на этом...
-
Структура и интерфейс программы - Исследование алгоритмов
В этой части работы описывается процесс создания мобильного приложения на платформе Android, способного использовать обученные каскадные классификаторы...
-
С целью выбора платформы для внедрения программного модуля необходимо сравнить интеграционные платформы Интернета вещей с помощью определенных критериев....
-
Используемые технологии - Виды взаимодействия в Интернете вещей
Серверная часть веб-приложения разрабатывается с использованием технологии PHP и располагается на удаленном сервере. PHP - скриптовый язык...
-
Общее понятие о методе конечных элементов - Алгоритмы компьютерного моделирования
Метод конечных элементов заключается в разбиении математической модели конструкции некоторые элементы, называемые конечными элементами. Элементы бывают...
-
Возрастающая сложность современных автоматизированных систем управления и повышение требовательности к ним обуславливает применение эффективных...
-
WEBвещей - Виды взаимодействия в Интернете вещей
Активное развитие Интернета вещей привело к тому, что все больше пользователей стали использовать Интернет для доступа к всевозможным "умным вещам". При...
-
Существуют две группы определений ОС: "совокупность программ, управляющих оборудованием" и "совокупность программ, управляющих другими программами". Обе...
-
Понятие о массивах В ранжированных переменных невозможно использование их отдельных значений. При необходимости иметь доступ к каждому значению...
-
Домашнее использование чаще всего представляет из себя набор сенсоров, собирающих информацию об индивидах, которые напрямую владеют этой сетью. Это могут...
-
Необходимо обеспечить ввод значений по умолчанию во все поля, которые это допускают и такая функция не будет раздражать пользователя. Можно назначить...
-
Дополнительные офисные программы - Интегрированные пакеты для офисов
Дополнительные офисные программы. Помимо пакета программ Microsoft Office пользователи в своей работе задействуют и другие программы, в том числе...
-
Дизайн пользовательского интерфейса будет разрабатываться с использованием элементов, имеющихся в web-интерфейсе кабинета пользователя системы АСОЗД, для...
-
Данные на экране следует располагать таким образом, чтобы пользователь знал, где найти и где ожидать вывода необходимой информации. Информация, на...
-
В дипломном проекте тщательно продуман сценарий взаимодействия АРМа с пользователем, приведя его к оптимальной системе выполнения требуемых задач, и...
-
Поиск и замена текста При работе с длинными документами иногда приходится вносить в них повторяющиеся изменения. ПрограммаWriterимеет специальные...
-
Сообщения системы, Системные требования, Элементы управления - Разработка визуального редактора
Главные сообщения пользователю представлены отдельными диалоговыми окнами, появляющимися на главном окне после определенных действий. Если пользователь...
-
Строгое определение протокола выглядит как формализованный набор правил, используемый ПК для коммуникаций. Из-за сложности коммуникаций между системами и...
-
Для запуска кластеризации пользователю нужно ввести 4 параметра: А) Название ODBC драйвера с созданным подключением. Как создать Такое подключение,...
-
Введение - Приемы программирования в Delphi
Данный проект был разработан в среде Delphi. Среди множества языков, является наиболее универсальным и легко изучаемым языком. При этом его удобно...
-
Понятие системы поддержки принятия решений (СППР) - Компьютерные информационные технологии
Со временем количество информации, которую необходимо обработать для принятия нужного решения, стремительно увеличивается. Рост объемов...
-
Как отдельным пользователям, так и системному администратору иногда требуется периодически запускать определенные команды. Например, системному...
Естественно-языковой интерфейс как элемент пользовательского взаимодействия