Язык для описания лексико-семантических шаблонов JAPE - Разработка веб-редактора для описания лексико-семантических шаблонов на визуальном языке
JAPE позволяет анализировать текст на основе регулярных выражений. Грамматика этого языка состоит из фаз, которые сдержат в себе набор шаблонов и/или правил. Правило всегда состоит из левой и правой частей. Левая часть содержит идентификатор, позволяющий определить шаблон, а правая - действия, которые необходимо выполнить для обнаружения этого шаблона.
Например, на рисунке 1.2 представлен пример шаблона, определяющего спортивные категории.
Рисунок 1.2. Лексико-семантический шаблон для определения категорий спорта, описанный на языке JAPE
Первой строкой описывается название фазы, оно должно быть уникальным. "Input" определяет, на какого типа аннотации будет направлено описываемое правило. По умолчанию устанавливается "Token" (буква), "Lookup" (область текста) или "SpaceToken" (лексема пробела). "Options" определяет, метод соответствия правилу с помощью элемента "control". Так же в этой строке может быть указан способ запуска: в режиме отладки или нет (по умолчанию стоит "debug = false", что значит, что запуск правила производится не в режиме отладчика). Далее, в четвертой строке определено название правила, а в пятой - приоритет его выполнения. Последовательность выполнения правил определяется проставленными приоритетами.
После идентифицирующих строк, описывается сам шаблон: седьмая и восьмая строки описывают правило "найти все аннотации, соответствующие шаблону Lookup. majortype == "Sports" и присвой им имя label. Символ "-->" является границей, после которой описывается правая часть правила. Строка 10 посылает команду для JAPETransducer о переименовании label (определенной на строке 8) в "Sport". А правило, по которому она была определена, именуется "SportsCategory".
Это лишь небольшой и самый простой пример, который может быть использован для анализа текста, однако JAPE предоставляет более широкие возможности, такие как, идентификация фраз (части текста, а не только одного слова), слов в контексте (разных форм слова) и другие. Таким образом, необходимо найти более понятную для неподготовленного пользователя форму представления шаблонов, которая бы позволила снизить порог вхождения, для более быстрого начала работы с многофункциональной платформой GATE.
Похожие статьи
-
Проектирование визуальных конструкций Вторая глава описывает процесс трансформации текстового языка JAPE в визуальный язык, который позволит описывать...
-
Для того, чтобы интерпретировать XML представление в язык JAPE, был использован язык преобразования XSLT [18]. Данный язык и будет служить транслятором,...
-
Введение - Разработка веб-редактора для описания лексико-семантических шаблонов на визуальном языке
Объем неупорядоченной и неструктурированной текстовой информации неуклонно растет, поэтому задача ее быстрой и качественной обработки актуальна сегодня...
-
Для того, чтобы строить диаграммы в соответствии с рисунком 2.7, необходимо реализовать алгоритм соединения двух объектов линией. Для отображения линии...
-
Реализация клиентской части приложения На языке JavaScript, в соответствии с диаграммой классов, представленной в приложении Б, были разработаны объекты...
-
Ввиду того, что для языка JAPE не предусмотрен специализированный редактор, разработчики рекомендуют использовать Vim[10] или Eclipse[11], ассоциировав...
-
Лингвистический процессор GATE GATE представляет собой инфраструктуру для разработки и развертывания компонентов программного обеспечения, которые...
-
В ходе работы были достигнуты следующие результаты: Проведен обзор платформы GATE и языка для описания лексико-семантических шаблонов JAPE. Выявлена...
-
"WWWSQLDesigner" позиционируется как абсолютно бесплатный, доступный для пользователей, универсальный веб-редактор, значительно упрощающий процесс...
-
В главе рассмотрены существующие решения веб-редакторов, позволяющих создавать разного типа диаграммы и генерировать на их основе программный код. Так же...
-
Концепция построения программы Список всех классов приведен на рисунке 3.1. Рисунок 3.1 - Диаграмма классов программы В качестве главного класса...
-
В ходе исследования был разработан веб-редактор для визуального языка в соответствии с требованиями, выделенными в главе 2, по результатам опроса...
-
Описание алгоритмов Рассмотрим один из основных алгоритмов, задействованных в программе, - алгоритм передвижения мяча. Блок-схема алгоритма изображена на...
-
Проектирование и разработка сайта Средства разработки Язык гипертекстовой разметки HTML В Интернете сосредотачивается и передается достаточно большое...
-
3.1 Описание программного модуля Jadex - это агент, ориентированный на собственный механизм принятия решений, взаимодействуя с XML и Java файлами,...
-
Информационная система (ИС) ГИБДД должна обеспечивать хранение информации об автомобилях (марка, номер кузова, номер двигателя, цвет кузова, гос. номер),...
-
Языки описания порождающих правил - Инструментальные средства разработки экспертных систем
Но, естественно, возможности языков высокого уровня также не беспредельны -- каждый из них имеет свои ограничения. Например, в языке OPS5 возможности...
-
Описание существующей проблемы сбоев работы ПЛИС Проблема отсутствия специализированных микросхем под определенное воздействие КП с оптимальной...
-
Использование языка PERL для написания CGI-cкриптов - Язык программирования PERL. Сфера применения
Как вы узнали из предыдущей главы, CGI обеспечивает узлам Web вoзмoжнoсть интерактивной работы с клиентскими программами, в качестве которых обычно...
-
Для вызова ЛЕКСИКОНа следует набрать LEXICON или LEXICON имя редактируемого - файла Если в команде вызова ЛЕКСИКОНа указано имя файла, которого нет на...
-
При разработке практически всех инструментальных средств за основу принимается методология автоматизации проектирования на базе использования прототипов....
-
Разработка сайта, Среда разработки web-сайта - Разработка сайта для компании
Среда разработки web-сайта При разработке web-сайта используются: - HTML - язык разметки web-страниц; - CSS - формальный язык описания внешнего...
-
Объектно-ориентированные языки - Инструментальные средства разработки экспертных систем
В главе 12 мы уже обращали ваше внимание на то, что формат правил хорошо согласуется с представлением знаний в форме "при выполнении условий СЬ ..., С"...
-
Adobe Dreamweaver Adobe Dreamweaver - это HTML-редактор от компании Adobe, который на сегодняшний день очень известный. Первая его версия была выпущена в...
-
Описание предметной области - Разработка локальной сети для ОАО "Корпорация Монстров"
Непременным атрибутом малого предприятия являются компьютеры. При наличии нескольких компьютеров практически всегда их объединяют в локальную сеть....
-
Объектом исследования является микросхема 4-х процессорной "системы на кристалле" на базе ядер 32-разрядных процессов цифровой обработки сигналов с...
-
В документации к sane-backends содержится описание флага wait-for-button. Данный флаг взаимодействует с утилитой scanimage, который ожидает нажатия любой...
-
Любая производственная деятельность, в том числе и работа с электронными устройствами, сопряжена с появлением опасных для жизни и здоровья факторов,...
-
Описание проекта, который является объектом исследования Проект - представляет собой внедрение информационно - аналитической системы управления карьерой...
-
В данной выпускной квалификационной работе разработан прототип умного почтового ящика, удаленного сетевого устройства для контроля почтовой...
-
Любой компьютер является электроприбором и представляет собой потенциальную угрозу. Поэтому при работе с компьютером следует соблюдать требования...
-
Общие сведения о программе Программа разработана для демонстрации возможностей языка C++ и может использоваться для пользователей, которые не знакомы с...
-
Спецификация сегментов сети - Разработка локальной сети для ОАО "Корпорация Монстров"
Для сети предприятия была выбрана топология - Fast Ethernet (IEEE 802.3u) со скоростью передачи 100 Мбит/с. т. к. она обладает следующими достоинствами:...
-
Правила формального описания синтаксиса языка программирования - Основы программирования
Под синтаксисом языка программирования понимают правила построения корректных конструкций данного языка. Синтаксис языка можно описать формально. Для...
-
Для разработки программного продукта нами была выбрана СУБД Microsoft Access 2010, которая позволяет выполнять простейшие операции с данными: Ѕ добавить...
-
Алгоритм работы. В результате работы АИС генерируются три xml документа - два со структурой сравниваемых баз данных и один с результатами сравнения. В...
-
В связи с увеличением числа сотрудников, работающих в компании, а также с расширением рабочего проекта, возникла проблема, связанная с версионностью...
-
Требования к программе, Описание задания, Описание игры и ее правил - Разработка игры "Морской бой"
Данная программа предназначена для работы под управлением операционных систем Windows 98, Windows ME, Windows 2000, Windows XP, Windows 7. Для корректной...
-
Dansquardion - это контент фильтр для SQUID. С помощью dansquardion можно осуществлять настройку доступа пользователей сети к ресурсам сети интернет. Для...
-
Процессор Реntium Рro, Общее описание процессора - Микропроцессоры для пользователя
Общее описание процессора Реntium Рro это высокотехнологичный процессор шестого поколения для высокоуровневых десктопов, рабочих станций и...
Язык для описания лексико-семантических шаблонов JAPE - Разработка веб-редактора для описания лексико-семантических шаблонов на визуальном языке