Платформа GATE для обработки естественного языка, Лингвистический процессор GATE - Разработка веб-редактора для описания лексико-семантических шаблонов на визуальном языке

Лингвистический процессор GATE

GATE представляет собой инфраструктуру для разработки и развертывания компонентов программного обеспечения, которые обрабатывают естественный язык. Это свободно-распространяемое программное обеспечение с открытым исходным кодом. Он позволяет анализировать тексты любых размеров, решая такие функции обработки, как: синтаксический, морфологический, лексический анализ, тегирование (индексация) данных, информационный поиск и многие другие.

Среди преимуществ данной платформы перед другими разработчики выделяют:

Комплексность. GATE включает в себя все необходимые инструменты для анализа текстов.

Масштабируемость достигается путем множества возможностей и плагинов, которые предлагает данная система.

Открытость, расширяемость и возможность многократного использования. Благодаря стандартам, описанным на базе опыта работы с пользователями системы и открытому (хорошо документированному) исходному коду, систему очень просто переиспользовать. Разработчикам представляется расширяемое APIи веб-службы для дальнейшего использования.

Прозрачность. Благодаря раздельным компонентам системы и дополнительным плагинам, пользователю понятнее алгоритм анализа, т. к. он видит, что нужно подавать на вход каждому из компонент и что получается на выходе.

Надежность. Система проходит контроль качества путем применения количественной оценки показателей, что гарантирует предсказуемое поведение.

Устойчивый коэффициент полезного действия.

На рисунке 1.1 представлены компоненты системы GATE, позволяющие анализировать текст на естественном языке. В данной работе нас будет интересовать самый нижний компонент, JAPETransducer. Это первоначальный уровень, соединяющий анализирующие компоненты непосредственно с текстом, а значит, самый первый этап, который позволяет пользователю вести обработку. Для снижения входного барьера, необходимо сделать этот шаг наиболее простым и интуитивно-понятным.

компоненты платформы для анализа текста gate

Рисунок 1.1. Компоненты платформы для анализа текста GATE

Похожие статьи




Платформа GATE для обработки естественного языка, Лингвистический процессор GATE - Разработка веб-редактора для описания лексико-семантических шаблонов на визуальном языке

Предыдущая | Следующая