Интерфейс - Разработка средств автоматизации поиска структурированной информации в гетерогенной среде

Форма для создания настроек для поиска таблиц в интернете выглядит следующим образом.

В самом верхнем текстовом поле аналогично поиску на локальной машине выбирается файл, из которого будет извлекаться таблица для поиска.

Ниже располагается текстовое поле с выбором адреса для сохранения результатов поиска. Это поле понадобилось в связи с тем, что данные из интернета будут скачиваться и их необходимо где-то хранить.

Текстовое поле поисковые запросы содержит запросы, по которым приложение будет обращаться к Яндексу. Их можно добавлять и удалять с помощью одноименных кнопок.

Далее слева находятся настройки глубины поиска данных в Яндексе и на сайтах, которые вернул Яндекс. Глубина поиска в Яндексе это количество станиц, которые будет обрабатывать система в результатах поиска (по умолчанию один, это значит, что только первая страница поисковой выдачи).

Глубина поиска на сайте, это максимальный уровень, на который приложение будет обрабатывать сайт(по умолчанию один, это значит, что поиск будет вестись только на той странице, на которую была получена ссылка из Яндекса. Остальные страницы обрабатываться не будут). Ниже располагаются настройки для сравнения 2 таблиц на соответствие. В первой из них находится процент соответствия заголовков, при котором мы считаем 2 заголовка имеющими одинаковый смысл. Во втором поле процент соответствия таблиц, при котором мы считаем их равными.

Таким образом, манипулируя этими настройками можно сделать поиск более строгим или наоборот более простым. В самом низу формы расположено текстовое поле, в котором по ходу работы программы будет выводиться информация о том, что происходит в приложении.

Также, для удобства работы с программой, работа приложения вынесена в отдельный поток, что позволяет пользователю просматривать найденные результаты во время поиска.

Похожие статьи




Интерфейс - Разработка средств автоматизации поиска структурированной информации в гетерогенной среде

Предыдущая | Следующая