Интерфейс - Разработка средств автоматизации поиска структурированной информации в гетерогенной среде
Форма для создания настроек для поиска таблиц в интернете выглядит следующим образом.
В самом верхнем текстовом поле аналогично поиску на локальной машине выбирается файл, из которого будет извлекаться таблица для поиска.
Ниже располагается текстовое поле с выбором адреса для сохранения результатов поиска. Это поле понадобилось в связи с тем, что данные из интернета будут скачиваться и их необходимо где-то хранить.
Текстовое поле поисковые запросы содержит запросы, по которым приложение будет обращаться к Яндексу. Их можно добавлять и удалять с помощью одноименных кнопок.
Далее слева находятся настройки глубины поиска данных в Яндексе и на сайтах, которые вернул Яндекс. Глубина поиска в Яндексе это количество станиц, которые будет обрабатывать система в результатах поиска (по умолчанию один, это значит, что только первая страница поисковой выдачи).
Глубина поиска на сайте, это максимальный уровень, на который приложение будет обрабатывать сайт(по умолчанию один, это значит, что поиск будет вестись только на той странице, на которую была получена ссылка из Яндекса. Остальные страницы обрабатываться не будут). Ниже располагаются настройки для сравнения 2 таблиц на соответствие. В первой из них находится процент соответствия заголовков, при котором мы считаем 2 заголовка имеющими одинаковый смысл. Во втором поле процент соответствия таблиц, при котором мы считаем их равными.
Таким образом, манипулируя этими настройками можно сделать поиск более строгим или наоборот более простым. В самом низу формы расположено текстовое поле, в котором по ходу работы программы будет выводиться информация о том, что происходит в приложении.
Также, для удобства работы с программой, работа приложения вынесена в отдельный поток, что позволяет пользователю просматривать найденные результаты во время поиска.
Похожие статьи
-
Логика поиска в интернете Задача поиска табличных данных в интернете является более сложной нежели на локальной машине. Для начала приложение извлекает...
-
Введение - Разработка средств автоматизации поиска структурированной информации в гетерогенной среде
Объем информации в Интернет растет c каждым днем, а соответственно и растут потребности пользователей в поиске информации, которая может быть...
-
В данной главе будут рассмотрены варианты поиска данных, работа приложения в целом как для поиска в интернете, так и для поиска на локальной машине, а...
-
Для сравнения двух таблиц на соответствие необходимо выделить некоторые характеристики, с помощью которых можно описать таблицу. В данной работе такими...
-
В данной главе будут рассматриваться алгоритмы, которые необходимо разработать для решения задач, поставленных в данной работе. Во-первых, как уже было...
-
В данной работе приложению необходимо извлекать таблицы из документов Word, Excel и HTML для дальнейшей обработки, поэтому встает задача создания...
-
Существует множество средств решения задачи поиска, однако эта задача очень широка и решается в абсолютно разных условиях с различными требованиями к...
-
Парсинг интернет страниц на сегодняшний день очень широко распространенная задача. Примером может являться ситуация, когда пользователю необходимо...
-
Как уже было написано во введении, одной главных задач данной работы является разработка алгоритма сравнения двух таблиц на их соответствие. На вход в...
-
Данный алгоритм будет использоваться в алгоритме сопоставления двух таблиц. На вход алгоритму подается два набора заголовков, которые взяты из уровней...
-
Данный алгоритм будет использоваться в алгоритме сопоставления двух таблиц. На вход алгоритму подается два списка слов из двух заголовков. Первым...
-
Структурная схема предлагаемого дискретного анализатора частотного спектра сигнала, представленного в [7] как устройство для вычисления модулей...
-
Технология - это лесенка, ведущая к намеченной цели. Современный изобретатель фильтрует варианты, отбрасывая то, что кажется ему неудачным. Увеличение...
-
Общая информация В данном разделе подробнее рассмотрим объект исследования - ПК "Шекснинский маслозавод". Форма собственности - частная....
-
Средства измерений и контроля - Разработка системы поверки манометров
Техническое средство, предназначенное для измерений, имеющее нормированные метрологические характеристики, воспроизводящее и (или) хранящее единицу...
-
Общие сведения Патентная информация является опережающей научно-технической информацией и поэтому используется на различных стадиях научно-технических и...
-
Для измерения уровня концентрации (показатель рН) ионов водорода в растворе или жидкости используют pH метр. Его принцип действия основывается на...
-
Для измерения давления или разрежения в технологических агрегатах, сосудах или трубопроводах отечественная промышленность выпускает две группы приборов:...
-
Таблица 4 - Режимы термообработки Операция T, °С Охлаждающая среда HRC Цементация 930 Охлаждение медленное в колодцах или ящиках Закалка 820 - 840...
-
Основным технологическим средством автоматизации проектирования в машиностроении является цифровая ЭВМ, оперирующая с информацией, представленной в...
-
После расчета трудоемкости и продолжительности отдельных стадий технической подготовки производства составим календарный (сетевой) график всей...
-
Функциональная схема системы автоматизации приведена на рис. Э1. В дополнение к существующим подсистемам включены следующие: АСК концентрации входящей...
-
Характеристика горбуши - Разработка ассортимента и технологии блюд и изделий из рыбы
Горбуша - одна из популярных промышленных рыб, ее еще называют розовым лососем. Ценится продукт за довольно вкусное мясо и деликатесную икру. Горбуша,...
-
Надежность Расчетным показателем надежности для создаваемой системы является вероятность безотказной работы - вероятность того, что в пределах заданной...
-
НАДЕЖНОСТЬ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ АСУТП - Надежность систем автоматизации
Одной из основных частей АСУ ТП является программное обеспечение (ПО), представляющее собой совокупность взаимосвязанных и автономных программ, описаний,...
-
Электромагнитное излучение оказывает отрицательное влияние на организм человека, а также препятствует эффективной работе радиотехнического оборудования....
-
Для снижения вредного воздействия на окружающую среду при проектировании и эксплуатации измельчителя, выполняются природно-охранные мероприятия....
-
Наибольшее распространение получили следующие типы расходомеров: Электромагнитные (магнитно-индукционные). Они основаны на использовании закона ЭМИ...
-
Классификация средств измерения температуры Классификация приборов для измерения температуры по принципу действия изображена на рисунке 3.3. Рисунок 3.3...
-
Расчет тока уставки группы №1. Установлена мощность ламп P1 = 8*100 =800 Вт. Рабочий ток I1 равняется: I1 = P1 / U = 800/ 220 =3,64 A Принимаем ток...
-
Средства контроля АК-2 - Модули. Базовый модуль - предназначен для управления центральной холодильной машиной Модули расширения. В сложных системах могут...
-
Анализ известных технических решений по защите информации в канале связи с использованием анализатора спектра сигнала Современный мировой уровень...
-
Алгоритм работы предлагаемого дискретного анализатора частотного спектра сигнала [7, 9...15] основан на представлении анализируемой функции у(t) в виде...
-
Разработка структурной схемы системы защиты информации с использованием анализатора частотного спектра сигнала Предлагаемый способ защиты и увеличения...
-
При защите и увеличении объема передаваемой информации с использованием известных методов неполного (сокращенного) гармонического анализа обеспечение...
-
Сканеры с интерфейсом SCSI требуют установки в компьютер дополнительной платы SCSI-адаптера, которая поставляется в комплекте со сканером. Преимуществом...
-
Выбор транспортных средств для заготовок и деталей производим исходя из габаритных размеров деталей, а так же планировкой рабочих мест, расположения...
-
Сложности творческого процесса - Современные методы поиска и разработки новых идей
Психологическая инерция. В ТРИЗ есть оператор РВС (размер, время, стоимость), позволяющий понизить психологическую инерцию мышления путем мысленного...
-
В схеме (Приложение А) для поддержания температуры смеси в аппарате в диапазоне 130±10°С и конденсата сокового пара, поступающего в аппарат, в диапазоне...
-
Манометры технические показывающие типа МТП предназначены для измерения избыточного постоянного и переменного давлений, не кристаллизующихся при рабочих...
Интерфейс - Разработка средств автоматизации поиска структурированной информации в гетерогенной среде