Заключение, Список литературы - Разработка программного обеспечения для реализации и тестирования алгоритма нахождения частых множеств в транзакционных данных вертикального формата
В данной работе была затронута актуальная, интенсивно развивающаяся область методов анализа данных. Был рассмотрен новый подход к кластеризации. В рамках дипломной работы:
Ь рассмотрены принципы работы алгоритмов кластеризации
Ь изучена структура представления информации в виде таблиц транзакционных данных
Ь рассмотрены принципы составления бинарных деревьев, а также B+ деревьев
Ь модернизирован существующий алгоритм кластеризации с учетом применения в нем B+ деревьев
Ь реализовано приложение для генерирования баз данных транзакций
Ь проведено тестирование приложения, использующего алгоритм LargeItem
Список литературы
- 1. Лекции "Проектирование систем основанных на знаниях" Подлесных В. Г 2012г 2. Статья Ke Wang, ChuXu, Bing Liu_Clustering Transactions Using Large Items 2003 3. Курс лекции по дисциплине "Проектирование систем основанных на знаниях" дом "Вильямс", 2006 4. "Java2 библиотека профессионала" Кей С. Хорстманн. Гарри Корнелл, Издательский дом "Вильямс", 2006 5. Сайт компании "Инсайт", посвященный MySQL(http://www. mysql. com) 6. Дипломная работа "Разработка алгоритма извлечения ассоциативных правил из множества категориальных данных" Анваера А. Е. за 2008 год. 7. Дипломная работы "Разработка программного обеспечения для реализации и тестирования алгоритма нахождения частых множеств в транзакционных данных вертикального формата" Кызылов А. В. за 2009 год. 8. Сайт компании BaseGroup Labs (http://www. basegroup. ru/) 9. Сайт профессора Кей С. Хорстманна (http://horstmann. com) 10. Сайт компании "Sun MicroSystems"(http://ru. sun. com) 11. An efficient algorithm for mining association rules in large databases. Savasere, E. Omiecinski, and S. Navathe. In Proc. of Intl. Conf. on Very Large Databases (VLDB), 1995.
Похожие статьи
-
Для запуска кластеризации пользователю нужно ввести 4 параметра: А) Название ODBC драйвера с созданным подключением. Как создать Такое подключение,...
-
Так как разработанное ранее приложение LargeItem выводит в выходном файле "большие предметы", то используя специальный аналитический инструмент возможно...
-
При тестировании корректности работы алгоритма будем опираться на экспериментальные данные работы алгоритма с предварительно сгенерированными базами...
-
Вычислительная сложность алгоритмов Алгоритм кластеризации Вычислительная сложность Иерархический O(n2) K-средних O(nkl), где k - число кластеров, l -...
-
Модернизация обобщенного алгоритма кластеризации состоит в использовании вместо обычных бинарных деревьев сбалансированных бинарных деревьев(B+ tree)....
-
Базовый интерфейс двоичного дерева поиска состоит из трех операций: - FIND(K) -- поиск узла, в котором хранится пара (key, value) с key = K. - INSERT(K,...
-
Кластеризация (или кластерный анализ) -- это задача разбиения множества объектов на группы, называемые кластерами. Внутри каждой группы должны оказаться...
-
Коллекция транзакций хранится в файле на диске. Алгоритм читает каждую транзакцию t последовательно и присоединяет t к существующему кластеру, или...
-
Термин "транзакция" относится к подмножеству предметов из общей совокупности с переменным числом предметов (мощностью подмножества). Транзакциями...
-
Рис. 7 Пример двоичного дерева поиска Двоичное дерево поиска (binary search tree, BST) -- это двоичное дерево, для которого выполняются следующие...
-
Для разработки программного обеспечения использован язык Java. Разработка проводилась в среде Eclipse Ganymede 3.2. В качестве СУБД для тестирования...
-
Допустим, что MinSupi = и * |Ci|. Поддержка данного предмета в Ci характеризует число транзакций в этом кластере, которые содержат этот предмет. Поэтому...
-
Понятие Data Mining Средства Data Mining включают в себя очень широкий класс различных технологий и инструментов. Средства Data Mining на рынке...
-
Подход, основанный на "больших" предметах и функциональный критерий кластеризации Поддержка предмета в кластере Ci есть относительное число транзакций в...
-
В наше время все большее количество компаний, стремясь к повышению эффективности и прибыльности бизнеса пользуются цифровыми (автоматизированными)...
-
Рис. 9 Пример B+ дерева, связывающего ключи 1-7 с данными d1-d7. Связи (выделены красным) позволяют быстро обходить дерево в порядке возрастания ключей....
-
Алгоритм для обновления дан на рис.6. Для каждого предмета е в t отыскивается Hashi. Если е найдено хэше кластера, то увеличиваем на 1 его sup в Btreei....
-
Заключение, Список литературы - Предметный указатель базы данных
В процессе практической работы проводилась разработка алгоритмов, тестирование и отладка, как самого приложения, так и отдельных его модулей. Закрепления...
-
Обоснование выбора средств разработки проекта Для реализации корпоративной информационной системы "Бюджетное планирование и отчетность" в исследуемой...
-
В то время как цель проекта заключалась в оценке эффективности автоматизации тестирования функционала ядра, работа стала своего рода подведением итогов...
-
Общее описание программного обеспечения, реализующего разработанный алгоритм Основной идеей дипломного проекта, является реализация алгоритма...
-
ЗАКЛЮЧЕНИЕ, СПИСОК ЛИТЕРАТУРЫ - Анализ алгоритма Лемпеля-Зива
В данной курсовой работе был подробно рассмотрен один из алгоритмов Лемпеля-Зива (LZW) для упаковки-распаковки произвольных данных. В процессе изучения...
-
В данной работе была рассмотрена тема обратной разработки (реинжиниринга) базы данных информационного портала. В качестве методов оптимизации...
-
Заключение, Список использованных источников - Разработка и администрирование баз данных
Данная предметная область была тщательно изучена, и была спроектирована схема базы данных, и так же реализована в программном средстве "SQLyog...
-
Заключение - Программное обеспечение для пропускной системы на основе технологии NFC
Обеспечение удобной пропускной системы - важная и актуальная задача. Появление новых технологий, таких как NFC и HCE, позволяет решить эту проблему. В...
-
Тестируемый программный продукт является высокопроизводительным приложением, которое предоставляет возможность создания и настройки сетей беспроводного...
-
В течении года от команды разработчиков пришло 6 пакетов, содержащих изменения в ядре программы. Для каждого пакета составлялось в среднем от 1-ого до...
-
Заключение, Список литературы - Приложение для тестирования студентов
В результате выполнения данного курсового проекта было разработано приложение для "тестирования студентов". При помощи этой программы можно проверять...
-
В ходе выполнения дипломного проекта был разработан алгоритм генерации искусственных биометрических образов, позволяющий создавать правдоподобные...
-
Компания MERA Networks - является одним из крупнейших мировых поставщиков услуг в сфере информационно-коммуникационных технологий. MERA предлагает...
-
Заключение - Технологии больших данных: анализ и выбор решения для реализации проекта
На практике при реализации проектов возникает потребность в инструментах обработки больших данных от особенностей бизнеса, которые после накопления...
-
Обоснование выбора средств для разработки В качестве платформы была взята платформа NET, потому что платформа NET на текущий момент самая передовая и...
-
Заключение, Список использованной литературы - База данных склада обоев
В курсовом проекте были изучены основы системы программирования Visual Studio 2012. В ходе выполнения курсовой работы разработана программа на языке...
-
Заключение - Методика моделирования основных процессов разработки программного обеспечения
В рамках данной работы был рассмотрен процесс разработки ПО как части учебных проектов в НИУ ВШЭ - Пермь. Учебные проекты отличаются от реальных,...
-
Для того, чтобы использовать симметричные алгоритмы шифрования, необходимо безопасно обменяться ключами. Протокол Диффи - Хеллмана позволяет двум и более...
-
Введение В настоящем дипломном проекте исследуются вопросы, связанные с генерацией искусственных биометрических образов. Рассматриваются различные...
-
Для оценки возможности выполнения проекта имеющимся в распоряжении разработчика штатным составом исполнителей, нужно рассчитать их среднее количество,...
-
Разработка программного обеспечения предполагает необходимость координации значительного количества весьма разноплановых работ, в которых принимают...
-
Стек технологий При выборе стека технологий основное внимание уделялось следующим факторам, в порядке убывания значимости: § Кроссплатформенность; §...
-
В этой главе представлено описание инструментов и методов, использованных при написании кода программы. Инструменты разработки серверной части Для...
Заключение, Список литературы - Разработка программного обеспечения для реализации и тестирования алгоритма нахождения частых множеств в транзакционных данных вертикального формата