Сравнение алгоритмов - Разработка программного обеспечения для реализации и тестирования алгоритма нахождения частых множеств в транзакционных данных вертикального формата

Вычислительная сложность алгоритмов

Алгоритм кластеризации

Вычислительная сложность

Иерархический

O(n2)

K-средних

O(nkl), где k - число кластеров, l - число итераций

C-средних

Выделение связных компонент

Зависит от алгоритма

Минимальное покрывающее дерево

O(n2 log n)

Послойная кластеризация

O(max(n, m)), где m < n(n-1)/2

Сравнительная таблица алгоритмов

Алгоритм кластеризации

Форма кластеров

Входные данные

Результаты

Иерархический

Произвольная

Число кластеров или порог расстояния для усечения иерархии

Бинарное дерево кластеров

K-средних

Гиперсфера

Число кластеров

C-средних

Гиперсфера

Число кластеров,

Степень нечеткости

Центры кластеров, матрица принадлежности

Выделение связных компонент

Произвольная

Порог расстояния R

Древовидная структура кластеров

Минимальное покрывающее дерево

Произвольная

Число кластеров или

Порог расстояния для

Удаления ребер

Древовидная структура кластеров

Послойная кластеризация

Произвольная

Последовательность порогов расстояния

Древовидная структура кластеров с разными уровнями иерархии

В связи с тем, что нас интересует кластеризация именно транзакционных данных, произведем разбор данного понятия, а также существующих алгоритмов кластеризации транзакций.

Похожие статьи




Сравнение алгоритмов - Разработка программного обеспечения для реализации и тестирования алгоритма нахождения частых множеств в транзакционных данных вертикального формата

Предыдущая | Следующая