Постановка задачи, Организация сбора информации, JMP, Надстройка для Microsoft Exсel "Интеллектуальный анализ данных" - Деревья решений
Необходимо исследовать зависимость влияния различных факторов на параметр, характеризующий производство. В качестве такого параметра было выбрано качество целевой продукции. В качестве параметров, влияющих на качество целевой продукции, были выбраны такие показатели, как дебет реки, содержание электролитов в речной воде, расход волокнистой упрочняющей добавки, расход полимерной упрочняющей добавки и степень помола целлюлозы.
Организация сбора информации
Для выполнения этой лабораторной работы я использую таблицу данных, полученную в предыдущей работе. Выполнять работу можно с помощью двух программных средств: JMP или надстройки для Microsoft Excel "Интеллектуальный анализ данных".
JMP
Если импортировать эту таблицу в программу JMP, то мы сможем построить дерево решений по интересующему нас параметру. Загруженная таблица представлена на рисунке 2.

Рисунок 2. - Данные в программе JMP
После этого начинаем строить деревья. Сначала выберем, что от чего зависит. Это делается в окне, представленном на рисунке 3.

Рисунок 3. - Определение зависимостей для прочности
Здесь мы определили, что прочность, как и остальные параметры, будет зависеть от дебета реки, кол-ва электролитов, температуры воды, расхода промывной, речной и деминерализованной воды, расхода полимера и волокна, степени помола.
Нажав кнопку ОК получаем окно изображенное на рисунке 4. Нажав Splitbest, получим начальный вид нашего дерева для прочности.

Рисунок 4. - Корень дерева параметра "Прочность"
Перед исследованием зависимостей факторов от параметров я решил установить диапазон значений прочности, что бы знать, когда остановиться. А именно от 3,5 до 5(значения по умолчанию в виртуальном комплексе) для прочности, от 10 до 30 для влагопрочности и от 15 до 45 для пластичности. Далее по полю Mean мы выбираем ветку со значением, наиболее подходящим под установленный интервал. На выбранном листе жмем красную стрелку и выбираем Splitbest. Повторяем, пока есть возможность разделить лист. В итоге были получены деревья для всех параметров производства приведенные на рисунках ниже.

Рисунок 5. - Дерево параметра "Прочность"

Рисунок 6. - Дерево для параметра "Пластичность"

Рисунок 7. - Дерево для параметра "Влагопрочность"
Надстройка для Microsoft Exсel "Интеллектуальный анализ данных"
Открыв таблицу, полученную в предыдущей работе, нам необходимо указать диапазон ячеек, по которым будет проводиться построение дерева. Сделать это можно до вызова мастера задачи или после, что изображено на рисунке 8.

Рисунок 8. - Мастер задач надстройки
Нажав кнопку "Далее" мы переходим к следующей странице, на которой необходимо выбрать, что от чего зависит. В выпадающем списке выбирается что зависит, а в обычном от чего. Все это представлено на рисунке 9.

Рисунок 9. - Выбор зависимостей
Нажав кнопку "Далее" еще раз, мы попадаем на последнюю страницу мастера, на которой надо подтвердить свой выбор.

Рисунок 10. - Завершение работы мастера задачи
После нажатия кнопки "Готово" мы получим дерево, построенное по нашим параметрам.

Рисунок 11. - Дерево для параметра "Влагопрочность"
Повторив все то же для двух оставшихся параметров были получены все три дерева.

Рисунок 12. - Дерево для параметра "Прочность"

Рисунок 13. - Дерево для параметра "Пластичность"
Похожие статьи
-
Предложенный подход к решению задач исследования Используя в качестве основы присутствующее в наличии программное обеспечение, которое применимо к...
-
Создание отчета "Турнирная таблица женский биатлон" 1. Создадим отчет с помощью Мастера отчетов. Для этого совершаем следующие действия Биатлонисты>...
-
Создание форм 1. Для создания формы Биатлонисты совершаем следующие действия Таблицы > Биатлонисты > Создание> Форма, как показано на рисунке...
-
Полное наименование разрабатываемой системы - корпоративная информационная система "Бюджетное планирование и отчетность" группы компаний, занимающейся...
-
Обоснование выбора средств разработки проекта Для реализации корпоративной информационной системы "Бюджетное планирование и отчетность" в исследуемой...
-
Технологии Hadoop - Технологии больших данных: анализ и выбор решения для реализации проекта
Продукт Apache Hadoop является свободной Java-платформой на обычном оборудовании. Проект был рожден посредством обработки материалов Google File System и...
-
Построение модели предметной области с помощью описания структур данных и программного кода является классическим подходом в разработке ИС. Зачастую...
-
Задача поведенческой сегментации, формирование портретов клиентов по поведению Одними из основных задач анализа являлись: поведенческая сегментация...
-
Описание исходных данных На текущий момент (в силу большой загрузки IT-отдела) не реализован доступ к серверу с ХД, маркетинговые данные выгружаются в...
-
Постановка задачи Имеющаяся база данных SQL имеет недостаточное количество полей и таблиц, не имеет упорядоченной структуры пользователей для работы с...
-
Объектом исследования является производственная компания ООО "Элементари" (ELEMENTAREE) (http://www. elementaree. ru/). Исследования, отображаемые в...
-
Помимо концепции будущей системы бюджетирования, в рамках решения задачи разработки проекта "Бюджетное планирование и отчетность" должен быть разработан...
-
Программная модель данных, получившая название "MapReduce", была создана несколько лет назад в компании Google, и там же была осуществлена первая...
-
Заключение - Интеллектуальный анализ данных, который способствует поддержке маркетинга в компании
В рамках проведенного исследования была проделана работа по разработке системы интеллектуального анализа данных для поддержки маркетинга производственной...
-
Прогнозирование оттока клиентов Отделом маркетинга компании ELEMENTAREE было выявлено, что практически все клиенты, у которых отсутствовали заказы в...
-
В данном разделе была разработана функциональная схема работы программного комплекса, которая в общем виде описывает состав комплекса, характер и виды...
-
Онлайн исследования в социологии: новые методы анализа данных - Распространение новостной информации
На сегодняшний день анализ социальных сетей и медиа, Интернет-сообществ, пользователей в целом используется в основном в маркетинге. Компания может...
-
Структура кластера и его параметры Вычислительный кластер -- это совокупность компьютеров, объединенных в рамках некоторой сети для решения одной задачи,...
-
SPSS Modeler [29] - это программный комплекс, позволяющий строить прогностические модели и применять эту информацию при принятии решений на уровне...
-
Широкое распространение в операционной системе Windows имеет множество стандартных программ обеспечивающих работу устройств компьютера и служащих для...
-
SAP HANA - это гибкий многоцелевой и независимый от источника данных программный комплекс на базе технологии "in-memory", который объединяет компоненты...
-
Комплекс инструментов Oracle Exalytics Комплексное решение Oracle Exalytics создано для обеспечения высокой производительности аналитических систем и...
-
Заключение - Технологии больших данных: анализ и выбор решения для реализации проекта
На практике при реализации проектов возникает потребность в инструментах обработки больших данных от особенностей бизнеса, которые после накопления...
-
Из заполненной формы 3-информ, утвержденной Приказом Росстата от 06.09.2012 г. № 481 "Об утверждении статистического инструментария для организации...
-
Язык программирования R - Технологии больших данных: анализ и выбор решения для реализации проекта
Язык программирования R является универсальным и разработан для применения в следующих областях: разведочный анализ данных, классические статистические...
-
Современные технологии обработки Больших данных Большой проект бюджетирование автоматизация С приходом новых технологий, инструментов и средств...
-
Анализ предметной области Описание ПО решаемой задачи Предметной областью задачи № 2 также является процесс оплаты денежных средств по кредиту. Решается...
-
Описание бизнес-процессов бюджетирования в группе компаний нефтегазового сектора Одна из исследовательских задач данной работы состоит в том, чтобы...
-
Для осуществления первой задачи данной работы был проведен проведение подробный анализ семи наиболее распространенных технологий работы с Большими...
-
Введение - Технологии больших данных: анализ и выбор решения для реализации проекта
В конце 2000х годов были уже сформированы решения класса Business Intelligence, которые являются альтернативой традиционным методам управления базами...
-
Общие требования Прежде чем начинать формулировать требования к пользовательскому интерфейсу, было принято решение, что необходимо ознакомиться с...
-
Методы разработки вычислительной сети: 1. Экспериментальный метод - персонал предприятия закупает "новинки" рынка компьютерной техники. Такой метод -...
-
Теоретические предпосылки исследования Системы поддержки принятия решений Системы поддержки принятия решений (СППР), представляют собой приложения узкого...
-
Для того, чтобы разработать оптимальный метод интеграции сторонних систем в существующую ИТ-инфраструктуру систем компании, требуется точно поставить...
-
Система мониторинга социальных сетей предоставляет исследователю возможность собрать интересующие его упоминания в социальных сетях по какой-либо...
-
Обзор протокола Multi-Touch технологий передачи данных TUIO [7] - основной кроссплатформенный протокол с открытым исходным кодом Multi-Touch передачи...
-
В качестве доступного инструментария были рассмотрены две открытые кроссплатформенные библиотеки для разработки C++ приложений WxWidgets и Boost ,...
-
Корпоративная интеграционная подсистема на базе IBM WebSphere Business Integration Message Broker [28] отвечает за выстраивание корпоративной...
-
Рисунок 1. Пример сложной схемы БД Пример проблемной ситуации, которую этот проект должен разрешить представлен на рис. 1. Организатор проводит события...
-
Особенность создания электронного пособия
Особенность создания электронного пособия 1-часть 1-секция. Настройка виртуалной машины Fedora14 1. Откройте Свой Проигрыватель VMware Инструкция: 1.1 На...
Постановка задачи, Организация сбора информации, JMP, Надстройка для Microsoft Exсel "Интеллектуальный анализ данных" - Деревья решений