Постановка задачи, Организация сбора информации, JMP, Надстройка для Microsoft Exсel "Интеллектуальный анализ данных" - Деревья решений

Необходимо исследовать зависимость влияния различных факторов на параметр, характеризующий производство. В качестве такого параметра было выбрано качество целевой продукции. В качестве параметров, влияющих на качество целевой продукции, были выбраны такие показатели, как дебет реки, содержание электролитов в речной воде, расход волокнистой упрочняющей добавки, расход полимерной упрочняющей добавки и степень помола целлюлозы.

Организация сбора информации

Для выполнения этой лабораторной работы я использую таблицу данных, полученную в предыдущей работе. Выполнять работу можно с помощью двух программных средств: JMP или надстройки для Microsoft Excel "Интеллектуальный анализ данных".

JMP

Если импортировать эту таблицу в программу JMP, то мы сможем построить дерево решений по интересующему нас параметру. Загруженная таблица представлена на рисунке 2.

данные в программе jmp

Рисунок 2. - Данные в программе JMP

После этого начинаем строить деревья. Сначала выберем, что от чего зависит. Это делается в окне, представленном на рисунке 3.

определение зависимостей для прочности

Рисунок 3. - Определение зависимостей для прочности

Здесь мы определили, что прочность, как и остальные параметры, будет зависеть от дебета реки, кол-ва электролитов, температуры воды, расхода промывной, речной и деминерализованной воды, расхода полимера и волокна, степени помола.

Нажав кнопку ОК получаем окно изображенное на рисунке 4. Нажав Splitbest, получим начальный вид нашего дерева для прочности.

корень дерева параметра

Рисунок 4. - Корень дерева параметра "Прочность"

Перед исследованием зависимостей факторов от параметров я решил установить диапазон значений прочности, что бы знать, когда остановиться. А именно от 3,5 до 5(значения по умолчанию в виртуальном комплексе) для прочности, от 10 до 30 для влагопрочности и от 15 до 45 для пластичности. Далее по полю Mean мы выбираем ветку со значением, наиболее подходящим под установленный интервал. На выбранном листе жмем красную стрелку и выбираем Splitbest. Повторяем, пока есть возможность разделить лист. В итоге были получены деревья для всех параметров производства приведенные на рисунках ниже.

дерево параметра

Рисунок 5. - Дерево параметра "Прочность"

дерево для параметра

Рисунок 6. - Дерево для параметра "Пластичность"

дерево для параметра

Рисунок 7. - Дерево для параметра "Влагопрочность"

Надстройка для Microsoft Exсel "Интеллектуальный анализ данных"

Открыв таблицу, полученную в предыдущей работе, нам необходимо указать диапазон ячеек, по которым будет проводиться построение дерева. Сделать это можно до вызова мастера задачи или после, что изображено на рисунке 8.

мастер задач надстройки

Рисунок 8. - Мастер задач надстройки

Нажав кнопку "Далее" мы переходим к следующей странице, на которой необходимо выбрать, что от чего зависит. В выпадающем списке выбирается что зависит, а в обычном от чего. Все это представлено на рисунке 9.

выбор зависимостей

Рисунок 9. - Выбор зависимостей

Нажав кнопку "Далее" еще раз, мы попадаем на последнюю страницу мастера, на которой надо подтвердить свой выбор.

завершение работы мастера задачи

Рисунок 10. - Завершение работы мастера задачи

После нажатия кнопки "Готово" мы получим дерево, построенное по нашим параметрам.

дерево для параметра

Рисунок 11. - Дерево для параметра "Влагопрочность"

Повторив все то же для двух оставшихся параметров были получены все три дерева.

дерево для параметра

Рисунок 12. - Дерево для параметра "Прочность"

дерево для параметра

Рисунок 13. - Дерево для параметра "Пластичность"

Похожие статьи




Постановка задачи, Организация сбора информации, JMP, Надстройка для Microsoft Exсel "Интеллектуальный анализ данных" - Деревья решений

Предыдущая | Следующая