Предлагаемое решение поставленной проблемы - Мобильный инструмент фитопатолога для количественной экспресс-оценки в условиях поля степени поражения листьев озимого ячменя пятнистостями на основе спектрального АСК-анализа и системы "Эйдос"

Идея и концепция решения проблемы (задача 1)

Идея решения проблемы состоит в применении для этой цели современных IT-технологий, которых просто не существовало в период разработки традиционного подхода.

В последнее время эти технологии все шире применяются в различных сферах сельского хозяйства, например, таких как точное земледелие, обследование сельскохозяйственных угодий на основе спектрозональной съемки и ее анализа; Беспилотные летательные аппараты находят применение в экологическом мониторинге, в оценке динамики экзогенных геологических процессов, в инвентаризации объектов лесного хозяйства, в оценке объемов вырубки леса, мониторинга состояния сельскохозяйственных угодий др.; Виртуальные приборы для определения площади листовой поверхности (Дмитриев, 2016), определение по контурам листа сорта винограда (Луценко, 2015), анализ по контурам видов насекомых (Луценко, 2016) др.

Концепция решения проблемы Конкретизирует сформулированную выше идею и заключается в применении технологий искусственного интеллекта для создания мобильного инструмента фитопатолога для количественной экспресс-оценки в условиях поля степени поражения листьев озимого ячменя пятнистостями на основе спектрального анализа изображений листьев.

В качестве виртуального прибора предлагается применить Планшет на MS Windows, позволяющий запускать любое программное обеспечение под Windows и имеющий камеру для получения в условиях поля качественных (с высоким разрешением и хорошей глубиной цвета) изображений листьев, а также обеспечивающий доступ в Internet (рисунок 4).

планшет и его возможности

Рисунок 4. Планшет и его возможности

Если в точке поля, где фитопатологу необходимо провести измерения, есть доступ в Internet, то планшет может быть использован в качестве фотоаппарата для съемки листьев и передачи их изображений на основной компьютер, а также в качестве терминала для удаленного управления основным компьютером с помощью программы TeamViewer. Эта программа обеспечивает удобную работу на удаленном компьютере с мобильного устройства.

Если в точке поля, где фитопатологу необходимо провести измерения, нет доступа в Internet, то планшет обеспечивает запуск и использование для измерения необходимых программ локально.

Система искусственного интеллекта, обеспечивающая спектральный анализ конкретных изображений и формирование обобщенных спектров групп изображений (классов), может быть применена для:

    - создания моделей, отражающих зависимость спектральных характеристик листьев озимого ячменя от степени их поражения пятнистостью; - применения этих моделей для диагностики степени поражения конкретных листьев.

По Гипотезе авторов это обеспечит преодоление всех перечисленных выше недостатков традиционного подхода:

    1. Понизит затраты труда и времени для измерения. 2. Повысит точность измерений за счет:
      - применения числовых шкал измерений с любым заданным количеством интервальных значений спектра (численные эксперименты проводились с числом цветов в спектре от 7 до 350); - исключения человеческого фактора, т. е. субъективных ошибок при определении степени поражения, что обеспечит зависимость результатов оценки только от степени поражения ячменя и снимет зависимость от опыта фитопатолога;
    3. Обеспечит адаптивность измерительного инструмента за счет возможности его самостоятельного совершенствования как для его районирования и настройки на различные типы поражений (болезни) и сорта ячменя, так и для других растений. Это позволит формировать, расширять и совершенствовать базы данных для принятия решений (модели) с учетом потребностей конкретного пользователя (эксперта).

Обоснование выбора метода и инструмента решения проблемы (задача 2)

Автоматизированный системно-когнитивный анализ (АСК-анализ) разработан проф. Е. В. Луценко в 2002 году для решения широкого класса задач идентификации, прогнозирования, классификации, диагностики, поддержки принятия решений и исследования моделируемой предметной области путем исследования ее модели. АСК-анализ имеет программный инструментарий - универсальную когнитивную аналитическую систему "Эйдос" (система "Эйдос").

Система "Эйдос" находится в полном открытом бесплатном доступе на сайте автора по адресу: http://lc. kubagro. ru/aidos/_Aidos-X. htm и реализована в универсальной постановке, не зависящей от предметной области. Система имеет около 30 встроенных локальных учебных приложений и более 70 облачных Эйдос-приложений учебного и научного характера.

Математическая модель системы "Эйдос" основана на системной нечеткой интервальной математике и обеспечивает сопоставимую обработку больших объемов фрагментированных и зашумленных взаимозависимых данных, представленных в различных типах шкал (номинальных, порядковых и числовых) и различных единицах измерения. Система обеспечивает построение информационно-измерительных систем в различных предметных областях (Луценко, 2013), в частности АСК-анализ изображений (Луценко, 2016). В системе "Эйдос" реализован программный интерфейс, обеспечивающий автоматизированный ввод в систему изображений и выявление спектральных характеристик как конкретных изображений, так и обобщенных образов классов, т. е. обобщенных изображений, построенных на основе нескольких конкретных (Луценко, 2017), что позволяет:

    1. Измерять спектры графических объектов (т. е. точно определять цвета, присутствующие в изображении). 2. Формировать обобщенные спектры классов. При этом рассчитывается количество информации в каждом цвете обобщенного спектра класса о принадлежности конкретного объекта с этим цветом в спектре к данному классу. 3. Сравнивать конкретные объекты с классами по их спектрам. При этом рассчитывается суммарное количество информации в цветах спектра конкретного объекта о его принадлежности к обобщенному образу класса. 4. Сравнивать классы друг с другом по их спектрам.

В качестве спектра изображения в системе рассматривается доля пикселей разных цветов в общем числе пикселей изображения без учета фона.

Путем многопараметрической типизации в системе создается системно-когнитивная модель, с применением которой, если модель окажется достаточно достоверной, могут решаться задачи системной идентификации, прогнозирования, классификации, поддержки принятия решений и исследования моделируемого объекта путем исследования его модели (Луценко, 2015, 2015).

Всем этим и обусловлен выбор АСК-анализа и системы "Эйдос" в качестве инструментария решения поставленной проблемы.

Применение выбранного метода и инструмента для решения проблемы (задача 3)

Решение задачи 3 предполагает выполнение следующих этапов, стандартных для АСК-анализа:

    - когнитивная структуризация предметной области; - формализация предметной области; - синтез и верификация модели; - повышение качества модели и выбор наиболее достоверной модели - решение в наиболее достоверной модели задач диагностики (классификации, распознавания, идентификации), поддержки принятия решений и исследования моделируемой предметной области путем исследования ее модели.

Все эти этапы АСК-анализа, за исключением 1-го, автоматизированы в системе "Эйдос". Рассмотрим их в порядке исполнения.

Когнитивно-целевая структуризация предметной области

На этапе когнитивно-целевой структуризации предметной области мы решаем на качественном уровне, что будем рассматривать в качестве факторов, действующих на моделируемый объект (причин), а что в качестве результатов действия этих факторов (последствий).

В данной работе мы собираемся на основе оптического спектра листьев озимого ячменя определять степень поражения этих листьев пятнистостью.

Соответственно, для формализации задачи, выполняемой на следующем этапе АСК-анализа, мы будем использовать две шкалы:

    - классификационная шкала: "Степень поражения пятнистостью (%)"; - доля цветов оптического спектра в изображении листьев.

Формализация предметной области и описание исходных данных

Формализация предметной области - это этап АСК-анализа, на котором сначала разрабатываются классификационные и описательные шкалы и градации, а затем с помощью них исходные данные кодируются к такой форме, которая удобна для дальнейшей обработки в системе "Эйдос", т. е. для синтеза и верификации моделей, т. е. формируются обучающая выборка и база событий.

Эта удобная для обработки в системе форма представления данных называется "нормализованные базы данных", а содержание этапа формализации предметной области, по сути, представляет собой нормализацию исходных баз данных.

В системе "Эйдос" есть много программных интерфейсов с внешними источниками данных (рисунок 5), которые можно объединить в три группы:

    - интерфейсы с текстовыми данными; - интерфейсы с табличными данными; - интерфейсы с графическими данными.

В будущем планируется расширить типы данных для программных интерфейсов.

Для удобства пользователей использование некоторых из интерфейсов с графическими данными дублируются в подсистемах: 4.7. АСК-анализ изображений и 4.8. Геокогнитивная система.

программные интерфейсы, вызываемые в режиме 2.3.2 системы

Рисунок 5. Программные интерфейсы, вызываемые в режиме 2.3.2 системы "Эйдос".

Запустим интерфейс 2.3.2.5. и в появившемся окне:

Выберем 1-й пункт, обеспечивающий формализацию предметной области. Отметим, что 2-й пункт используется при применении созданных моделей на практике.

Появится окно:

Необходимо выполнить все пункты этого окна по очереди, за исключением 3-го, который является необязательным.

При выполнении 2-го пункта изображения загружаются в базу данных из папки: ..:Aidos-XAID_DATAInp_data, в которую они должны быть предварительно помещены.

Фон изображений влияет на результаты их анализа, поэтому его надо предварительно удалить. Удобнее всего это сделать в on-line редакторе:

    - инструкция: http://www. liveinternet. ru/users/karina-1952/post367506106; - сам редактор: https://pixlr. com/editor/.

Для обработки удобнее всего загружать сразу все изображения, а потом после удаления фона записывать их и закрывать.

Для решения поставленной задачи использовались 30 сканированных на светлом фоне с одинаковым разрешением изображения листьев озимого ячменя сорта Павел, пораженных сетчатой пятнистостью (в естественных условиях) от 0 до 80 %, который определили по шкале учета самостоятельно (рисунок 6).

пораженные листья озимого ячменя сетчатой пятнистостью (поле учхоз кубань 2017г.)

Рисунок 6 Пораженные листья озимого ячменя сетчатой пятнистостью (поле УЧХОЗ Кубань 2017г.)

В качестве спектра изображения в системе рассматривается доля пикселей разных цветов в общем числе пикселей изображения без учета фона (Луценко, 2017).

Данный режим обеспечил:

    - ввод изображений в систему по пикселям (для этого выполнить первые два режима подготовки данных); - измерение спектров изображений с заданным числом цветовых диапазонов (цветовых интервалов) (выполнить 4-й режим подготовки данных); - рассмотрение характеристик спектра конкретных изображений как их признаков при формировании моделей (наряду с пикселями); - вывод исходных изображения с их спектрами на экран и запись в виде файлов в папку: ..AID_DATAInpSpectrPix. - формирование обобщенных спектров изображений, относящихся к различным группам, классам (обобщенные спектры классов); - количественное сравнение конкретных изображений по их спектрам с обобщенными спектрами классов, т. е. решение задачу идентификации (классификации, диагностики, распознавания, прогнозирования); - количественное сравнение обобщенных спектров классов друг с другом и решение задач кластерно-конструктивного анализа;

Исходные изображения должны быть в формате jpg или bmp и находиться непосредственно в папке: ../Aid_data/Inp_data/, если ставится цель формализации предметной области и синтеза модели, и в папке: ../Aid_data/Inp_rasp/, если ставится цель формирования распознаваемой выборки.

Для режимов спектрального анализа изображений не важно, как они масштабированы и повернуты, но желательно, чтобы они были без фона. Пакетные on-line сервисы, обеспечивающие "оконтуриване и удаление фона" изображений можно найти в Internet по запросу, который в кавычках.

Система работает с графическими файлами jpg и bmp. Желательно, чтобы файлы имели не более 400 пикселей по горизонтали и вертикали, т. к. иначе они могут неверно отображаться на экране и время обработки может сильно затянуться, т. к. идет попиксельный анализ графических файлов.

Имена графических файлов должны иметь следующий вид:

    - ячмень 00%-01.jpg, ячмень 00%-02.jpg, ячмень 00%-03.jpg, ячмень 00%-04.jpg, ячмень 00%-05.jpg, ячмень 00%-06.jpg; - ячмень 05%-01.jpg, ячмень 05%-02.jpg, ячмень 05%-03.jpg, ячмень 05%-04.jpg, ячмень 05%-05.jpg, ячмень 05%-06.jpg; - ячмень 10%-01.jpg, ячмень 10%-02.jpg, ячмень 10%-03.jpg, ячмень 10%-04.jpg; - ячмень 15%-01.jpg, ячмень 15%-02.jpg; - ячмень 20%-01.jpg, ячмень 20%-02.jpg, ячмень 20%-03.jpg, ячмень 20%-04.jpg; - ячмень 30%-01.jpg; - ячмень 40%-01.jpg, ячмень 40%-02.jpg; - ячмень 50%-01.jpg; - ячмень 60%-01.jpg; - ячмень 70%-01.jpg; - ячмень 80%-01.jpg".

Часть имени файла до тире рассматривается системой "Эйдос" как наименования класса, т. е. группы, к которой относится файл.

После тире идет Внутренняя нумерация файлов внутри класса, т. е. это номер реализации или наблюдения.

Например, обобщенный образ класса: "ячмень 00%" будет формироваться системой на основе 6 примеров листьев, относящихся к этому классу, а образ класса: "ячмень 15%" лишь на основе 2-х примеров. Если тире в имени файла отсутствует, то все имя файла рассматривается как имя класса.

При выборе 4-го пункта изображения из базы данных изображений анализируются и формируется база данных: "Inp_data. xls" для продолжения формализации предметной области. При выборе этого пункта появляется окно, приведенное на рисунке 7, в котором можно указать различные параметры для анализа изображений. Мы выберем параметры, указанные на рисунке, которые являются параметрами по умолчанию:

параметры для анализа изображений в режиме 2.3.2.5. системы

Рисунок 7. Параметры для анализа изображений в режиме 2.3.2.5. системы "Эйдос".

Затем идет процесс анализа графических файлов отображением стадии этого анализа. По окончании анализа изображений выводится информация о том, как продолжить работу.

Далее выполним режим 2.3.2.3 с параметрами по умолчанию (рисунок 8), которые формируются автоматически на предыдущем этапе.

экранная форма режима 2.3.2.3 системы

Рисунок 8. Экранная форма режима 2.3.2.3 системы "Эйдос".

Данный режим и формирует классификационные и описательные шкалы и градации (рисунки 9 и 10) и обучающую выборку (рисунок 11), чем завершается формализация предметной области.

классификационная шкала и градации

Рисунок 9. Классификационная шкала и градации

Обратим внимание на то, что система "Эйдос" сортирует текстовые градации классификационных шкал, т. е. классы, по алфавиту. Поэтому, чтобы их порядок был правильный и шкала была не просто номинальной, но порядковой, в наименованиях графических файлов исходных данных используются Ведущие нули при нумерации реализаций внутри класса (00 вместо 9, 01 вместо 1). Количество этих ведущих нулей берется таким, чтобы разрядов хватило для нумерации всех файлов.

описательная шкала и градации (спектральные диапазоны)

Рисунок 10. Описательная шкала и градации (спектральные диапазоны)

обучающая выборка (фрагмент)

Рисунок 11. Обучающая выборка (фрагмент)

В результате формализации предметной области создаются все условия для синтеза и верификации (оценки достоверности) моделей.

Синтез и верификация статистических и системно-когнитивных моделей

Синтез моделей

Синтез и верификация моделей осуществляется в режиме 3.5 системы "Эйдос" (рисунок 12):

экранная форма режиме синтеза и верификации моделей

Рисунок 12. Экранная форма режиме синтеза и верификации моделей

Стадия процесса исполнения и прогноз времени его окончания отображается на экранной форме (рисунок 13):

экранная форма с отображением стадии синтеза и верификации моделей и прогнозом времени его окончания

Рисунок 13. Экранная форма с отображением стадии синтеза и верификации моделей и прогнозом времени его окончания

Из рисунка 13 видно что весь процесс синтеза и верификации моделей занял 18 секунд.

Верификация моделей

Оценка достоверности моделей осуществляется путем решения задачи классификации исходных изображений по обобщенным образам классов и подсчета количества истинных положительных и отрицательных, а также ложных положительных и отрицательных решений по F-мере Ван Ризбергена и L1- L2-мерам проф. Е. В. Луценко (2017).

Классическая количественная мера достоверности моделей: F-мера Ван Ризбергена основана на подсчете суммарного количества верно и ошибочно классифицированных и не классифицированных объектов обучающей выборки. В мультиклассовых системах классификации объект может одновременно относится ко многим классам. Соответственно, при синтезе модели его описание используется для формирования обобщенных образов многих классов, к которым он относится. При использовании модели для классификации определяется степень сходства-различия объекта со всеми классами, причем истинно-положительным решением может являться принадлежность объекта сразу к нескольким классам. В результате такой классификации получается, что объект не просто правильно или ошибочно относится или не относится к различным классам, как в классической F-мере, но правильно или ошибочно относится или не относится к ним в различной степени.

Однако классическая F-мера не учитывает того, что объект может, фактически, одновременно относится ко многим классам (мультиклассовость) и того, что в результате классификации может быть получена различная степень сходства-различия объекта с классами (нечеткость). На численных примерах автором установлено, что при истинно-положительных и истинно-отрицательных решениях модуль сходства-различия объекта с классами значительно выше, чем при ложно-положительных и ложно-отрицательных решениях.

Поэтому была предложена L1-мера достоверности моделей (Луценко, 2017), учитывающая не просто сам факт истинно или ложно положительного или отрицательного решения, но и степень уверенности классификатора в этих решениях. При классификации больших данных было обнаружено большое количество ложно-положительных решений с низким уровнем сходства, которые, однако, суммарно вносят большой вклад в снижение достоверности модели.

Чтобы преодолеть эту проблему предлагается L2-мера (Луценко, 2017), в которой вместо сумм уровней сходства используется средние уровни сходства по различным вариантам классификации. Таким образом, в данной работе предлагаются меры достоверности моделей, названые L1-мера и L2-мера, смягчающие и преодолевающие недостатки F-меры, эти меры описаны математически и их применение продемонстрировано на простом численном примере. В интеллектуальной системе "Эйдос", которая является программным инструментарием автоматизированного системно-когнитивного анализа (АСК-анализ), реализованы все эти меры достоверности моделей: F, L1 и L2

В режиме 4.1.3.6 на мы видим (рисунок 14), что по L2-мере наивысшую достоверность имеет модель INF3

экранная форма с оценками достоверности моделей согласно f-критерию ван ризбергена и его нечетким мультиклассовым обобщениям, инвариантным, относительно объемов выборки

Рисунок 14. Экранная форма с оценками достоверности моделей согласно F-критерию Ван Ризбергена и его нечетким мультиклассовым обобщениям, инвариантным, относительно объемов выборки

Из этой формы мы видим, что по L2-критерию достоверность наиболее достоверной модели INF3 составляет 0,755, что неплохо.

Повышение качества модели и выбор наиболее достоверной модели

Достоверность моделей может быть повышена путем проведения ряда специальных мероприятий, которые мы в данной работе рассматривать не будем в связи с ограничением на ее объем. Отметим лишь, что в системе "Эйдос" есть целая подсистема 3.7.6. Повышение качества моделей, включающая 8 режимов, предназначенных для этих целей (рисунок 15):

подсистема повышения качества моделей

Рисунок 15. Подсистема повышения качества моделей

После выполнения этих режимов наиболее достоверной может стать другая модель, чем была до этого, а может и остаться та же самая.

Из предыдущего раздела мы видели, что наиболее достоверной по L2-критерию является модель INF3. Поэтому придадим ей статус текущей модели. Для этого выполним предназначенный для этого режим 5.6 (рисунок 16):

экранная форма режима выбора текущей модели

Рисунок 16. Экранная форма режима выбора текущей модели

Диагностика степени поражения пятнистостью листьев озимого ячменя

Спектры исходных изображений

Спектры исходных изображений формируются при формализации предметной области, т. к. они представляют собой один из этапов процесса формализации. Но приводятся они в данном разделе (рисунки 17), т. к. так их удобнее сравнивать с обобщенными спектрами классов, которые формируются на этапе синтеза модели и которые будут рассматриваться в следующем разделе.

примеры спектров исходных изображений листьев ячменя, в различной степени пораженных сетчатой пятнистостью

Рисунки 17. Примеры спектров исходных изображений листьев ячменя, в различной степени пораженных сетчатой пятнистостью.

Обобщенные спектры классов

Из спектров исходных изображений, приведенных на рисунках 17, видно, что чем выше степень поражения пятнистостью, тем меньше доля зеленого цвета и выше красного. Но это видно на качественном уровне. Количественное сравнение проведено в системе путем формирования обобщенных спектров классов, которые сравнивались друг с другом (рисунки 18):

примеры обобщенных спектров классов изображений листьев ячменя, в различной степени пораженных сетчатой пятнистостью

Рисунки 18. Примеры обобщенных спектров классов изображений листьев ячменя, в различной степени пораженных сетчатой пятнистостью.

Из рисунков 18 можно понять, каким образом производилось сравнение обобщенных спектров классов друг с другом.

На рисунке слева мы видим относительную частоту, т. е. упрощенно говоря Условную вероятность При неограниченном увеличении объема выборки относительная частота стремится к вероятности, как пределу. встречи цветов оптического спектра в каждом классе (обозначено высотой колонки цвета в гистограмме) и в среднем по всей выборке исходных изображений, т. е. безусловную вероятность (обозначено пунктиром).

Видно, что в каждом классе некоторые цвета встречаются чаще, чем в среднем по выборке, а некоторые реже.

На рисунке справа показан результат сравнения условного спектра класса с безусловным спектром всей выборки. Для каждого цвета спектра этот результат сравнения включает знак и модуль.

Если вероятность встречи цвета в классе выше, чем средняя по всей выборке, то мы видим соответствующий цвет спектра в виде колонки Выше нуля.

Если вероятность встречи цвета в классе ниже, чем средняя по всей выборке, то мы видим соответствующий цвет спектра в виде колонки Ниже нуля.

Модуль колонки каждого цвета отражает степень отличия условной вероятности встречи этого цвета в данном классе от безусловной вероятности его встречи по всей выборке.

Положительные цвета на картинке справа можно считать характерными для данного класса, а отрицательные - не характерными, степень отличия от нуля - отражает степень этой характерности или не характерности.

Из сравнения обобщенных спектров классов на рисунках 18 видно, что чем ниже степень поражения листьев пятнистостью, тем более характерными является зеленый цвет листьев и менее характерным - красный, чем выше степень поражения, тем выше характерность красного цвета и ниже характерность зеленого.

Справа показано количество информации в цвете каждого спектрального диапазона о принадлежности объекта с этим цветом к данному классу. Если в данном классе условная вероятность встретить пиксели этого цвета выше, чем безусловная вероятность его встречи в среднем по всей выборке, то данный спектральный диапазон является характерным для данного класса, если ниже, чем по всей выборке - то не характерным, если же условная вероятность встречи пикселей данного спектрального диапазона близка к безусловной (средней по всей выборке), то обнаружение данного цвета у конкретного изображения ничего не говорит о принадлежности или непринадлежности данного изображения к этому классу.

По полученным результатам, видно, что программа четко разграничивает по встречаемым цветам листья на разные проценты поражения, определяет вероятность встречи цвета по изучаемому классу, сохраняет в базе данных, после чего, можно загружать десятки и сотни отсканированных листьев, и программа безошибочно и быстро отнесет к определенному классу поражения, что значительно ускоряет и облегчает процесс для исследователя. При большой изучаемой выборке, в будущем, можно будет создавать базу данных для каждого конкретного сорта и болезни и проводить анализ устойчивости или восприимчивости сорта в разных агроклиматических условиях по годам исследования и даже по расам патогенов.

По сути это означает, что система "Эйдос" в определенной степени автоматизирует те методы анализа, которые применяет эксперт - фитопатолог, чем существенно повышает качество его работы и уменьшает ее трудоемкость.

Количественные оценки этих параметров делаются на основе аналитических выражений для частных критериев, на основе которых рассчитываются модели в системе "Эйдос" (таблица 2):

Таблица 2. Частные критерии знаний, используемые в АСК-анализе и системе "Эйдос-Х++"

Наименование модели знаний

И частный критерий

Выражение для частного критерия

Через

Относительные частоты

Через

Абсолютные частоты

INF1, частный критерий: количество знаний по А. Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак

INF2, частный критерий: количество знаний по А. Харкевичу, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу. Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак.

INF3, частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами

---

INF4, частный критерий: ROI - Return On Investment, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу

INF5, частный критерий: ROI - Return On Investment, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу

INF6, частный критерий: разность условной и безусловной относительных частот, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу

INF7, частный критерий: разность условной и безусловной относительных частот, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу

Обозначения:

I - значение прошлого параметра;

J - значение будущего параметра;

Nij - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра;

M - суммарное число значений всех прошлых параметров;

W - суммарное число значений всех будущих параметров.

Ni - количество встреч i-м значения прошлого параметра по всей выборке;

Nj - количество встреч j-го значения будущего параметра по всей выборке;

N - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра по всей выборке.

Iij - частный критерий знаний: количество знаний в факте наблюдения i-го значения прошлого параметра о том, что объект перейдет в состояние, соответствующее j-му значению будущего параметра;

Ш - нормировочный коэффициент (Е. В. Луценко, 2002), преобразующий количество информации в формуле А. Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой Р. Хартли;

Pi - безусловная относительная частота встречи i-го значения прошлого параметра в обучающей выборке;

Pij - условная относительная частота встречи i-го значения прошлого параметра при j-м значении будущего параметра.

Экранные формы с результатами диагностики

Для выполнения диагностики, т. е. определения степени сходства конкретных листьев с обобщенными образами классов по их спектрам необходимо выполнить режим 4.1.2 в наиболее достоверной модели INF3, которая ранее была сделана текущей. Результаты диагностики могут быть выведены во многих экранных формах и таблицах, которые сгруппированы в режиме 4.1.3. Вывод результатов распознавания (рисунок 19):

экранных формы и таблицы режима

Рисунок 19. Экранных формы и таблицы режима:

Вывод результатов распознавания

На рисунках 20 и 21 приведены экранные выходные формы 4.1.3.1 и 4.1.3.2 соответственно:

экранная форма 4.1.3.1 с результатами диагностики в разрезе

Рисунок 20. Экранная форма 4.1.3.1 с результатами диагностики в разрезе: "Объект - классы"

экранная форма 4.1.3.2 с результатами диагностики в разрезе

Рисунок 21. Экранная форма 4.1.3.2 с результатами диагностики в разрезе: "Класс - объекты"

"Птичками" обозначены результаты диагностики, соответствующие факту.

Исследование моделируемой предметной области путем исследования ее модели

Система "Эйдос" включает много различных возможностей исследования моделируемого объекта путем исследования его модели. Естественно, результаты этих исследований можно считать результатами исследования самого объекта моделирования в той степени, в какой модель верно отражает его свойства, т. к. в какой она адекватна.

В частности это следующие возможности исследования:

    - информационные портреты классов; - нелокальные нейроны и нейронная сеть; - кластерно-конструктивный анализ; -автоматизированный SWOT-анализ; - когнитивные функции

И другие. Кратко рассмотрим ниже эти возможности.

Информационные портреты классов и признаков

Информационный портрет класса представляет собой список признаков, ранжированный в порядке убывания степени их характерности для данного класса (Луценко Е. В., 1987) (рисунок 22):

Из этой экранной формы на рисунке 22 видно, что зеленые цвета являются наиболее характерными для листьев ячменя с отсутствием поражения пятнистостью.

экранная форма режима 4.2.1 с информационным портретом класса

Рисунок 22. Экранная форма режима 4.2.1 с информационным портретом класса: "ячмень 00%"

Информационный портрет признака представляет собой список классов, ранжированный в порядке убывания количества информации в признаке и принадлежности объектов к классам (рисунок 23):

экранная форма режима 4.3.1 с информационным портретом признака

Рисунок 23. Экранная форма режима 4.3.1 с информационным портретом признака: "Спектральный диапазон 1/12-зеленый"

Из рисунка 23 видно, что наличие этого цвета в листе несет информацию о том, что у него низкая степень поражения пятнистостью либо оно вообще отсутствует.

. SWOT-анализ

Автоматизированный swot-анализ предложен и реализован проф. Е. В. Луценко в 2014 году.

Он представляет ту же информацию, что и в информационных портретах, классов и признаков, но в более традиционной и привычной для многих форме: в форме SWOT-таблиц (рисунки 23 и 24) и SWOT-диаграмм (рисунки 25 и 26):

swot-таблица спектральных диапазонов, способствующих и препятствующих принадлежности листа ячменя к классу

Рисунок 23. SWOT-таблица спектральных диапазонов, способствующих и препятствующих принадлежности листа ячменя к классу: "поражение пятнистостью отсутствует".

инвертированная swot-таблица

Рисунок 24. Инвертированная SWOT-таблица (Луценко Е. В., 2014), отражающая влияние спектрального диапазона 12/35-зеленый на принадлежность листьев ячменя с этим цветом к классам, соответствующим различной степенью поражения пятнистостью

В SWOT-диаграммах отражена та же информация, что в SWOT-таблицах, но в графической форме.

swot-диаграмма спектральных диапазонов, способствующих и препятствующих принадлежности листа ячменя к классу

Рисунок 25. SWOT-диаграмма спектральных диапазонов, способствующих и препятствующих принадлежности листа ячменя к классу: "поражение пятнистостью отсутствует".

инвертированная swot-диаграмма

Рисунок 26. Инвертированная SWOT-диаграмма (Луценко Е. В., 2014), отражающая влияние спектрального диапазона 12/35-зеленый на принадлежность листьев ячменя с этим цветом к классам, соответствующим различной степенью поражения пятнистостью

Нелокальная нейронная сеть и нейроны

В системе "Эйдос" используется оригинальная (Луценко Е. В., 1979) нечеткая декларативная гибридная модель знаний, имеющая наибольшее сходство с фреймовой и нейросетевой моделями.

Поэтому результаты анализа могут быть представлены в графических образах нейросетевой интерпретации (рисунки 27 и 28):

пример нелокального нейрона

Рисунок 27. Пример нелокального нейрона

парето-подмножество нелокальной нейронной сети

Рисунок 28. Парето-подмножество нелокальной нейронной сети

Кластерно-конструктивный анализ

Результаты сравнения друг с другом обобщенных образов классов могут быть представлены в форме матрицы сходства (таблица 3), а также экранных форм и когнитивных диаграмм (рисунки 29 и 30):

Таблица 3 - Матрица сходства классов в наиболее достоверной модели INF3

Код

Класса

Наименование

Класса

N1

N2

N3

N4

N5

N6

N7

N8

N9

N10

N11

1

1/11-{ячмень 00%}

100,00

37,47

-21,35

-73,47

-36,91

-8,51

-49,57

-23,46

-61,83

-31,41

-39,29

2

2/11-{ячмень 05%}

37,47

100,00

67,71

-67,91

-89,47

62,86

-96,56

-89,62

-86,98

-95,53

-82,72

3

3/11-{ячмень 10%}

-21,35

67,71

100,00

-29,53

-75,75

69,32

-62,73

-64,72

-61,32

-77,37

-72,43

4

4/11-{ячмень 15%}

-73,47

-67,91

-29,53

100,00

56,73

-52,70

67,77

53,24

80,95

62,95

79,42

5

5/11-{ячмень 20%}

-36,91

-89,47

-75,75

56,73

100,00

-43,73

91,71

72,28

92,83

90,16

75,49

6

6/11-{ячмень 30%}

-8,51

62,86

69,32

-52,70

-43,73

100,00

-48,97

-72,13

-45,84

-69,43

-77,32

7

7/11-{ячмень 40%}

-49,57

-96,56

-62,73

67,77

91,71

-48,97

100,00

86,44

90,85

93,28

82,19

8

8/11-{ячмень 50%}

-23,46

-89,62

-64,72

53,24

72,28

-72,13

86,44

100,00

68,31

92,95

81,18

9

9/11-{ячмень 60%}

-61,83

-86,98

-61,32

80,95

92,83

-45,84

90,85

68,31

100,00

86,12

83,71

10

10/11-{ячмень 70%}

-31,41

-95,53

-77,37

62,95

90,16

-69,43

93,28

92,95

86,12

100,00

88,75

11

11/11-{ячмень 80%}

-39,29

-82,72

-72,43

79,42

75,49

-77,32

82,19

81,18

83,71

88,75

100,00

экранная форма режима кластерно-конструктивного анализа классов (режим 4.2.2.2 системы

Рисунок 29. Экранная форма режима кластерно-конструктивного анализа классов (режим 4.2.2.2 системы "Эйдос")

Матрица сходства может быть представлена в графической форме когнитивной диаграммы:

когнитивная диаграмма сходства-различия обобщенных образов классов

Рисунок 30. Когнитивная диаграмма сходства-различия обобщенных образов классов

Из этой когнитивной диаграммы видно, что классы образуют конструкт, на одном полюсе которого находится кластер из классов с низким уровнем поражения листьев озимого ячменя сетчатой пятнистостью: 0%, 5% и 10%, а также 30% (что вероятно связано с неточностями в экспертных оценках исходных данных, т. к. понятно, что вместо 30% должно быть 15%), а на другом полюсе кластер классов с высоким уровнем поражения: 15-80%.

Результаты сравнения друг с другом обобщенных образов признаков могут быть представлены в форме матрицы сходства (таблица 4), а также экранных форм и когнитивных диаграмм (рисунки 31 и 32):

Таблица 4 - Матрица сходства признаков: спектральных диапазонов в наиболее достоверной модели INF3 (фрагмент)

Код спектрального диапазона

Наименование спектрального диапазона (RGB)

N2

N3

N4

N5

N6

N7

N8

N9

N10

N11

1

1/35-{255,063,063}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

2

2/35-{252,084,045}

100,00

93,57

88,24

59,12

75,03

19,60

12,96

-59,70

-58,72

-70,00

3

3/35-{246,106,029}

93,57

100,00

96,91

82,07

90,50

35,54

21,69

-46,21

-65,90

-83,70

4

4/35-{236,129,016}

88,24

96,91

100,00

85,70

93,39

39,85

29,43

-47,67

-67,07

-88,35

5

5/35-{223,152,006}

59,12

82,07

85,70

100,00

94,65

52,91

32,11

-16,57

-68,68

-87,63

6

6/35-{206,174,001}

75,03

90,50

93,39

94,65

100,00

59,12

42,22

-25,73

-70,00

-91,25

7

7/35-{187,194,000}

19,60

35,54

39,85

52,91

59,12

100,00

93,13

11,52

6,53

-60,75

8

8/35-{166,212,002}

12,96

21,69

29,43

32,11

42,22

93,13

100,00

7,55

26,33

-47,40

9

9/35-{144,228,009}

-59,70

-46,21

-47,67

-16,57

-25,73

11,52

7,55

100,00

27,87

51,10

10

10/35-{121,240,020}

-58,72

-65,90

-67,07

-68,68

-70,00

6,53

26,33

27,87

100,00

56,05

11

11/35-{099,249,034}

-70,00

-83,70

-88,35

-87,63

-91,25

-60,75

-47,40

51,10

56,05

100,00

12

12/35-{077,254,051}

-70,10

-82,13

-83,45

-81,53

-85,13

-65,68

-52,49

53,56

40,60

97,03

13

13/35-{057,254,070}

-30,33

-44,88

-48,05

-52,18

-58,50

-91,20

-89,80

-16,84

-14,06

53,26

14

14/35-{039,251,091}

9,05

1,44

4,35

-7,63

-13,69

-63,51

-63,89

-69,91

-34,57

-7,52

15

15/35-{024,243,114}

-2,58

-0,66

-3,60

13,45

1,03

-46,98

-64,66

-25,98

-58,02

-9,27

16

16/35-{012,232,137}

9,05

1,44

4,35

-7,63

-13,69

-63,51

-63,89

-69,91

-34,57

-7,52

17

17/35-{004,218,159}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

18

18/35-{000,200,181}

-19,79

-31,82

-30,70

-36,68

-39,83

-87,56

-86,03

-9,11

-35,80

44,75

19

19/35-{000,181,200}

59,22

79,33

81,23

83,32

75,29

24,54

6,70

-23,55

-55,70

-66,98

20

20/35-{004,159,218}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

21

21/35-{012,137,232}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

22

22/35-{024,114,243}

-18,89

5,99

13,23

48,06

38,55

62,27

45,58

44,84

-15,37

-26,36

23

23/35-{039,091,251}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

24

24/35-{057,070,254}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

25

25/35-{077,051,254}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

26

26/35-{099,034,249}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

27

27/35-{121,020,240}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

28

28/35-{144,009,228}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

29

29/35-{166,002,212}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

30

30/35-{187,000,194}

49,58

75,26

77,17

88,74

79,71

40,38

24,78

-0,80

-48,74

-69,43

31

31/35-{206,001,174}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

32

32/35-{223,006,152}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

33

33/35-{236,016,129}

28,22

1,09

-4,31

-34,94

-16,93

-48,49

-37,45

-41,98

-20,70

20,85

34

34/35-{246,029,106}

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

35

35/35-{252,045,084}

65,72

66,30

64,35

64,59

70,77

18,81

5,56

-26,61

-74,39

-63,26

экранная форма режима кластерно-конструктивного анализа признаков (режим 4.3.2.2 системы

Рисунок 31. Экранная форма режима кластерно-конструктивного анализа признаков (режим 4.3.2.2 системы "Эйдос")

Матрица сходства может быть представлена в графической форме когнитивной диаграммы:

когнитивная диаграмма сходства-различия обобщенных образов признаков (спектральных диапазонов)

Рисунок 32. Когнитивная диаграмма сходства-различия обобщенных образов признаков (спектральных диапазонов)

Конечно линии сходства-различия спектральных диапазонов по их смыслу на рисунке 32 плохо различимы. Но этот рисунок интересен не линями связи, а тем, что спектральные диапазоны явно расположены в порядке оптического спектра и, таким образом, образуют осмысленную числовую измерительную шкалу, которая может быть использована для диагностики листьев ячменя. Видно, что весь цветовой диапазон делится на 4 основных кластера, внутри которых цвета имеют сходный смысл:

    - зеленый кластер; - фиолетовый кластер; - красный кластер; - синий кластер.

Эти 4 кластера образуют полюса 2 конструктов (полюса конструктов имеют противоположный смысл):

    - зелено-фиолетовый конструкт; - красно-синий конструкт.

Полюса конструктов имеют противоположный смысл: зеленые цвета противоположны по смыслу фиолетовым, а красные - синим.

Обратимся теперь к линиям связи, отражающим знак и величину сходства-различия спектральных диапазонов (признаков) по их смыслу.

Для уменьшения числа связей, отображаемых на когнитивной диаграмме кликнем на экранной форме, представленной на рисунке 31, на кнопке: "Вписать в окно" и на появившемся окне зададим ограничение на величину отображаемых связей: 30:

Тогда экранная форма, показанная на рисунке 31 примет вид (рисунок 33):

экранная форма режима ластерно-конструктивного анализа признаков 4.3.2.2. с фильтром по силе связей

Рисунок 33. Экранная форма режима ластерно-конструктивного анализа признаков 4.3.2.2. с фильтром по силе связей

Соответствующая когнитивная диаграмма представлена на рисунке 34:

когнитивная диаграмма сходства-различия обобщенных образов признаков (спектральных диапазонов) 4.3.2.2. с фильтром по силе связей

Рисунок 34. Когнитивная диаграмма сходства-различия обобщенных образов признаков (спектральных диапазонов) 4.3.2.2. с фильтром по силе связей

Из этой когнитивной диаграммы видно, что спектральные диапазоны группируются в два кластера, образующих противоположные по смыслу полюса конструкта:

    - зеленый кластер; - красно-оранжевый и (в меньшей степени) сине-фиолетовый кластер.

Интегральные когнитивные карты

В DOS-версии системы "Эйдос", которая развивалась до 2012 года, был режим визуализации интегральных когнитивных карт. Летом 2017 года аналогичный режим реализован и в новой версии "Эйдос-Х++". Это режим обеспечивает визуализацию Перето-подмножества выбранной модели одновременно сразу в трех видах:

    - Перето-подмножества нелокальной нейронной сети; - когнитивной диаграммы по результатам кластерно-конструктивного анализа классов (нейронов); - когнитивной диаграммы по результатам кластерно-конструктивного анализа признаков (рецепторов).

Режим задания параметров визуализации интегральной когнитивной карты аналогичен используемому при визуализации нейронных сетей (рисунок 35). Сама интегральная когнитивная карта приведена на рисунке 36.

экранная форма задания параметров визуализации

Рисунок 35. Экранная форма задания параметров визуализации

Парето-подмножество интегральной когнитивной карты (режим 4.4.12 системы "Эйдос")

Рисунок 36. Парето-подмножество интегральной когнитивной карты (режим 4.4.12 системы "Эйдос")

Когнитивные функции

Когнитивные функции - это мощный метод выявления и визуализации причинно-следственных зависимостей (Луценко Е. В., 2005). Они наглядно демонстрируют знак и степень влияния значений фактора (т. е. градаций описательной шкалы) на принадлежность моделируемого объекта к классам одной классификационной шкалы.

На рисунке 35 показана экранная форма задания параметров визуализации когнитивных функций, а на рисунках 36-38 сами когнитивные функции:

экранная форма задания параметров визуализации когнитивных функций

Рисунок 35. Экранная форма задания параметров визуализации когнитивных функций

Эта экранная форма появляется, если войти в режим 4.7. АСК-анализ изображений и кликнуть по кнопке: "Формирование облака точек".

позитивная и негативная когнитивные функции в модели inf1

Рисунок 36. Позитивная и негативная когнитивные функции в модели INF1

позитивная и негативная когнитивные функции в модели inf3

Рисунок 37. Позитивная и негативная когнитивные функции в модели INF3

позитивная и негативная когнитивные функции в модели inf4

Рисунок 38. Позитивная и негативная когнитивные функции в модели INF4

Из этих когнитивных функций мы видим, как влияет каждый цветовой диапазон на принадлежность (для позитивных функций) и на непринадлежность (для негативных функций) листа озимого ячменя с этим цветом к различным классам по степени поражения сетчатой пятнистостью.

Всю когнитивную функцию можно условно разделить на три части по характеру поведения функции:

    - красно-оранжевые цвета; - зеленые цвета; - сине-фиолетовые цвета.

Видно, что:

    - чем для красно-оранжевых цветов в листе характерна высокая степень их поражения пятнистотью; - для зеленых цветов низкая степень поражения; - для сине-фиолетовых четкой картины по степени поражения нет.

Полученные результаты в общем согласуются с экспертными оценками, но, по-видимому, указывают на недостаточный объем исходных данных и неточности в их классификации экспертами на этапе обучения системы.

Похожие статьи




Предлагаемое решение поставленной проблемы - Мобильный инструмент фитопатолога для количественной экспресс-оценки в условиях поля степени поражения листьев озимого ячменя пятнистостями на основе спектрального АСК-анализа и системы "Эйдос"

Предыдущая | Следующая