Биотехнические аспекты анализа информации - Научные основы приборостроение в медицине

В последние годы вопросы автоматизации управления состоянием биологических объектов, включая процесс лечения пациентов, а также тесно связанные с ними процессы диагностики и прогнозирования состояния приобретают все большую значимость. Однако отмеченные в главе 2 первого раздела особенности биологического объекта как объекта исследования затрудняют применение строгих математических методов для реализации соответствующих программ. В отличие от строго детерминированных технических объектов для живых организмов характерны многочисленность входов и отсутствие четких взаимнооднозначных зависимостей между воздействиями и реакциями, принципиальная невозможность получения полного описания диагностируемого объекта и ограниченность диагностической информации и т. д. Сколь сложной ни была бы техническая система, однако при выборе показателей (первичных признаков), описывающих ее поведение и состояние, при формировании обучающих выборок, определении уровней классификации и подготовке другой априорной информации, необходимой для автоматической диагностики, всегда можно опираться на точное знание структуры и функциональных возможностей объекта, созданного человеком, и заранее предусмотреть вывод всей необходимой для диагностики информации. При решении аналогичных вопросов медицинской и биологической диагностики наши знания об исследуемом объекте базируются на текущем уровне биологических наук и методов экспериментальных исследований. Кроме того, резко выраженная индивидуальность, значительная изменчивость значений параметров как в норме, так и в патологии не только для одного и того же вида биологических объектов, но и для индивидуального организма в зависимости от внешних условий, приводят к сильному пересечению признаков, характеризующих состояние, к усложнению процедур формирования обучающих выборок, к снижению эффективности использования в диагностических целях статистических данных при диагностике конкретного объекта. Специфичны также формы представления многих признаков и методов анализа информации врачом-исследователем. Вычислительное устройство при анализе данных оперирует числовыми или машинными лингвистическими признаками и осуществляет строго формализованную математическую обработку экспериментального материала.

Диагностика состояния биообъекта человеком часто основывается на качественных, трудно формализуемых признаках, широко используются данные косвенных измерений. Такая диагностика включает в себя неформальный поиск взаимосвязей между признаками или поиск вторичных, свойственных для специфического мышления врача и исследователя, признаков. При такой, во многом эвристической, форме постановки диагноза естественным является отбрасывание некоторых данных, построение гипотез, выбор альтернативных путей исследования и другие неформальные действия, учитывающие профессиональную подготовку, опыт и психофизиологическое состояние врача-исследователя. Эта особенность диагностики состояния биологического объекта проявляется в желании исследователя контролировать промежуточные результаты на любом этапе анализа и, по возможности, учитывать их при отработке стратегии дальнейшего исследования.

Характерной особенностью медико-биологической диагностики является также отсутствие формализованного описания диагностируемых классов заболеваний, состояний биообъекта, что приводит к существенным отличиям методов анализа биомедицинской информации от анализа технических данных. Многие исследователи отмечают что основная трудность проведения автоматического анализа экспериментальной информации независимо от способов ее получения состоит в выборе параметров для описания исходных наблюдений, методов их упорядочения и получения оценок распределения. При этом точность таких оценок, их устойчивость и прогностическая эффективность в значительной мере зависят от того, по отношению к какому множеству данных эти оценки получены. Особенно явно эта трудность проявляется в тех случаях, когда анализу подвергаются данные, описывающие функционирование сложных недетерминированных систем, многомерные данные медико-биологических, социально-экономических и т. д. исследований, для которых выбор информативных признаков и построение решающих правил производится по отношению к однородным группам (классам) наблюдений, определенных экспертным путем. Дополнительные сложности возникают еще и потому, что суждения чаще всего формируются на основе относительно малых по величине и неполно представленных обучающих выборок, причем дополнить выборки отсутствующими данными не представляется возможным из-за условий проведения исследования. Это исключает использование методов параметрической статистики для проверки однородности обучающих выборок и ограничивает применение известных методов группировки данных, таких, как параметрические методы таксономии и кластер-анализа. Решение указанных выше задач возможно при организации особого автоматизированного процесса анализа экспериментальной информации, основанного на текущем пооперационном взаимодействии (диалоге) исследователя с измерительными системами, ЭВМ или специализированными вычислителями. Так как такое взаимодействие может осуществляться на любом шаге измерительных и вычислительных процедур, как бы внутри цикла обработки информации, то такой диалоговый режим исследования называют интерактивным анализом экспериментальных данных. Включение в процедуры анализа эвристических операций, выполняемых человеком и связанных с восприятием исходной информации и промежуточных например результатов, их осмыслением и разработкой стратегии дальнейшего анализа, определяет специфические особенности этого режима анализа и выдвигает ряд требований к построению системы анализа.

В то же время в пользу интерактивного режима анализа экспериментальной информации можно привести следующие соображения:

    1) В настоящее время у большинства исследователей сложилось мнение, что ни статистический подход, ни методы формальной лингвистики и эвристического программирования, ни другие методы, предложенные для решения задачи распознавания образов, взятые в отдельности, не могут рассматриваться как универсальные для широких практических задач. Нет модели, которая была бы адекватна всем задачам распознавания образов, а следовательно, и нет пригодного для этих задач "всеобщего" метода. Реально существуют совокупность задач анализа данных и совокупность методов их решения. 2) Сложность и неоднозначность принятия решения, отсутствие точных алгоритмов управления процессом обработки данных и выработки решений большой объем самих исходных данных, описывающих состояние исследуемой системы, ограничивают возможность автоматической обработки, делают невозможным ее проведение без активного участия человека. 3) При изучении экспериментальных данных в самых сложных случаях лучшим, как известно, является путь проб и последующих оценок. При этом необходима обратная связь между выбором признаков и построением решающих правил, с одной стороны, и результатами экспериментальной проверки, с другой. Такая связь реально позволяет осуществлять коррекцию программы в зависимости от результатов анализа и, следовательно, повышает надежность анализа. Естественной возможностью осуществления этой обратной связи является организация диалога человека с ЭВМ. Исследователь не может априорно составить полную программу исследований и сбора первичной информации таким образом, чтобы учесть все возможные варианты. В то же время при осуществлении интерактивного режима анализа эта программа может легко корректироваться прямо по ходу исследования. Правда, для такого вмешательства в вычислительную процедуру необходимо специальное математическое обеспечение. 4) Интерактивный подход к анализу экспериментальной информации становится желательным всякий раз, когда исследователь сталкивается с большим объемом экспериментальных данных, аналитические и статистические свойства которых должны быть изучены в реальном масштабе времени. Особенно это касается анализа структуры данных в многомерном пространстве признаков, а также анализа информационных копий совокупности изучаемых событий и ситуаций, по которым необходимо принимать определенные решения. 5) Во многих задачах распознавания образов человеку следует предоставить руководящую роль в интерпретации экспериментальных данных, в суждении, прогнозе, выработке управляющих команд, что возможно только в интерактивной системе обработки информации. В процессе непрерывного диалогового взаимодействия со своим автоматическим "помощником" исследователь может, наряду с построением решающих правил, классификацией множества данных, выбором информативных показателей, осуществлять также формирование банков данных, подготавливать пакетные режимы анализа, производить оценку их эффективности. Для успешной работы такого своеобразного, "гибридного" интеллекта интервал времени между моментами задания вопроса ЭВМ и получения ответа от нее должен быть достаточно малым, чтобы не прерывать ход мыслей человека. 6) Одной из основных концепций мышления человека при принятии решения является концепция направленного поиска, суть которой заключена в следующих актах: ? генерирование разнообразия: по результатам промежуточных вычислений выдвижение возможных шагов в дальнейшем ходе решения задачи; ? ограничение разнообразия: оценка возможных путей решения для скорейшего достижения целей или с точки зрения их дальнейшей перспективы. Последовательное чередование этих актов происходит непрерывно, при этом оценка ценности полученных промежуточных результатов экспертом осуществляется в результате знания некоторых закономерностей, законов, личного опыта, а также построения ветвящейся, иерархической системы решений, что позволяет ему в процессе анализа подтверждать или отвергать сформулированные ранее гипотезы и предложения. Наиболее полно эти возможности реализуются в интерактивном режиме анализа. 7) Известно, что человек имеет несомненные преимущества перед автоматическими устройствами и ЭВМ при распознавании некоторых типов структур. Особенно это касается структур типа "скоплений". Наиболее явно эти преимущества проявляются при выделении однородных групп. Алгоритмы автоматической классификации выполняют неправильное разбиение исходного множества объектов на группы при наличии между ними случайных пятен помех, отдельных точек, "перемычек" и "мостов", соединяющих скопления друг с другом. В то же время человек, наблюдая взаимное расположение объектов, хорошо справляется с задачей классификации подобных множеств, правда, в тех случаях, когда размерность пространства описания не превышает трех. 8) Процесс получения экспериментальной информации всегда сопровождается искажениями, вызываемыми шумами и помехами, которые легко сбивают алгоритмы автоматической классификации и идентификации. Эти искажения ограничивают также и возможности человека при самостоятельном анализе данных. Объединение человека и ЭВМ в диалоговой системе ведет к решению многих проблем. При этом в такой системе должны быть предусмотрены операции и средства очищения информации - своеобразная "предподготовка" этой информации до ее предъявления человеку. Алфавит таких операций зависит от свойств, объема и качества исходных данных. Таким образом, для эффективного функционирования человека в автоматизированной системе анализа экспериментальных данных, для которой предусматривается интерактивный режим работы, вне зависимости от задачи, решаемой исследователем: построение решающих правил, выбор и измерение информативных признаков, минимизация описаний и т. д., - устройства отображения должны обеспечивать единую форму представления текущей и конечной информации в виде графических отображений, адекватных восприятию человека и удобных для однозначного толкования полученных результатов. Например, для загрузки зрительного анализатора человека такой адекватной формой представления является изображение - график, символ, цифро-буквенный формуляр, мнемосхема, скопление точек, картина, сцена и т. д.. Математическое обеспечение интерактивного режима анализа данных, наряду с фондированием отображения исследуемой информации на дисплеях и видеоконтрольных приборах терминальных устройств, должно обеспечивать с единых математических и алгоритмических позиций возможность решения всех основных типов задач обработки экспериментальных данных.

Похожие статьи




Биотехнические аспекты анализа информации - Научные основы приборостроение в медицине

Предыдущая | Следующая