Методика оценки связи уровней популяционного здоровья и комплекса медицинских, социально-экономических и экологических факторов - Оценка качества природной среды и здоровья населения

Основное назначение данной методики состоит в изложении подходов к решению следующих двух важных задач:

    1) оценить роль различных факторов в формировании здоровья населения в регионе, 2) предложить конкретные меры, направленные на улучшение здоровья.

Решение поставленных задач может быть осуществлено на основе выборочного анализа двух групп (классов) территорий: первая группа включает территории с условно низким уровнем популяционного здоровья, вторая формируется из территорий с условно высоким уровнем здоровья населения.

Традиционный подход к решению такого рода задач состоит в оценке достоверности различий между средними значениями количественных факторов в выделенных группах или между пропорциями, отражающими долю территорий в каждой группе, имеющих тот или иной качественный признак. При этом факторы ранжируются в порядке убывания значений полученных оценок. Меры, предлагаемые при этом для улучшения здоровья населения, как правило, сводятся к соответствующему воздействию на наиболее высоко ранжированные факторы. В ряде случаев такой подход оказывается достаточно результативным. Однако он не лишен недостатков. Основным недостатком является то, что различные влияющие факторы анализируются независимо друг от друга, без учета их комплексного воздействия на здоровье людей. В рамках данного подхода, например, невозможно правильно оценить ситуацию, когда низкий уровень популяционного здоровья обусловлен не одним или несколькими достаточно мощными факторами, а многими, в отдельности слабо влияющими на здоровье населения.

С другой стороны, в случае обнаружения достоверных различий между группами по некоторым факторам аналитик не может быть уверен, что именно эти факторы в значительной мере определяют низкий уровень популяционного здоровья и что за рамками рассмотрения не осталось других важных факторов. В целом же результатом такого анализа может оказаться искаженное представление о ситуации и принятие неадекватных управленческих решений.

Более качественное решение поставленных задач возможно, на наш взгляд, лишь на основе комплексного, системного подхода к анализу данных. В связи с этим, наряду с традиционным подходом, опирающимся, в основном, на математическую статистику, представляется целесообразным воспользоваться методами распознавания образов (РО), обратившись к постановке основной задачи РО - задачи Дискриминантного анализа (называемой также задачей Обучения с учителем или задачей Обучения по прецедентам).

Под Образом, или Классом в РО обычно понимается множество всех объектов (либо явлений, процессов, ситуаций), сходных между собой в некотором фиксированном отношении. Примеры образов: множество всех больных гриппом, множество территорий Свердловской области с низким уровнем здоровья населения, соответствующее множество территорий с высоким уровнем здоровья и т. д. Распознать объект - значит указать номер или наименование образа, которому данный объект принадлежит. Распознавание объекта производится при помощи Решающего правила (дискриминантной функции), которое может быть получено на этапе Обучения, предшествующем распознаванию. Обучающая выборка - это множество объектов, которыми образы представлены при обучении, т. е. это объединение некоторых подмножеств рассматриваемых образов. Экзаменующая (проверочная) выборка - множество объектов, на которых проверяются результаты обучения.

Признак - описание того или иного свойства объекта. Признаки могут быть как количественными, так и качественными. При решении задач распознавания работают с n-мерными векторами, моделирующими реальные объекты. При этом каждая компонента моделирующего вектора представляет собой значение соответствующего признака. В геометрической интерпретации образ отождествляется с областью многомерного пространства признаков, каждая точка которой соответствует конкретной реализации этого образа.

Задача заключается в том, чтобы построить решающее правило, с помощью которого можно было бы достаточно надежно классифицировать векторы, как участвовавшие в процессе обучения, так и предъявленные впервые. Критерием качества решающего правила может служить процент правильного распознавания векторов экзаменационной выборки, включающей наблюдения, классификация которых известна, но которые не участвовали в обучении. В проверочную выборку обычно включается 10-20% от общего числа имеющихся наблюдений. Очевидно, что факт построения решающего правила, обеспечивающего достаточно высокий процент правильной классификации наблюдений (80-100%), свидетельствует о хорошей различимости классов в выбранном признаковом пространстве.

Построению решающего правила может предшествовать решение задачи анализа информативности и поиска наиболее информативных подсистем признаков. Понятие информативности в данном случае связывается с качеством решения задачи обучения. При этом задача поиска информативной подсистемы признаков состоит в выборе части признаков (из их общего числа), в пространстве которых заданные подмножества векторов из разных классов разделяются наиболее просто и экономично.

Так же, как и при использовании статистических методов, качество решения задачи обучения в значительной мере зависит от объема используемых выборок. Выборка считается достаточно представительной, если число векторов в обучающей выборке каждого класса по крайней мере в 5-10 раз превосходит число существенных признаков. Окончательный же вывод относительно качества решения задачи обучения может быть сделан лишь после проведения процедуры экзамена. Таким образом, доля правильно классифицированных векторов (или, наоборот, доля допущенных ошибок классификации) из экзаменационной выборки является окончательным критерием информативности выбранной системы признаков и репрезентативности обучающих выборок.

Хотя при решении задач дискриминантного анализа на основе детерминистских (т. е. не использующих каких-либо предположений о статистических свойствах образов) подходов интервальные оценки показателей качества разделения классов используются редко, тем не менее возможность их расчета существует. Поскольку при случайном выборе векторов для экзамена распределение вероятностей ошибочных классификаций подчиняется биномиальному закону [4], то для оценки доверительного интервала истинного уровня ошибки классификатора можно воспользоваться классической схемой независимых статистических испытаний Бернулли. Алгоритм построения интервала описан в литературе по математической статистике. В [3] этот алгоритм используется для оценки выводов, основанных на одной пропорции, В [4] приводятся графики для оценки доверительных интервалов вероятности ошибочной классификации, построенные на основе схемы Бернулли. С помощью данного алгоритма могут быть получены оценки для размера экзаменационной выборки. Исходной информацией для этого являются уровень значимости и ожидаемая доля ошибок классификации на экзамене.

Возвращаясь к сформулированным в начале раздела задачам, можно предложить следующую схему их решения с использованием методов распознавания образов.

    1. Выбор перечней территорий и лет наблюдений для анализа. С целью обеспечения представительности обучающих выборок для задачи дискриминантного анализа следует использовать информацию о показателях здоровья и окружающей среды на территориях региона за несколько (5-10) последних лет. Соответственно условимся под анализируемой территорией, или наблюдением понимать вектор числовой информации о конкретной территории за конкретный год, т. е. объектом анализа является не просто "территория", а "территория в таком-то году". При оценке объемов выборок следует исходить из приведенных выше рекомендаций. 2. Ранжирование и классификация наблюдений. Координатами информационных векторов в этой задаче являются значения показателей, приведенных в Приложении 1. 3. Выбор классов наблюдений. Число классов анализируемых территорий не должно быть большим, поскольку в противном случае сложно будет обеспечить представительность обучающих выборок. Обычно при анализе используется разбиение на три или даже на два класса. Для формирования выборок следует воспользоваться результатами ранжирования и классификации, выполненными по первой методике. При относительно малом числе наблюдений рекомендуется работать с двумя классами, включив в первый из них территории из первой половины ранжированного списка, а во второй - территории из второй половины. Часть территорий из середины списка (примерно 1/5-ю часть) следует исключить из рассмотрения. Делается это для повышения различимости классов. Поскольку выделенным группам территорий приписывается смысл классов территорий с "условно хорошим" и "условно плохим" популяционным здоровьем, то целесообразность исключения середины списка становится очевидной. 4. Выбор перечня анализируемых средовых факторов и формирование информационного массива дли дискриминантного анализа. Информационный массив для дискриминантного анализа представляет собой двумерную таблицу, строки которой соответствуют выбранным наблюдениям, а столбцы содержат значения показателей, влияние которых на популяционное здоровье необходимо оценить. 5. Оценка достаточности всего избранного комплекса средовых факторов и/или входящих в него субкомплексов для надежного описания различий между объектами выделенных классов. Задача решается методами дискриминантного анализа в соответствии с приведенной выше постановкой. В процессе решения задачи производится оценка информативности признаков и характера их связи с уровнем популяционного здоровья. В случае хорошей разделимости классов производится построение решающих правил. 6. Моделирование процессов управления популяционным здоровьем на основе решающих правил. Решающие правила, получающиеся при решении задач дискриминантного анализа, представляет собой модели разделения двух или большего числа классов наблюдений в заданном признаковом пространстве и могут быть использованы при моделировании результатов управляющих воздействий. Решение задачи моделирования позволяет получать ответы на вопросы типа "что будет, если... ?" Суть задачи состоит в следующем. Берется наблюдение, классификация которого (например, принадлежность к классам "хорошее популяционное здоровье" или "плохое популяционное здоровье") известна, значение одного или нескольких признаков корректируются, и это, скорректированное наблюдение классифицируется с помощью решающего правила. Особый интерес при этом представляют ситуации перехода скорректированных наблюдений в другой класс.

Другим вариантом использования решающих правил является поиск оптимальных управляющих воздействий, обеспечивающих заданную классификацию наблюдений. Задача состоит в том, чтобы найти минимальную коррекцию классифицируемого вектора (наблюдения), обеспечивающую его переход в заданный класс (при работе с двумя классами - в противоположный класс). Применительно к проблеме управления популяционным здоровьем представляет интерес такая постановка задачи: какие минимальные изменения средовых факторов, описывающих ситуацию на территории N, классифицируемой как территория с плохим популяционным здоровьем, следует произвести, чтобы эта территория классифицировалась иначе? Естественно, что требования к качеству модели и анализируемых данных должны быть при этом весьма высокими.

Как уже отмечалось, для использования данной методики требуются определенные навыки владения математическими методами распознавания образов и наличие соответствующих программных средств. Одним из таких программных средств является пакет КВАЗАР [10].

Перечень показателей, рекомендуемых для использования при анализе популяционного здоровья населения.

Показатели смертности:

    1. Общая смертность 2. Младенческая смертность 3. Смертность в трудоспособном возрасте.

Показатели заболеваемости взрослых:

    4. Инфекционные и паразитарные болезни (болезненность) 5. Инфекционные и паразитарные болезни (заболеваемость) 6. Новообразования (болезненность) 7. Новообразования (заболеваемость) 8. Болезни эндокринной системы (болезненность) 9. Болезни эндокринной системы (заболеваемость) 10. Болезни крови и кроветворных органов (болезненность) 11. Болезни крови и кроветворных органов (заболеваемость) 12. Психические расстройства (болезненность) 13. Психические расстройства (заболеваемость) 14. Болезни нервной системы и органов чувств (болезненность) 15. Болезни нервной системы и органов чувств (заболеваемость) 16. Болезни системы кровообращения (болезненность) 17. Болезни системы кровообращения (заболеваемость) 18. Болезни органов дыхания (болезненность) 19. Болезни органов дыхания (заболеваемость) 20. Болезни органов пищеварения (болезненность) 21. Болезни органов пищеварения (заболеваемость) 22. Болезни мочеполовых органов (болезненность) 23. Болезни мочеполовых органов (заболеваемость) 24. Болезни кожи и подкожной клетчатки (болезненность) 25. Болезни кожи и подкожной клетчатки (заболеваемость) 26. Болезни костно-мышечной системы и соед. тканей (бол.) 27. Болезни костно-мышечной системы и соед. тканей (забол.) 28. Врожденные аномалии (болезненность) 29. Врожденный аномалии (заболеваемость) 30. Несчастные случаи, отравления, травмы (болезненность) 31. Несчастные случаи, отравления, травмы (заболеваемость) Показатели заболеваемости детей: 32. Инфекционные и паразитарные болезни (болезненность) 33. Инфекционные и паразитарные болезни (заболеваемость) 34. Новообразования (болезненность) 35. Новообразования (заболеваемость) 36. Болезни эндокринной системы (болезненность) 37. Болезни эндокринной системы (заболеваемость) 38. Болезни крови и кроветворных органов (болезненность) 39. Болезни крови и кроветворных органов (заболеваемость) 40. Психические расстройства (болезненность) 41. Психические расстройства (заболеваемость) 42. Болезни нервной системы и органов чувств (болезненность) 43. Болезни нервной системы и органов чувств (заболеваемость) 44. Болезни системы кровообращения (болезненность) 45. Болезни системы кровообращения (заболеваемость) 46. Болезни органов дыхания (болезненность) 47. Болезни органов дыхания (заболеваемость) 48. Болезни органов пищеварения (болезненность) 49. Болезни органов пищеварения (заболеваемость) 50. Болезни мочеполовых органов (болезненность) 51. Болезни мочеполовых органов (заболеваемость) 52. Болезни кожи и подкожной клетчатки (болезненность) 53. Болезни кожи и подкожной клетчатки (заболеваемость) 54. Болезни костно-мышечной системы и соед. тканей (болезненность) 55. Болезни костно-мышечной системы и соед. тканей (заболеваемость) 56. Врожденные аномалии (болезненность) 57. Врожденные аномалии (заболеваемость) 58. Несчастные случаи, отравления, травмы (болезненность) 59. Несчастные случаи, отравления, травмы (заболеваемость)

Показатели нарушений репродуктивной функции:

    60. Болезни системы кровообращения у беременных 61. Анемии у беременных 62. Поздний токсикоз у беременных 63. Мертворождаемость 64. Показатели недоношенности 65. Болезни мочеполовой системы

Перечень факторов, которые рекомендуется учитывать при анализе влияния окружающей среды на здоровье населения

Показатели, характеризующие уровень медицинского обслуживания:

    1. Обеспеченность врачами (всего) на 10000 чел. 2. Обеспеченность врачами терапевтического профиля на 10000 чел. 3. Обеспеченность инфекционистами на 10000 чел. 4. Обеспеченность хирургами на 10000 чел. 5. Обеспеченность акушерами-гинекологами на 10000 чел. 6. Обеспеченность педиатрами на 10000 чел. 7. Обеспеченность психиатрами (включая наркологов) на 10000 чел. 8. Удельный вес аттестованных врачей основных профилей (%) 9. Укомплектованность врачами (%) 10. Обеспеченность средними мед. работниками на 10000 чел. 11. Удельный вес аттестованных средних мед. работников (%) 12. Укомплектованность средними медработниками 13. Обеспеченность больничными койками на 10000 чел. 14. Мощность поликлиник

Социально-экономические показатели:

    1. Протяженность дорог с твердым покрытием на 100 кв. км 2. Удельный вес дорог с твердым покрытием (%) 3. Обеспеченность жильем (кв. м.чел) 4. Уд. вес квартир, оборудованных водопроводом 5. Уд. вес квартир, оборудованных канализацией 6. Уд. вес квартир, оборудованных горячей водой 7. Уд. вес квартир, оборудованных центральным отоплением 8. Число квартирных телефонов на 1000 чел. 9. Розничный товарооборот на душу активного населения (млрд. руб) 10. Уровень безработицы (в % от активной части населения) 11. Зарегистрировано преступлений на душу населения (на 1000 чел.) 12. Задолженность по выдаче заработной платы на дущу населения (млн. руб) 13. Объем промышленной продукции на душу населения (млрд.) 14. Ввод жилых домов (кв. м общей площади на чел.) 15. Индекс физического объема промышленного производства 16. Среднемесячный доход (рабочие промышленности)

Санитарно-гигиенические показатели:

    1. Доля неуд. проб атмосферного воздуха (%) 2. Доля неуд. проб питьевой воды по санитарно-химическим показателям (%) 3. Доля неуд. проб питьевой воды на микробиологическим показателям (%) 4. Доля неуд. проб почвы на наличие солей тяжелых металлов (%) 5. Доля неуд. проб почвы по санитарно-химическим показателям(%) 6. Доля неуд. проб продуктов питания по санитарно-химическим показателям (%). 7. Доля неуд. проб продуктов питания по микробиологическим показателям(%) 8. Доля неуд. проб молочных продуктов по хим. показателям (%) 9. Комплексный показатель загрязненности воды (органолептический) 10. Комплексный показатель загрязненности воды (санитарно-токсикологический). 11. Комплексный показатель загрязненности воды (эпидемиологический) 12. Эффективная годовая доза облучения 13. Средняя концентрация пыли в атмосферном воздухе. 14. Средняя концентрация СО в атмосферном воздухе 15. Средняя концентрация NОх в атмосферном воздухе 16. Средняя концентрация SОх в атмосферном воздухе 17. Агрегатный показатель загрязнения атмосферного воздуха 18. Индекс загрязнения атмосферы

Похожие статьи




Методика оценки связи уровней популяционного здоровья и комплекса медицинских, социально-экономических и экологических факторов - Оценка качества природной среды и здоровья населения

Предыдущая | Следующая