Достоверность результатов исследований - Оценка методологического качества клинических исследований

Всякие исследования, исходя из надежности и достоверности полученных результатов и их применимости в клинической практике, характеризуются с двух позиций - достоверности (внутренней валидности) и обобщаемости (внешней валидности, применимости).

Случайная ошибка - Возникает из-за отклонения результата отдельного наблюдения или измерения от его истинного значения, что обуславливается случайностью. Случайные вариации проявляются на любом этапе исследования и связаны с индивидуальной вариабельностью биологических свойств изучаемых людей или животных, случайными ошибками измерения и недостаточным объемом выборки.

В отличие от систематических ошибок случайные ошибки нельзя устранить, но можно свести к минимуму. Этого достигают правильным планированием исследования, увеличением числа пациентов в исследовании, повторением измерений несколько раз, и, кроме того, путем оценки вероятности случайной ошибки с использованием статистических методов. Именно минимизация случайных ошибок является одной из главных задач статистического анализа результатов, полученных в медико-биологических исследованиях.

В тех случаях, когда обнаруживаются систематические ошибки разных типов при формировании выборок, создается так называемая смещенная (нерепрезентативная) выборка. Эта выборка систематическим образом отличается от популяции, представляющей объект исследования, или от популяции, по отношению к которой должны применяться результаты исследования.

Достоверность (внутренняя валидность) Результатов исследования определяется тем, насколько структура исследования соответствует поставленным задачам, и в какой степени полученные данные справедливы в отношении изучавшейся выборки. Исходя из этого, достоверным нужно считать исследование, в котором возможность возникновения систематических и случайных ошибок сведена к минимуму.

Используемый обычно Уровень статистической значимости (величина р) отражает вероятность справедливости гипотезы об отсутствии статистически значимых различий в оцениваемых эффектах. Если в результате статистического сравнения экспериментальной и контрольной групп установлено значение р < 0,05, то вероятность различий, возникших вследствие случайности, составляет не более 5%. Различия между величинами, имеющими такую вероятность ошибки, считаются Статистически значимыми.

При проведении КИ обычно используют следующие общепринятые критерии оценки значения р:

Р > 0,05 - статистически не значимое различие;

Р < 0,05 - статистически значимое различие;

Р <0,01 - статистически высоко значимое различие.

Например, если относительный риск (ОР, отношение вероятности неблагоприятного исхода в группе вмешательства к вероятности его в группе контроля) составляет 0,8 при р<0,05, то такое различие между группами статистически значимо.

Диапазон, в пределах которого может лежать истинное значение показателя в популяции, из которой сформирована выборка данного исследования, называется Доверительный интервал (ДИ, confidence interval, CI). Он рассчитывается для сравнения величины эффекта, оценки степени эквивалентности двух вмешательств, которые характеризуют диапазон изменений параметра в пределах границ погрешностей определений, мер статистической связи. Обычно при этом указывают границы, в пределах которых истинный эффект находится с вероятностью 95% (95-процентные границы доверительного интервала). Например, в приведенном выше примере точечная оценка составляет 0,8, а 95% ДИ может быть 0,6 - 0,99. Потенциально клинически значимый эффект - снижение частоты неблагоприятного исхода, например, флеботромбоза, на 20% - может оказываться при таком представлении результатов исследования не очень убедительным, ведь его величина может составлять только 2-3%.

Оценка статистической значимости и ДИ относятся только к случайной ошибке. Систематическая ошибка возникает в результате погрешностей дизайна и анализа данных исследования и обычно не может быть оценена статистическими средствами.

Именно достоверностью результатов исследования определяется его ценность. В КЭ разработаны рекомендации об оптимальных вариантах структуры исследований, проводимых для решения различных задач, которые ставятся исследователями. Следует отметить, что в нижеследующей таблице приведены типы исследований, оптимальные для того или иного случая, однако на практике допускаются отступления от указанной схемы, прежде всего потому, что в ряде случаев "оптимальный" дизайн недоступен. Например, применительно к редким болезням невозможны РКИ, а применительно к вредным воздействиям невозможны РКИ и ограничены когортные исследования. Следует критически относится к результатам исследования, структура которого не соответствует его задаче.

Обобщаемость (внешняя валидность) - степень, в какой результаты данного исследования применимы к другим группам больных, например, другого пола, популяции и т. п. Поскольку существует представление об общих свойствах больных одной болезнью, возможности лечить их сходными средствами, считается возможным проводить исследование на ограниченной группе больных, а затем на основании результатов исследования лечить подобных больных.

Таблица 1. Основные варианты оптимальной структуры исследования в зависимости от его задачи

Задача исследования

Структура исследования

Исследование метода диагностики

Одномоментное

Исследование распространенности заболевания

Одномоментное

Исследование частоты возникновения новых случаев заболеваний, исходов и т. д.

Когортное

Исследование факторов риска

Когортное, "случай - контроль"

Исследование прогностических факторов

Когортное

Исследование методов лечения и профилактики

РКИ

Исследование причинно-следственных связей

Когортное, "случай - контроль"

Иными словами, допускается обоснованность того, что испытуемые, включенные в исследование, сравнимы с другими, подобными им. При этом структура научного исследования подразумевает, что участники исследования соответствуют пациентам, которых предполагается лечить с учетом результатов исследования. Например, участников выбирают из исследуемой случайным образом. На практике выполнить это сложно, например, поскольку в исследование могут включать новых, еще не лечившихся больных, а у врача находятся на лечении в основном пациенты, болеющие уже много лет. Поэтому в большинстве случаев для повышения обобщаемости результатов стремятся к тому, чтобы выборка была хотя бы репрезентативна, т. е. соответствовала по основным характеристикам исследуемой популяции. Для этого следовало бы избегать работы с группами, значительно отличающимися от общей популяции. Однако, производители лекарственных средств могут специально проводить исследования таким образом, чтобы наиболее ярко продемонстрировать эффективность своего ЛС, например, подбирая пациентов с особенными характеристиками. В результате, часть вполне доброкачественных исследований имеют низкую обобщаемость.

С целью повышения обобщаемости применяются также многоцентровые исследования с включением больных из разных географических регионов, т. е. выборка оказывается репрезентативной по отношению к более широкой географической зоне. Поэтому результаты этих исследований могут затем более обоснованно применяться в отношении населения этой зоны.

При критическом чтении следует обязательно оценить репрезентативность описываемой в статье выборки.

Обычно качество обобщаемости результатов исследования достигается сведением к минимуму систематических ошибок.

Похожие статьи




Достоверность результатов исследований - Оценка методологического качества клинических исследований

Предыдущая | Следующая