Методика оценки количества различных видов информации - Методика проведения контент-анализа школьных учебников физики и его результаты

Для определения количества эмпирической, теоретической, математической и общенаучной информации в учебном тексте нами использовалась методика контент-анализа, изложенная в книге [1]. Были выбраны исчерпывающие и взаимоисключающие критерии, сформулировано правило для надежного фиксирования нужных характеристик текста так, чтобы получающиеся результаты не зависели от эксперта, имели высокую повторяемость и отражали объективные характеристики текста. Чтобы оценить количество информации в рисунках и формулах они заменялись максимально короткими предложениями, которые полно передают заключенную в них учебную информацию. Речь идет о полезной информации, необходимой для усвоения соответствующего параграфа учебника (ненужная информация, содержащаяся в рисунках не учитывается).

Нами в среде Free Pascal создана специальная программа Analyzer, которая, используя словарь-тезаурус, подсчитывает частоты упоминания различных физических и математических терминов в текстовом файле. Методика контент-анализа текста состоит из следующих этапов: 1. Определяют сложность и количество "формульной" информации путем подсчета числа математических символов в тексте и формулах. 2. Заменяют рисунки краткими описаниями, содержащими информацию об изображенных на рисунках физических и математических объектах. 3. Создают текстовый файл в формате data. txt, содержащий анализируемый текст с описаниями рисунков без формул. 4. Составляют список физических математических и общенаучных терминов, встречающихся в данном тексте. 5. Создают словарь-тезаурус текста, содержащий общие части однокоренных терминов (например, слова дифракция, дифрагировать, дифракционный -- общая часть "дифра"), который сохраняют в файле slovar. txt. 6. Каждый термин относят к одному из классов "эмпирический", "теоретический", "математический", "общенаучный", и оценивают его сложность S; результаты записывают в файл slovar. txt. 7. Запускают программу Analyzer, которая обращаясь к файлу slovar. txt, анализирует текст, хранящийся в файле text. txt, а результаты записывает в файл result. txt. Также создается профиль текста, состоящий из вектора наиболее часто встречающихся слов и вектора частот. 8. Интерпретируют результаты, создают таблицы, строят гистограммы и т. д.

В нашем случае единицей измерения объема информации является слово или одно упоминание термина. Так как в русском языке средняя длина слова 6,3 буквы (включая пробел), то для нахождения суммарного числа слов N (объема информации в тексте I) достаточно общее количество букв разделить на 6,3.

Похожие статьи




Методика оценки количества различных видов информации - Методика проведения контент-анализа школьных учебников физики и его результаты

Предыдущая | Следующая