Построение выборки и сбор данных - Распространение новостной информации

Выборка состоит из корпуса текстов, размещенных в социальной сети Twitter с апреля по май 2014 года, относительно исследуемых информационных поводов. Совокупный объем собранных упоминаний равен 2749 сообщений.

Первый этап: отбор кейсов.

В первую очередь были отобраны ложные новости, опубликованные в апреле-мае 2014 года в социальной сети Twitter.

Критерием для отбора таких информационных поводов стало наличие официального опровержения. Данный критерий был выбран для обеспечения надежности результатов. Реальные новости были отобраны так, чтобы обеспечить максимально возможное единое основание для сравнения. Например, в выборку вошли 2 ложные новости политической направленности, следовательно, были выбраны 2 новости относительно политических событий. При этом, учитывалось также и количество сообщений. Конечно, невозможно было найти такую реальную новость, упоминания по которой были бы равны числу упоминаний по ложной новости. Поэтому реальные новости отбирались с числом упоминаний максимально приближенных к количеству сообщений о ложной новости.

Второй этап: вычленение единицы анализа, сбор текстов.

Данный этап непосредственно связан с работой в системе мониторинга социальных сетей. В исследовании использовалось программное обеспечение компании Вобот. Необходимо было собрать отдельно 6 массивов данных с текстами по каждой исследуемой новости (реальной и ложной).

Перед непосредственным сбором данных необходимо задать поисковый запрос, являющийся единицей счета. Приведем пример, вычленения единицей анализа и процесса подготовки к сбору данных, основанный на материалах, использованных в данном исследовании.

Реальная новость, заголовок: "Министр обороны: Италия может направить миротворцев на Украину".

Так как разные новостные агентства могут немного видоизменять заголовок, то поиск точного совпадения слов с исходным заголовком неэффективен. Необходимо обеспечить попадание максимально большего количества сообщений, относящихся к данной новости. Следовательно, заголовок разделялся на ключевые слова:

Министр обороны: Италия может направить миротворцев на Украину

Таким образом, поисковый запрос выглядел так: Италия &; миротворцы &; Украина. Символ "&;" обозначает поиск совпадений внутри всего текста сообщения в любом порядке, независимо от склонения слов и регистра букв.

Более того, поиск осуществлялся в заданный период времени (апрель-май 2014 года), что исключало попадание неактуальных новостей. Так же из выборки были исключены упоминания, не относящиеся к исследуемой новости.

Похожие статьи




Построение выборки и сбор данных - Распространение новостной информации

Предыдущая | Следующая