Построение выборки и сбор данных - Распространение новостной информации

Выборка состоит из корпуса текстов, размещенных в социальной сети Twitter с апреля по май 2014 года, относительно исследуемых информационных поводов. Совокупный объем собранных упоминаний равен 2749 сообщений.

Первый этап: отбор кейсов.

В первую очередь были отобраны ложные новости, опубликованные в апреле-мае 2014 года в социальной сети Twitter.

Критерием для отбора таких информационных поводов стало наличие официального опровержения. Данный критерий был выбран для обеспечения надежности результатов. Реальные новости были отобраны так, чтобы обеспечить максимально возможное единое основание для сравнения. Например, в выборку вошли 2 ложные новости политической направленности, следовательно, были выбраны 2 новости относительно политических событий. При этом, учитывалось также и количество сообщений. Конечно, невозможно было найти такую реальную новость, упоминания по которой были бы равны числу упоминаний по ложной новости. Поэтому реальные новости отбирались с числом упоминаний максимально приближенных к количеству сообщений о ложной новости.

Второй этап: вычленение единицы анализа, сбор текстов.

Данный этап непосредственно связан с работой в системе мониторинга социальных сетей. В исследовании использовалось программное обеспечение компании Вобот. Необходимо было собрать отдельно 6 массивов данных с текстами по каждой исследуемой новости (реальной и ложной).

Перед непосредственным сбором данных необходимо задать поисковый запрос, являющийся единицей счета. Приведем пример, вычленения единицей анализа и процесса подготовки к сбору данных, основанный на материалах, использованных в данном исследовании.

Реальная новость, заголовок: "Министр обороны: Италия может направить миротворцев на Украину".

Так как разные новостные агентства могут немного видоизменять заголовок, то поиск точного совпадения слов с исходным заголовком неэффективен. Необходимо обеспечить попадание максимально большего количества сообщений, относящихся к данной новости. Следовательно, заголовок разделялся на ключевые слова:

Министр обороны: Италия может направить миротворцев на Украину

Таким образом, поисковый запрос выглядел так: Италия &; миротворцы &; Украина. Символ "&;" обозначает поиск совпадений внутри всего текста сообщения в любом порядке, независимо от склонения слов и регистра букв.

Более того, поиск осуществлялся в заданный период времени (апрель-май 2014 года), что исключало попадание неактуальных новостей. Так же из выборки были исключены упоминания, не относящиеся к исследуемой новости.

Похожие статьи

ОПИСАНИЕ РАБОТЫ С СИСТЕМОЙ МОНИТОРИНГА СОЦИАЛЬНЫХ СЕТЕЙ В КАЧЕСТВЕ МЕТОДА СБОРА ДАННЫХ - Распространение новостной информации

Система мониторинга социальных сетей предоставляет исследователю возможность собрать интересующие его упоминания в социальных сетях по какой-либо...
Введение - Распространение новостной информации

На сегодняшний день внимание многих ученых, работающих в различных научных сферах, сосредоточено вокруг Интернет исследований. Особенно актуальными...
Процедура анализа текстов: соотнесение с классическим контент-анализом - Распространение новостной информации

В зависимости от целей исследования уже на этапе очищения базы от нерелевантных сообщений исследователь может провести процедуру тегирования...
ОБОСНОВАНИЕ ПОНЯТИЯ "ЛОЖНАЯ НОВОСТЬ" - Распространение новостной информации

В рамках данного исследования такая задача необходима в силу нескольких причин. Во-первых, для теоретического обоснования использования термина, а,...
Онлайн исследования в социологии: новые методы анализа данных - Распространение новостной информации

На сегодняшний день анализ социальных сетей и медиа, Интернет-сообществ, пользователей в целом используется в основном в маркетинге. Компания может...
Эпоха Больших данных: начало перехода к новому понимаю данных - Распространение новостной информации

Современные технологии позволили перейти к качественно новому пониманию данных, информации и возможностей ее анализа. В виртуальном мире ежесекундно...
Анализ двух кейсов: подробное рассмотрение ключевых характеристик сети на примере политических новостей - Распространение новостной информации

Кейс 1. Реальная новость: "Министр обороны: Италия может направить миротворцев на Украину" Описательная статистика Общее количество упоминаний по всем...
Смешанные методы: совмещение автоматизированных и неавтоматизированных методов - Распространение новостной информации

Они во многом объединяют или дополняют два вышеперечисленных метода :автоматический и неавтоматический. Это контент-анализ, Интернет-опросы и...
ЗАКЛЮЧЕНИЕ - Распространение новостной информации

Проведенное исследование позволило составить представление об особенностях распространения новостной информации в социальной сети Twitter. Была проведена...
Автоматизированные методы - Распространение новостной информации

Мониторинг социальных сетей На данный момент используется преимущественно в сфере маркетинга и PR, однако, по прогнозам специалистов, этот метод в скором...
Сетевой анализ как метод изучения виртуального пространства - Распространение новостной информации

Анализ социальных сетей как отдельное направление появилось в конце 20 века, основоположниками которого считаются такие ученые как Милгрэм ("феномен...
Sysomos MAP (Media Analysis Platform) - Распространение новостной информации

- Web-аналитика - предоставление количественной информации об особенностях различных сайтов, исходя из активности их пользователей - Сбор контента -...
Концепция "лидеров мнений" Пола Лазарсфельда. Соотнесение с онлайн медиа - Распространение новостной информации

В основе данной работы лежит концепция американского социолога Пола Лазарсфельда о "двухступенчатой коммуникации и лидерах мнений" . Согласно данной...
Основные метрики, используемые в сетевом анализе - Распространение новостной информации

Сетевой анализ позволяет изучать социальные взаимодействия путем выделения структур отношений между индивидом и группой, а также и взаимодействий групп...
Типология социальных сетей виртуального пространства - Распространение новостной информации

Интернет-платформы можно разделить по особенностям строения и целей сайта и предоставляемых (сайтом) возможностей: 1. Социальные сети (Facebook,...
ВЫЯВЛЕНИЕ РАЗЛИЧИЙ В СТРУКТУРАХ РЕАЛЬНЫХ И ЛОЖНЫХ НОВОСТЕЙ В СОЦИАЛЬНЫХ СЕТЯХ - Распространение новостной информации

Выше приведена таблица макропоказателей для каждой сети. В данном случае нельзя говорить об отношении направленности существующих различий...
Неавтоматизированные методы - Распространение новостной информации

Нетнография Интернет - это глобальная сеть данных, которые используются, создаются, обмениваются миллионами людьми ежедневно. Люди общаются в социальных...
ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ ОСНОВАНИЯ ИЗУЧЕНИЯ НОВОСТНОЙ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ СЕТЯХ, Современная Россия в Интернете: стремительное увеличение пользователей Сети - Распространение новостной информации

Современная Россия в Интернете: стремительное увеличение пользователей Сети Охват Интернета в России сравнительно маленький: лишь 49% всей территории...
Постановка задачи, Организация сбора информации, JMP, Надстройка для Microsoft Exсel "Интеллектуальный анализ данных" - Деревья решений

Необходимо исследовать зависимость влияния различных факторов на параметр, характеризующий производство. В качестве такого параметра было выбрано...
ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИКИ "ЛИДЕРОВ МНЕНИЙ" В СТРУКТУРЕ РАСПРОСТРАНЕНИЯ НОВОСТЕЙ - Распространение новостной информации

В каждом из разобранных кейсов одну из главных ролей в распространении информации играли искусственно созданные аккаунты, имитирующие деятельность...
Социальные сети: структура коммуникации online vs. offline - Распространение новостной информации

Одна из простейших форм передачи информации - это коммуникация. В то же время это многогранное понятие, включающее в себя различные особенности и...
Сбор и регистрация информации - Теоретические основы информационных технологий

Сбор и регистрация информации происходят по-разному и в различных объектах. Процесс перевода информации в выходные данные в технологических системах...
ЕДИНИЦЫ, - Интеpпpетация данных - Единицы измерения информации в памяти ПК

ИЗМЕРЕНИЯ ИНФОРМАЦИИ В ПАМЯТИ ПЕРСОНАЛЬНОГО КОМПЬЮТЕРА - Интеpпpетация данных Зададимся вопросом, что такое данные и как мы к ним относимся? Интуитивно...
ИССЛЕДОВАНИЯ ИНТЕРНЕТ-ПРОСТРАНСТВ. ОСНОВНЫЕ ПОДХОДЫ В РОССИИ И ЗА РУБЕЖОМ - Распространение новостной информации

На сегодняшний день не существует единой классификации методов Интернет-исследований. Во многом это связано с тем, что данная сфера только начинает...
Архитектура построения баз данных - Разработка базы данных

СУБД имеют свою архитектуру. В процессе разработки и совершенствования СУБД предлагались различные архитектуры, но самой удачной оказалась трехуровневая...
Форма использования средств обработки данных - Автоматизированные системы обработки экономической информации

Наиболее распространенная форма - ЭВМ. Раньше чаще использовались вычислительные центры (ВЦ). Вычислительный центр - организуется и специализируется на...
СУБД MS Access - База данных, хранящая в себе информацию о командах NBA

Системы управления базами данных (СУБД) - это программные средства, с помощью которых можно создавать базы данных, наполнять их и работать с ними. В мире...
Описание входной и выходной информации, Проектирование базы данных, Выбор и обоснование средств реализации - Проектирование и разработка веб-представительства фирмы по продаже спортивных товаров и футбольной атрибутики

Описание входной и выходной информации "Учет продаж футбольной атрибутики и спортивных товаров". Входная информация задачи: 1. Условно постоянная...
Построение ER диаграмм - Модернизация структуры базы данных на основе анализа требований предприятия

При построении моделей информационных систем важнейшей методикой является ER-моделирование или построение диаграмм сущность-связь. Сущность представляет...
Хранение, кодирование и пpеобpазование данных - Единицы измерения информации в памяти ПК

Хранение информации в памяти ЭВМ - одна из основных функций компьютера. Любая информация хранится с использованием особой символьной формы, которая...
Поиск, сбор и хранение научной информации - Поиск, накопление и обработка информации

Не все окружающие нас источники информации можно использовать для подготовки научных работ. Ведь научная работа всегда имеет достаточно узкую...
Защита информации в БД - Банки и базы данных. Системы управления базами данных

Целью защиты информации является обеспечение безопасности ее хранения и обрабатывания. Процесс построения эффективной защиты начинается на начальных...
Запросы на выборку - Банки и базы данных. Системы управления базами данных

Запросы используются для получения пользователем информации, содержащейся в БД, в удобном для него виде. Результат запроса отображается для пользователя...
ЗАПРОСЫ, Запрос на выборку "Биатлонисты" - База данных, хранящая в себе информацию о командах NBA

Запрос на выборку "Биатлонисты" 1. Одним щелком правой мыши нажимаем на таблицы Биатлонисты, после чего во вкладке Создание нажимаем на пункт Конструктор...
Предлагаемое решение, Таблица агрегатов, Таблица лога изменений - Программа расчета агрегатов по накапливающимся данным для построения отчетов

База данные кеширование денормализация Предлагаемое решение -- скомбинировать некоторые идеи кеширования и денормализации в специальной библиотеке...
Выбор технологий, Методология исследования, Процесс разработки, Тестирование - Программа расчета агрегатов по накапливающимся данным для построения отчетов

Предлагаемая библиотека хранит все данные в отдельных таблицах, таким образом он не обязан использовать ту же СУБД, что и основное приложение. В качестве...
MapReduce, Кеш - Программа расчета агрегатов по накапливающимся данным для построения отчетов

MapReduce -- модель распределенных вычислений, используемая для параллельных вычислений над большими объемами данных в кластерах. MapReduce позволяет...
Структурные единицы экономической информации. - Технология создания и управления баз данных

Структурными единицами экономической информации являются реквизиты, показатели, документы, массивы. Реквизиты выражают определенные свойства объекта и...
Целостность, Миграция - Программа расчета агрегатов по накапливающимся данным для построения отчетов

Еще одна возможная проблема -- целостность данных. Если приложение не уведомит Библиотеку об изменении данных, то ошибка останется в агрегате навсегда....
Построение диаграмм UML - Модернизация структуры базы данных на основе анализа требований предприятия

UML - унифицированный язык моделирования, призванный упростить построение больших информационных систем. Состоит из диаграмм, связей и сущностей....

Построение выборки и сбор данных - Распространение новостной информации

Предыдущая | Следующая