ОПИСАНИЕ РАБОТЫ С СИСТЕМОЙ МОНИТОРИНГА СОЦИАЛЬНЫХ СЕТЕЙ В КАЧЕСТВЕ МЕТОДА СБОРА ДАННЫХ - Распространение новостной информации

Система мониторинга социальных сетей предоставляет исследователю возможность собрать интересующие его упоминания в социальных сетях по какой-либо тематике за кратчайшие сроки. Достаточно правильным образом составить поисковый запрос и программа соберет базу сообщений за указанный период с заданными условиями поиска. Полученная база данных состоит из всех найденных системой сообщений пользователей, которые размещены в публичном доступе.

Прежде, чем приступить к анализу, необходимо "очистить" базу от нерелевантных сообщений:

    - Удаленные сообщения - это те упоминания, которые по каким-либо причинам недоступны, удалены пользователем или модератором. - Не связанные с темой исследования - система ищет любые совпадения с заданным в поиске словом, следовательно, чем "проще" искомое слово, тем больше будет нерелевантных сообщений.

Для создания релевантного поискового запроса, необходимо соблюсти некоторые условия:

Во-первых, подобрать все возможные и распространенные варианты написания слова, названия. Например, в данном случае, ключевое слово - название бренда. Однако было понятно, что не все пользователи пишут данное название правильно. Более того, даже русифицированный вариант написания этого бренда часто встречается с ошибками, либо сокращениями и так далее. Для того, чтобы собрать наиболее полную базу упоминаний, необходимо учитывать все эти особенности написания искомого слова.

Во-вторых, язык поисковых запросов предполагает наличие определенных правил, с помощью которых можно регулировать поиск сообщений. Так, например, можно задать системе искать только точные совпадения (без склонений), либо же исключить какие-либо слова заранее. Для того, чтобы понять что из вышеперечисленного следует сделать, можно воспользоваться пробным поиском в самой системе, либо же самостоятельно попробовать различные комбинации слов в обычных поисковых системах (Google, Mail, Yandex и так далее).

В-третьих, важно установить дату, с момента которой будут собираться упоминания. Например, в данном случае, были необходимы упоминания с момента начала установки "чемодана". Более ранние сообщения, по понятным причинам, не содержат необходимой информации и в любом случае были бы удалены.

При процедуре "очистки" базы исследователь буквально "знакомится" с данными, примерно понимает соотношение публикаций СМИ и непосредственно пользовательских отзывов. При этом, происходит проставление тональности упоминаний: новостные сообщения СМИ относятся к нейтральным, а пользовательские в зависимости от ситуации. В данном случае, конечно, эмоциональная оценка носит достаточно субъективный характер, особенно в случае с большими и подробными сообщениями, где могут быть все краски.

Среди разработчиков систем мониторинга социальных медиа актуален вопрос совершенствования и внедрения такой функции как автотональность. Это означает, что система "сама" проставляет одну из трех тональностей каждому сообщению, исходя из его содержания. Данная функция значительно облегчила и упростила работу с базой упоминаний, но все еще система не может в большинстве случаев правильно определить эмоциональную окраску сообщения. Особенно в случае с "богатым русским языком", где, казалось бы, "позитивные" слова выражают негативную реакцию человека - ирония и сарказм трудны для машинного распознавания. Более того, раскрепощенные анонимностью и неформализованным характером многих социальных сетей, люди могут выражаться, используя матные слова. Однако даже в этом случае, наличие нецензурного слова еще не означает негативную реакцию человека. В каждом случае исследователю необходимо рассматривать очередное упоминание в контексте данного социального события или процесса.

Похожие статьи




ОПИСАНИЕ РАБОТЫ С СИСТЕМОЙ МОНИТОРИНГА СОЦИАЛЬНЫХ СЕТЕЙ В КАЧЕСТВЕ МЕТОДА СБОРА ДАННЫХ - Распространение новостной информации

Предыдущая | Следующая