Эпоха Больших данных: начало перехода к новому понимаю данных - Распространение новостной информации

Современные технологии позволили перейти к качественно новому пониманию данных, информации и возможностей ее анализа. В виртуальном мире ежесекундно происходит огромный прирост новой информации: делаются записи в социальных сетях, регистрируются новые сайты, более того, привычная бумажная бюрократия также принимает электронный формат, превращаясь в огромные базы данных. Это ценнейшая информация, которая может быть использована практически в любой сфере общественной жизни.

Многие ученые из различных областей науки, таких как, биология, математика, информатика, психология, социология, политология, маркетинг видят огромный потенциал использования Больших данных. Более того, огромная мощность современных компьютеров (по сравнению с вычислительными машинами прошлых десятилетий) делает возможным быструю обработку, хранение и накопления таких больших баз данных. На сегодняшний день важной задачей становится понимание того как анализировать эти данные, как защитить персональную информацию пользователей и какие специалисты необходимы для данной работы.

Особенно актуальна эта дискуссия для гуманитарных наук, где исследователи "разделились" на две стороны. Одни считают, что в эпоху Больших данных традиционный подход не эффективен и следует "позволить данным говорить за себя", а не пытаться объяснить данное социальное явление с помощью различных теорий. Другие же исследователи наоборот призывают к еще более ответственному подходу к социологическим теориям и необходимости применять их в контексте Больших данных.

Рассмотрим оба подхода более подробно.

Согласно первому из них анализ Большие данные перевернут традиционный подход к социологическим исследованиям и самому объекту познания. В книге Виктора Майера-Шенберга "Большие данные: революция, которая изменит то, как мы живем, работаем и мыслим" предлагается новый подход к имеющимся данным: не искать причинно-следственную связь, а находить корреляции. Это обусловлено характером данных, которые исследователь получает для дальнейшего анализа, а именно, их неструктурированность и неорганизованность. Нужно "позволить данным говорить" - это означает, что не нужно заранее продумывать гипотезы и составлять вопросы, это было необходимо в традиционных исследованиях. В ситуации с Большими данными, где очень сложно упорядочить входящие потоки информации, а зачастую и просто невозможно (из-а огромных денежных, трудовых и временных потерь), необходимо "погрузиться" в эти данные, пытаться найти там какие-либо закономерности, "выбросы", что-то новое, что дает новую информацию и решения.

В традиционных исследованиях, при невозможности охватить все случаи, используются выборки, которые позволяют масштабировать небольшое количество данных (относительно общего объема) на всю совокупность. При этом, полученные данные строго структурированы и формализованы, вопросы анкеты четко продуманы и отражают исходные цели и задачи исследования. Сами же результаты, в большинстве случаев, представляются как средние значения и вероятности.

В эпоху Больших данных мы можем исследовать все интересующее нас пространство: "N = все" . Современное технологическое оборудование позволяет обрабатывать огромные базы данных, и более того, собирать их в режиме реального времени. Исследователь в кратчайшие сроки получает массив данных, который он может рассматривать с различных сторон, искать какие-либо связи между объектами. Он получает всю совокупность за интересующий его период, при этом, заранее не зная, что может там обнаружить. С одной стороны, это может показаться проблемой, ведь как анализировать данные, не понимая, какие выводы необходимо получить. Но с другой стороны, это дает исследователю огромную свободу для поиска новых решений и связей, сами данные "расскажут" ему о своей специфике и характере.

Наиболее радикальный аргумент о "конце теории" рассмотрен в статье Криса Андерсона "The End of Theory: The Data Deluge Makes the Scientific Method Obsolete" , 2008 год. Автор утверждает, что в эпоху Больших данных, когда исследователи получили возможность с высокой точностью отслеживать потоки информации, нет необходимости строить абстрактные теоретические модели. "This is a world where massive amounts of data and applied mathematics replace every other tool that might be brought to bear. With enough data, the numbers speak for themselves" .

Альтернативный подход призывает исследователей не думать о Больших данных как о панацее и тем более не отказываться от теоретических рамок. В данном случае, ученые говорят о Больших данных как инструменте для познания реальности, а не как о уже существующем знании. Более того, процесс анализа и интерпретации данных очень субъективен, особенно в ситуации исследования социальных медиа, что приводит к необходимости комплексного анализа: "Big Data is at its most effective when researchers take account of the complex methodological processes that underlie the analysis of social data" .

В статье Social Science in the Era of Big Data Sandra Gonzбlez-Bailуn доказывает, что "старые" теории помогают понять организацию и функционирование социальных отношений в виртуальном пространстве, более того, на основе новых данных дополнить уже существующую теорию. В частности это, в первую очередь, относится к сетевому анализу, где возможности Больших данных позволяют проследить за формированием социальных сетей, их функционированием, формирует представление о структуре связей в виртуальном пространстве, также можно следить за динамикой изменений этих социальных сетей во времени и пространстве.

Автор также предлагает рассмотреть, как Большие данные могут развить существующие теории о поведении масс и социальном влиянии. В частности, речь идет о взаимодействии массы (публики) и медиа. Известный французский социолог Габриель Тард в своих работах подчеркивал, что СМИ формирует общественное мнение, которое зарождается в процессе коммуникации между людьми. В век информационных технологий становится особенно актуально исследовать данную теорию, особенно при учете "раздробленности" современных СМИ. Так, в работе Twilight of the Gods?: How the Internet Challenged Russian Television News Frames in the Winter Protests of 2011-12 рассматривается ситуация современных российских медиа. Так, исследователи выяснили, что официальные телевизионные каналы и интернет-газеты сообщают одну и ту же информацию различными способами, что, как следствие, ведет к различному понимаю одного и того же события. Более того, виртуальные СМИ на сегодняшний день имеют ряд значительных преимуществ: возможность быстрого реагирования, распространение "гражданских" журналистов (аналитические статьи пользователей, не принадлежащие каким-либо газетным изданиям), взаимодействие газеты и публики (пользователи могут сами присылать фотографии с места событий, оставлять комментарии) - все это значительно повышает доверие масс к виртуальному изданию.

С другой стороны, в западных странах актуальна дискуссия о правомерности использования Больших данных. В частности, выдвигается тезис о том, что использование пользовательских данных нарушает их частные права и даже при гарантии анонимности и попытке "обезличить" данные остается возможность вычислить конкретного человека. Все это может стать угрозой для репутации человека, а иногда даже его жизни. Главный вопрос заключается в определении границы между частным и публичным: можно ли оперировать публичными данными и сообщениями пользователей? Ведь существуют различные настройки приватности и, если человек хочет ограничить круг лиц, имеющих право просматривать содержание его контента, то он легко может это сделать. С другой стороны, правомерно ли использование каких-либо публичных данных без оповещения и информирования пользователя?

Похожие статьи




Эпоха Больших данных: начало перехода к новому понимаю данных - Распространение новостной информации

Предыдущая | Следующая