Образ центральный распределенного кампуса ВШЭ, Методология. Спонтанные данные. Социальные сети как метод изучения городской ментальности - Предпосылки возникновения университетской среды в районе центральной части распределенного кампуса НИУ ВШЭ

Методология. Спонтанные данные. Социальные сети как метод изучения городской ментальности

В современном городе ежеминутно производятся сотен тысяч теробайтов новых данных. Город ежесекундно производит огромные массивы информации о самом себе.

Таким образом, создается новый слой информации, второй зеркальный виртуальный город, сотканный из информации социальных сетей, транзакций банков, счетчиков и сенсоров, данных камер наблюдения и тысячи других элементов и систем.

Большую часть подобной информации принято называть термином "большие данные". Развитие данного типа информации стало возможным за счет появления новых промышленных и научных технологий, которые основывались на сложных системах, оснащенных инструментами непрерывного мониторинга выполнения отдельных задач. Следующий прорыв был связан с появившейся возможностью производить миниатюрные элементы подсчета и фиксации, что не только позволило внедрять сенсоры и компьютерные системы в практические любые объекты, но и привело к их портативности, простоте и доступности, и, как следствие, возможности персонального использования. Таким образом, сейчас мы уже говорим о целом мире связанных между собой через технологии объектов, систем и людей (IoT). Именно возможность связывать информацию о различных системах города с информацией о поведении людей и повлияло на быстро возросший интерес к анализу больших данных. Эти цифровые следы, помимо того, что являются ценным ресурсом для анализа социальных процессов и взаимодействий, формирующимся практически бесплатно, беспрерывно, и в очень больших масштабах.

Очевидно, такие данные генерируются безотносительно конкретного запроса со стороны аналитика и в "сыром" виде не дают готовых ответов о тех или иных городских процессах. Именно поэтому так важно правильно формулировать аналитические запросы и визуализировать большие данные, так как такие объемы невозможно осознать, используя обычную статистику.

В данной работе используется альтернативный "большим данным термин, предложенный исследовательскими командами Mathrioshka и Habidatum - спонтанные данные. От просто больших данных их отличает, как легко догадаться, именно спонтанность их создания. Так, к таким данным не относятся управляемые данные, собираемые намеренно в процессе контроля и мониторинга, как например, данные о происшествиях и преступлениях, хранящиеся в электронных базах полицейских участков. Данный термин в первую очередь касается данных, производимых людьми и используемыми ими устройствами (сигналы сотовых телефонов и сообщения соцсетей), или сервисами (банковские автоматы, системы контроля пассажирского паспорта и так далее).

Тот факт, что такие данные формируются без прямого умысла и нацеленности на производство информации с одной стороны, как было отмечено, приводит к необходимости тщательной работы по анализу и их интерпретации, когда ценность данных, в конечном счете, определяется умением поставить правильный к ним вопрос, а с другой - к тому, что они изначально не "подстраиваются" под вопросы исследователя, как это часто бывает, в случае, например, социологических опросов.

В самом деле, впервые ежедневная жизнь горожан документируется так полно и объемно, не ограничиваясь узкими рамками социологических исследований.

Если задуматься, то право "репрезентировать город" на протяжении почти всей истории было сосредоточено в руках правящей элиты, стремящейся сформировать определенный образ и идеологию, соответствующую своим интересам. Сегодня же, с распространением электронных медиа и социальных сетей, которые создают не только определенные культуры, но и формируют представления о тех или иных районах и объектах города, впервые произошло своеобразное "перетекание" силы в руки горожан, которые теперь сами, порою неосознанно, формируют новое представление о городе. Boy J. D., Uitermark J. Capture and share the city: Mapping Instagram's uneven geography in Amsterdam.

Таким образом, анализ спонтанных данных может быть осуществлен с целью понимания структуры, системы ценностей, способов распространения информации и типов реакции на те или иные изменения в городе. Он может позволить определить социальный и символический капитал городского пространства и составляющих его объектов и сетей. Он также ценен для измерения и прогнозирования эффектов градостроительных и планировочных решений.

Рассмотрим, каким образом спонтанные данные могут быть использованы для анализа городского сообщества и географии потребления пространства.

"Дайте каждому пользователю Twitter кисть, и они нарисуют для вас весь мир" Miguel Rнos, The geography of Tweets, 31.05.2013[Электронный ресурс] // URL: https://blog. twitter. com/2013/the-geography-of-tweets(дата обращения: 01.06.2016) - сказал один из членов команды социальной сети коротких сообщений Мигель Риос, подразумевая под "кистью" посты с геотагами. В подтверждение этой мысли был создан проект,#Interactive, Andes, [Электронный ресурс] // URL: http://twitter. github. io/interactive/andes/(дата обращения: 01.06.2016) визуализирующий различные концентрации твитов в нескольких американских городах в виде своеобразного "виртуального ландшафта", определяющего пространственную структуру городов и границы урбанизированной территории. Такой и подобные этому проекты по визуализации спонтанных данных, сгенерированных активностью в социальных сетях, позволяют определять положение естественных и антропогенных пространственных барьеров, дорог, а также "слепых зон", исключенных из ежедневной картины мира большей части горожан. Тенденция современного города вытеснять в невидимую теневую зону всех деклассированных, маргинальных или просто нежелательных элементов - иммигрантов, бедных, больных, бездомных - является примером визуально-информационного способа потребления современного города. Если раньше смешение бедных и богатых, красоты и уродства было типичным для города, то теперь определенные зоны как бы "ретушируются" для достижения определенного образа. Mirzoeff N. The visual culture reader. - Psychology Press, 2002. [Электронный ресурс] // URL: http://faculty. georgetown. edu/irvinem/theory/Mirzoeff-What_is_Visual_Culture. pdf(дата обращения: 01.06.2016)

В силу часто показательного использования социальных сетей, как средства саморепрезентации, эти элементы часто не попадают в их поле зрения напрямую, а только лишь через косвенные высказывания. Однако отсутствие информации, высокой активности в соцсетях, иногда может быть красноречивее всех постов, указывая на отчужденные, "нежелательные" места в городе.

С помощью спонтанных данных также возможно определять границы городов и смысловых территорий, в них входящих. Так, Phototrails - исследование, основанное на анализе огромного количества изображении? взятых из Instagram, привело к формированию гипотез, которые касаются переопределения границ центра и периферии современных городов и самих категории? "центр" и "периферия". Phototrails [Электронный ресурс] // URL:http://phototrails. net/about/(дата обращения: 01.06.2016)

Недавно запущенная фотошеринговым сервисом Flickr платформа позволяет видеть географию сделанных пользователями фотографий, фильтруя их на основе сделанных к ним подписей. Это позволяет выделять семантически схожие в виртуальном пространстве части города, создавая новое понимание смысловой связанности разных районов и объектов. Flickr cities,[Электронный ресурс] // URL:http://www. datainterfaces. org/projects/flickr/#(дата обращения: 01.06.2016)

Приведем несколько примеров анализа городского сообщества через спонтанные данные. Такой анализ чаще всего осуществляется с помощью выделения тех или иных групп пользователей, которые по особенностям своих постов попадают в определенную категорию горожан.

Так, например, по языку сообщений возможно определить соотношение местных жителей и туристов в городах мира. Специалистом по работе с данными Эриком Фишером была создана серия визуализации? информационных потоков социальных сетей (данные записей в Twitter). На карте видны очертания урбанизированных ареалов, выделяются мировые туристические центры и ядра в отдельных странах, а также очаги активности в пределах городов. MapBox,[Электронный ресурс] // URL: https://www. mapbox. com/labs/twitter-gnip/locals/#11/13.7994/100.4865(дата обращения: 01.06.2016)

Похожий анализ был выполнен компанией Habidatum - данные Twitter активности в Барселоне были проинтерпретированы не только на предмет того, кем они были созданы (туристом или местным жителем), но и на тональность (позитив-негатив). В результате была выявлена география туристического города и соотношение "туристичности" места и его восприятия. Habidatum,[Электронный ресурс] // URL:http://habidatum. com/project/barcelona-vs-_-barcelona/(дата обращения: 01.06.2016)

Анализ спонтанных данных может также помочь определить тенденции, проявляющиеся в тех или иных районах города. Так, недавно был опубликовано исследование Шарон Зукин, которое использовало отзывы, оставленные на сайте Yelp, в качестве индикатора уровня джентрификации разных районов Бруклина, ставя при этом акцент на связи джентрификации и отношения к определенным этническим группам. CityLab, Richard Florida, What yelp can tell us about gentrification and race[Электронный ресурс] //URL:http://www. citylab. com/housing/2015/11/what-yelp-can-tell-us-about-gentrification-and-race/415224/(дата обращения: 01.06.2016)

Ученые из Гарварда Жаклин Уэнь и Роберт Сэмпсон в 2014 году также осуществили исследование джентрификации районов Чикаго, использовав данные Google view. Хотя фотографии Google view не генерируются случайно, а создаются преднамеренно, их использование в качестве материала для анализа городов не предусматривается изначально, что дает нам право в какой-то степени отнести эту информацию к разделу "спонтанных данных". Фотографии улиц были проанализированы относительно визуальных кодов происходящих процессов джнтрификации, таких как новое строительство, реновационные работы, открытие новых ресторанов и так далее. CityLab, Richard Florida, Gentrification and the Persistence of Poor Minority Neighborhoods, [Электронный ресурс] // URL: http://www. citylab. com/housing/2014/08/gentrification-and-the-persistence-of-poor-minority-neighborhoods/373062/(дата обращения: 01.06.2016)

Крайне интересное исследование с применением целого ряда спонтанных и больших данных было проведено в марте 2016 года итальянским ученым Марко де Надай и его командой. Долгое время условия для возникновения активной городской жизни, описанные Джейн Джейкобс, не подтверждались достаточно вескими эмпирическими показателями, за что часто подвергались критике. Попытки подтвердить или опровергнуть влияние названых ею четырех показателей, определяющих разнообразие и оживленность среды-микс старых и новых зданий, разнообразие функций, активные перекрестки, и плотность населения - предпринимались и ранее, например, в ходе 10-ти летнего исследования, проводимого методом опроса пешеходов Сеула. Использование спутниковых данных, данных с Open street map, данных социальных сетей и сотовых операторов, позволило итальянским ученым провести тестирование гипотез Джейн Джейкобс намного быстрее, в целом подтвердив их и выявив определенные закономерности, характерные именно для итальянских городов. MIT Technology Review, Data Mining Reveals the Four Urban Conditions That Create Vibrant City Life[Электронный ресурс] // URL: https://www. technologyreview. com/s/601107/data-mining-reveals-the-four-urban-conditions-that-create-vibrant-city-life/#/set/id/601103/(дата обращения: 01.06.2016)

В данной магистерской диссертации спонтанные данные используются в сочетании с более традиционным методом ментальных карт. Этому есть несколько причин. В первую очередь, тестирование спонтанных данных на небольшой ограниченной территории распределенного кампуса ВШЭ, а также формат студенческой научной работы не позволяет получить доступ или купить большой объем спонтанных данных. Собранные из социальных сетей данные, хотя и являются довольно объемными по сравнению с выборкой, которые обычно удается охватить за ограниченный промежуток времени с помощью, например, опросов, все же не достаточно детальны для проведения семантического анализа. Поэтому в данной работе данные социальных сетей будут использоваться как маркеры пространственной активности, выявляющие паттерны использования пространства.

Интерес использования спонтанных данных также лежит в тестировании самой методологии. Данная сфера еще не оформилась методологически и "идеологически". Несмотря на наличие самой информации и широких возможностей ее применения, примеров использования спонтанных данных для анализа территорий в отечественной практике очень мало. Это является следствием отсутствия общего языка коммуникации между специалистами по агрегации, обработке и по использованию такой информации.

С методологической точки зрения еще более заманчивой предоставляется возможность рассмотреть одну территорию через призму спонтанных данных и ментальных карт, составленных разными категориями пользователей пространства распределенного кампуса ВШЭ. Предстоит понять, каким образом пересекается пространство виртуальное и образ территории у разных категорий граждан, а также то, каким образом, возможно комбинировать геолоцированную информацию о границах потребления города и информацию о смыслах и доминантах, выраженную в абстрактных визуальных образах.

Похожие статьи




Образ центральный распределенного кампуса ВШЭ, Методология. Спонтанные данные. Социальные сети как метод изучения городской ментальности - Предпосылки возникновения университетской среды в районе центральной части распределенного кампуса НИУ ВШЭ

Предыдущая | Следующая