Технологический цикл создания медиатекста в журналистике данных - Особенности медиатекста в журналистике

Создание медиатекста, базирующегося на данных, - трудоемкий процесс, предполагающий скоординированную деятельность целой команды профессионалов. От качества выполнения работы на каждом этапе разработки медиатекста зависит конечный результат.

П. Брэдшоу разработал модель технологического цикла создания дата журналистского материала, которую он назвал "Перевернутая пирамида дата журнализма". The inverted pyramid of data journalism// Online Journalism blog [электронный ресурс] URL: https://onlinejournalismblog. com/2011/07/07/the-inverted-pyramid-of-data-journalism/ (дата обращения: 03.05.2017) Процесс разработки медиатекста в журналистике данных также описан в статье С. Роджерса. Data journalism broken down: what we do to the data before you see it // The Guardian [электронный ресурс] URL: https://www. theguardian. com/news/datablog/2011/apr/07/data-journalism-workflow (дата обращения: 03.05.2017)

Stray J. How The Guardian is pioneering data journalism with free tools // NiemanLab [Электронный ресурс] URL: http://www. niemanlab. org/2010/08/how-the-guardian-is-pioneering-data-journalism-with-free-tools/ (дата обращения 03.05.2017) Рассмотрим основные этапы:

1. Сбор данных

На данном этапе формируется идея будущего материала, его креативная концепция, а также происходит сбор данных, удовлетворяющих выбранной тематике. Данные могут быть получены несколькими способами:

    Ш непосредственно из правительственных, научных и других баз данных, таких как data. gov, data. gov. uk и API Data Всемирного банка, а также путем подачи запросов в правительственные учреждения и организации о получении доступа к данным; Ш посредством парсинга англ. Web scraping, метод получения контента посредством специально обученных алгоритмов веб-сайтов с помощью таких инструментов, как ScraperWiki, OutWitHub, Import. io и других. Для получения данных из PDF-файлов может быть использована программа оптического распознавания символов OCR-Software. Ш путем самостоятельного сбора данных посредством наблюдений, опросов, онлайн-форм или краудсорсинга. 2. Фильтрация и обработка данных

Чтобы получить качественный материал для дальнейшей работы собранные данные необходимо очистить (отфильтровать). Как правило, фильтрация происходит двумя способами: устранение человеческой ошибки и преобразования данных в формат, совместимый с другими данными, которые используются. Так, сформированные на первом этапе наборы данных, могут содержать следующие ошибки: повторяющиеся, пустые или поврежденные записи, присутствие кода HTML в записи, неправильное форматирование (буква вместо цифр и наоборот), разные варианты написания одного и того же понятия (BBC и B. B.C., NY Times и The New York Times) и другие.

К наиболее простым способам очистки данных относится фильтрация посредством программ Excel или Google Docs. Более сложным инструментом является Google Refine, с помощью которого можно преобразовать все записи в строчные прописные или заголовки, удалить HTML пробелы до и после записей, удалять двойные пробелы, объединять и разбивать ячейки, форматировать их последовательно и другое.

3. Комбинирование данных и их анализ

На данном этапе происходит объединение новых данных с уже имеющимися, если необходимо. Создать медиатекст можно и с использованием одного набора данных, однако ценность материала возрастает, если таких наборов несколько. Классическая комбинация - карта mashup, то есть объединение набора данных с данными карты, чтобы обеспечить мгновенную визуализацию того, как определенные объекты/явления распределяются в пространстве: местоположение лучших школ, самые обсуждаемые темы по всему миру на Twitter и другое. Грамотная комбинация наборов данных позволяет создавать более насыщенные и интересные истории.

Далее с помощью специального программного обеспечения осуществляется унификация скомбинированных данных, отбираются данные, строго отвечающие креативной концепции и сюжету готовящегося материала, производится дешифровка и анализ данных, а также их подготовка к дальнейшей визуализации.

4. Визуализация

Является одним из наиболее важных этапов, так как без визуализации даже обработанные и проанализированные данные трудно воспринимать, и именно от того, насколько качественно выполнена визуализация, зависит эффективность коммуникации с читателем.

Как правило, визуализация относится к сфере ответственности проектировщиков и кодировщиков, однако в последнее время некоторые журналисты, владеющие необходимыми навыками, пробуют выполнять ее самостоятельно. Bradshaw P. How to be a data journalist // The Guardian [электронный ресурс] URL: https://www. theguardian. com/news/datablog/2010/oct/01/data-journalism-how-to-guide (дата обращения 03.05.2017) Визуальное сопровождение создается в виде карт, инфографики, диаграмм, анимации, интерактивных форматов, также могут использоваться аудио-и видеоматериалы.

Число программ, с помощью которых можно выполнить визуализацию, увеличивается с каждым годом. Для визуализации данных в виде графиков и диаграмм доступны такие приложения, как Many Eyes или Public. Yahoo. К инструментам, позволяющим создавать карты на основе электронных таблиц данных, относятся Pipes, Open Heat Map и другие.

5. Формирование итогового медиатекста

К материалам, полученным в ходе анализа данных, добавляется выполненная визуализация и журналистский текст. Таким образом, создается материал, объединенный единой идеей. Главная сложность заключается в том, чтобы удачно скомпоновать данные с историями, которые освещены в рамках написанного текста. В результате проделанной работы получается медиатекст, сочетающий на одной странице ряд визуализаций, статей и ссылок на данные.

6. Публикация

Публикация медиатекста в журналистике данных обязательно сопровождается прикреплением ссылки, по которой можно получить доступ к исходным, "сырым" данным.

Журналисты должны предоставить ссылку на данные, которые они использовали, чтобы другие могли изучить затронутую тему и внести свой вклад в исследование. Возможно, будут проведены дополнительные опросы, анализ, произведена иная интерпретация данных, что в итоге позволит сделать новые выводы и по-новому взглянуть на исследуемую проблему/ явление.

В целях структурирования и обеспечения доступа к данным могут быть использованы такие инструменты, как Google Refine (с открытым исходным кодом), Data Wrangler и Google Spreadsheets, позволяющие загружать, извлекать или форматировать данные. Так, "The Guardian" для обмена собранными данными использует общедоступные таблицы Google Spreadsheets, которые не требуют специальные инструменты для просмотра и которые можно загрузить практически в любом формате.

7. Оценка

Заключительным этапом процесса является измерение количества просмотров набор данных и материала в целом, а также проверка наличия обратной связи, которая имеет принципиальное значение в журналистике данных. Сюда же относится коммуникация с пользователями и дальнейшее обсуждения затронутой темы.

Таким образом, создание дата журналистского медиатекста многоэтапный процесс, требующий значительных усилий и высокой концентрации внимания. Важно, чтобы действия всех членов команды разработчиков были согласованными, так как высока вероятность допустить ошибку, произвести некачественную очистку данных, отобрать нерелевантные данные (например, если у кодера и аналитика нет понимания креативной концепции, за которую ответственен журналист) или неправильно их проинтерпретировать. В противном случае все это негативно отразится на содержании медиатекста и дальнейшем выстраивании коммуникации с аудиторией.

Похожие статьи




Технологический цикл создания медиатекста в журналистике данных - Особенности медиатекста в журналистике

Предыдущая | Следующая