Обзор книги Взгляд на данные глазами экспертов

Наконец-то дочитал книгу O’Reilly, Beautiful Visualization: Looking at Data through the Eyes of Experts, купил на Amazon-е, поскольку на русском не нашел. Сегодня расскажу кратко обо всем: что понравилось, что впечатлило и почему стоит прочитать. Если не очень дружите с английским, читать стоит браться – многие вещи будут понятны и без глубоких знаний языка, потому что книга просто переполнена визуализациями и готовым кодом.

Предыстория

Издательство O’Reilly собрало в книге целую серию экспертных текстов от лучших специалистов по визуализации данных. Все эссе сгруппированы по разным темам, но каждая из них по шагам описывает, как решить поставленную задачу при помощи визуализации. Наша сегодняшняя книга – это не совсем стиль “how-to”, но очень полезна для тех, кто обладает аналитическим стилем мышления и хочет применить экспертные советы на практике.

Первое впечатление

В книге 20 глав, или эссе, от 24 мировых экспертов по визуализации данных. Некоторые имена авторов мне были довольно знакомы, поскольку я их уже встречал в моем любимом блоге Floating Data. Хотя были и авторы, о которых я раньше не слышал, но их статьи я тоже оценил.

Редакторы открывают книгу сами философскими размышлениями на тему, что такое красота данных, какой она должна быть и каким критериям удовлетворять. Все последующие статьи, на радость мне, строго профилированы и представляют кейсы с описанием задачи, выбора типа визуализации под нее и последующей реализации.

Учимся красоте: что такое красивая визуализация и истории данных

Для того, чтобы визуализацию данных назвать красивой, она должна быть выполнена на основе нескольких принципов:

  • аналитическая история, то есть представление данных по определенныой структуре хорошо доносит смысл данных,
  • информативность, данные должны быть представлены с учетом типа аудитории,
  • эффективность, акцентируйте внимание аудитории на том, что, действительно, важно в донесении целевого сообщения,
  • аутентичность, используйте типовые элементы визуализации, такие как заголовки диаграммы, оси, легенды данных – не изобретайте велосипед.

Несколько интересных примеров из книги. Джер Торп, один из визуальных дизайнеров New York Times, в книге рассказывает, как он сделал New York Times API. Будет очень полезно к прочтению начинающему ученому данных (data scientist).

New York Times API

Во всех кейсах авторы рассказывают, как из сырых и сложных данных создать историю. Например, Аарон Коблин делится с нами технологией определения паттернов и рассказывает, как он оценил данные полетов.

Патерны данных

Роберт Косара объясняет процесс визуализации параллельных наборов данных, а также какую пользу они могут принести в процессе аналитики.

parallel sets

Максимилан Шич, используя метрики данных, раскрывает паттерны гетерогенных данных.

Паттерны данных

Формула визуализации от авторов

Авторы издания «Beautiful Visualization: Looking at Data through the Eyes of Experts» описывают процесс создания истории данных простой формулой, которая имеет вид:

Вопрос + Визуальные данные + Контекст = История данных

Несмотря на то, что создание визуализации дано в книге с явно техническим акцентом, даже малоопытный человек в этой области прекрасно поймет, как создать данный тип визуализации, и в чем практическая польза именно такого типа представления данных в каждом конкретном случае.

Итоги

По итогам, скажу, что эта книга из серии must-read, которая объясняет, как создать новые типы визуализаций, которых я насчитал более двадцати, такие как облако слов или новые типы визуализаций для проектов по большим данным.

Итак, по пунктам, чему можно научиться из книги:

  • На примере простых визуализаций создавать истории данных;
  • Изучить теорию цвета, как мозг воспринимает цвет и как вообще цвет влияет на восприятие информации;
  • Узнать, как ученые данных познают природу неизвестных феноменов.

На этом все! Те кто, прочитал: расскажите – как вам?