Iskusstvo_Vizualizatsii_V_Biznese.pdf - om.c na hi dc la sk...

This preview shows page 1 out of 338 pages.

You've reached the end of your free preview.

Want to read all 338 pages?

Unformatted text preview: om .c na hi dc la sk Visualize This The FlowingData Guide to Design, Visualization, and Statistics sk la dc hi na .c om Nathan Yau Искусство визуализации в бизнесе Как представить сложную информацию простыми образами Нейтан Яу sk la dc hi na .c om Перевод с английского Светланы Кировой Издательство «Манн, Иванов и Фербер» Москва 2013 УДК 65.012.2 ББК 65.291.34 Я88 Издано с разрешения John Wiley & Sons International Rights Inc. и агентства Александра Корженевского. На русском языке публикуется впервые Яу Н. Я88 Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами / Нейтан Яу; пер. с англ. Светланы Кировой. — М. : Манн, Иванов и Фербер, 2013. — 352 с. Визуализация в бизнесе — это умение представить данные в таком виде, который позволит их быстро анализировать, эффектно подавать, ну и конечно, применять в жизни. Прочитав эту книгу, вы научитесь собирать и форматировать информацию, создавать на ее основе диаграммы, графики и карты высокого качества. Используя для целей визуализации Adobe Illustrator, интерактивную графику с HTML, CSS, JavaScript, Flash-графику, а также карты, созданные в R, Python и SVG, вы сможете креативно подавать свои данные и рассказывать с их помощью увлекательные истории. Для тех, кто работает с большим количеством информации: руководителей проектов, аналитиков, консультантов, маркетологов. УДК 65.012.2 ББК 65.291.34 Все права защищены. Никакая часть настоящего издания ни в каких целях не может быть воспроизведена в какой-либо форме и какими бы то ни было средствами, будь то электронные или механические, включая фотокопирование и запись на магнитный носитель, без письменного разрешения издателя. sk la dc hi na .c om Правовую поддержку издательства обеспечивает юридическая фирма «Вегас-Лекс» ISBN 978-5-91657-737-2 © Nathan Yau, 2011 © Издание. Перевод. Оформление ООО «Манн, Иванов и Фербер», 2013 Оглавление Об авторе, о техническом редакторе, благодарности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1 Как рассказать историю с помощью данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Больше чем числа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Что искать . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Дизайн . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 20 26 30 38 Как обращаться с данными. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Сбор данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Форматирование данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3 Выбор инструментов для визуализации данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Готовые решения для визуализации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Программирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Иллюстрирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Маппинг . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Изучите свои возможности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4 Визуализация паттернов во времени . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 106 107 130 142 dc hi Визуализация пропорций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 sk la 5 na .c om Что искать во времени . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Дискретные моменты времени . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Непрерывные данные. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Что искать в пропорциях . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Части целого . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 ОГЛАВЛЕНИЕ Пропорции во времени . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 6 Визуализация зависимостей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 Какие зависимости искать . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Корреляция . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Распределение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Сравнение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 8 om .c na hi dc 276 276 289 304 324 Прицельный дизайн. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 Подготовьте себя . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Подготовьте ваших читателей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Визуальные подсказки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Сто'ящая визуализация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . la 232 232 263 269 274 Визуализация пространственных отношений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 Что искать . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Отдельные местоположения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Регионы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Во времени и пространстве . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 186 186 205 218 230 Как выявить отличия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Что искать . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Сравнение по нескольким переменным . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Сокращение размерности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Роиск выбросов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Закругляясь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . sk 6 326 327 331 337 338 Об авторе С 2007 года Нейтан Яу пишет статьи и создает графику для FlowingData, специализированного сайта, посвященного вопросам визуализации, статистики и дизайна. Работая с такими группами компаний, как New York Times, CNN, Mozilla и SyFy, автор убедился, что инфографика отлично подходит не только для анализа данных, но и для сторителлинга. Нейтан Яу имеет магистерскую степень по статистике Университета Калифорнии в Лос-Анджелесе, Защитил кандидатскую диссертацию о визуализации персональных данных. Автор книги Data Points: Visualization That Means Something.. О техническом редакторе Ким Рийс (Kim Rees) — сооснователь компании Periscopic, социально ответственной фирмы, занимающейся визуализацией информации. Сама Ким — личность знаменитая в кругу профессионалов в области визуализации. У нее семнадцатилетний опыт работы в интерактивных медиа. Она публиковалась в Journal of Information Mapping и в сборнике материалов InfoVIS 2010, а также выступала на множестве различных конференций и форумов, среди которых O’Reilly Strata Conference, WebVisions, AIGA Shift и Portland Data Visualization. Степень бакалавра в области компьютерных наук она получила в Нью-Йоркском университете. О ее компании Periscopic писали и в CommArts Insights, и в «Историях успеха» на сайте Adobe, ее работы были удостоены наград VAST Challenge, CommArts Web Picks, а также премии Communication Arts Interactive Annual. Недавно проект компании Periscopic оказался выдвинут на Национальную премию дизайна Cooper-Hewitt. Благодарности Эта книга не могла бы появиться без трудов ученых, занимающихся проблемами обработки данных и продолжающих создавать полезный открытый инструментарий для всеобщего пользования. Программные продукты этих разработчиков делают мою жизнь намного легче, и я уверен, что они продолжат нас удивлять — нет предела инновациям. .c om Хочу также выразить признательность читателям FlowingData, которые помогли мне установить контакт с таким огромным количеством людей, какого я себе даже представить не мог. Именно ради них главным образом я и сел за эту книгу. dc hi na Еще я хотел бы поблагодарить издательство Wiley Publishing, позволившее мне написать книгу так, как я хотел, а также Ким Рийс — за то, что помогла сделать эту работу достойной прочтения. sk la И в заключение я хочу сказать спасибо за поддержку моей жене и родителям, всегда поощрявшим меня в поисках того, что делает меня счастливым. sk la dc hi na .c om Моей любящей жене Бий Ввеение Нельзя сказать, что данные — это что-то новое. Люди занимаются количественными измерениями и составлением таблиц уже не одно столетие. Тем не менее в последние годы — с тех пор как я начал писать для FlowingData, моего сайта по дизайну, визуализации и статистике, — я наблюдаю настоящий бум в этой области, и конца-края ему не видно. Совершенствование технологий сделало сбор и хранение данных задачей чрезвычайно простой, а сеть позволяет получать к ним доступ в любой момент, когда захочется. Это изобилие данных, окажись они в хороших руках, способно стать кладезем информации, помогающей принимать более дальновидные решения, излагать свои идеи более убедительно и создавать более объективное представление о том, как люди смотрят на мир и на самих себя. Значительные сдвиги в публикации правительственных данных произошли в середине 2009 года, когда Соединенные Штаты запустили портал Data.gov. Он представляет собой всеобъемлющий каталог информации, предоставляемой федеральными министерствами и ведомствами, и демонстрирует прозрачность и подотчетность всех этих организаций и должностных лиц. Сайт задумывался для того, чтобы предоставить гражданам страны возможность ознакомиться с тем, на что власти тратят налоговые поступления. А ведь до этого правительство больше походило на черный ящик. Значительная часть данных на Data.gov и раньше лежала в открытом доступе — она находилась на сайтах ведомств, но те были разбросаны по всей Сети. Теперь же все сведения собраны в одном месте и отформатированы так, что их анализ и визуализация стали намного проще. И у Организации Объединенных Наций есть подобный портал — UNdata. Прошло совсем немного времени, и этому примеру последовало Соединенное Королевство, организовав свой Data.gov.uk. Крупные города мира, такие как Нью-Йорк, Сан-Франциско и Лондон, также являются поставщиками большого количества данных. na .c om Открытию коллективной сети также во многом поспособствовало появление тысяч интерфейсов программирования приложений (application programming interfaces, API). Задача была — приободрить разработчиков и соблазнить их сделать что-то со всеми этими данными. Такие приложения, как Twitter и Flickr, имеют API с широким функционалом, что делает возможным создание пользовательского интерфейса, совершенно отличного от того, который можно видеть на самих сайтах. На ProgrammableWeb — ресурсе, занимающемся каталогизацией API, — их представлено более двух тысяч. Не так давно появились и новые приложения, такие как Infochimps и Factual, разработанные специально для предоставления структурированных данных. sk la dc hi У себя, на индивидуальном уровне, вы можете обновить друзей в Facebook, поделиться сведениями о своем местонахождении через Foursquare или пощебетать о том, чем занимаетесь, в Twitter — все это можно сделать парой кликов мышью или нажатием нескольких клавиш на клавиатуре. Более специализированные приложения дают вам возможность вести учет того, что вы едите, сколько вы ВВЕДЕНИЕ весите, каково ваше настроение и многого другого. Какую бы информацию о себе вы ни захотели собрать, наверняка найдется приложение, которое поможет вам это сделать. Если вокруг собрано столько данных — в магазинах, на складах и в базах, — значит, ситуация созрела для появления людей, которые способны их осмыслить. Сами по себе данные не так уж интересны (по крайней мере, для большей части человечества). Интересна информация, которую можно извлечь из этих данных. Люди хотят знать, о чем говорят их данные, и если вы способны помочь им в этом, то будете весьма востребованы. Вот почему Хол Вариан (Hal Varian), главный экономист Google, говорит, что статистик — самая секси работа грядущего десятилетия, и отнюдь не потому, что статистики — такие красавчики. (Хотя если взглянуть на нас сквозь призму гиковского* шика, то мы очень даже ничего.) Визуализация Один из лучших способов исследовать крупную базу данных и попытаться разобраться в ней — это визуализация. Поместите числа в видимое пространство и предоставьте мозгу — своему или ваших читателей — выявить паттерны. В этом деле мы все мастера. Вы сможете разглядеть истории, которые, возможно, никогда бы не увидели, применяя лишь формальные статистические методы. Джон Тьюки (John Tukey), мой любимый статистик и отец разведочного анализа данных, разбирался в статистических методах и свойствах, как мало кто другой, и верил, что графические методы также имеют законное право на существование. Он был глубоко убежден, что картинки способны открывать нам неожиданное. Вы можете очень многое узнать из данных, просто визуализируя и, а в ряде случаев это и есть все, что вам нужно сделать, чтобы принять информированное решение или рассказать историю. Карты, представленные на рис. 0.1, рассказывают более полную версию этой истории, вам достаточно лишь взглянуть на них — и вы сможете ответить на вопросы из предыдущего абзаца. Округа, окрашенные в более темный цвет, — это области, в которых уровень безработицы был сравнительно высоким, в то время как в округах, окрашенных светлым, ее уровень оказался относительно низким. В 2009 году вы уже видите множество регионов на западе, где уровень безработицы стал выше 10 процентов. Такая же ситуация сложилась и в большинстве регионов на востоке. А вот регионы Среднего Запада пострадали не так сильно (см. рис. 0.2). la dc hi na .c om Например, в 2009 году в Соединенных Штатах произошел значительный рост уровня безработицы. В 2007 году он составлял в среднем 4,6 процента, в 2008 году поднялся до 5,8 процента, а к сентябрю 2009 года дошел уже до 9,8 процента. Однако такие средние по стране величины способны поведать лишь часть истории. Это обобщенные данные по США в целом. Но, может, были какие-то регионы, в которых уровень безработицы оказался выше, чем в других местах? Может, были регионы, которые эта беда вообще обошла стороной? sk 10 * Гик (англ. geek) — человек, чрезмерно увлеченный какой-либо темой и по этой причине несколько выпадающий из реальности. В русском языке чаще применяется к людям, одержимым (компьютерными) технологиями. Прим. пер. ВВЕДЕНИЕ О ТЕХНИЧЕСКОМ РЕДАКТОРЕ 11 Безработица, 2004–2009 гг. 2004 — средний уровень по стране 5,5% С 2000 до 2004 г. безработица росла стабильно, достигнув максимума в 6,3% в июне 2003 г. В последующие четыре года уровень безработицы стабильно снижался. 2005 — 5,1% Небольшой спад в 0,4 процентных пункта по сравнению с 2004 г. 2006 — 4,6% Второй год подряд уровень безработицы снижается, на этот раз всего чуть менее чем на 10%. 2007 — 4,6% 2008 — 5,8% Уровень безработицы по стране в целом остается на уровне 2003 г., но мы видим, что на Западном побережье и в Мичигане он повышается. В 2008 г. безработица поднимается более чем на 1 процентный пункт — безработных становится 8,9 млн людей. 2009 — 9,8% Средний по стране уровень безработицы поднимается до наивысшего уровня с июня 1983 г., когда он составлял 10,1%. С апреля безработица росла ежемеячно, за исключением одного месяца, когда она снизилась на 0,1%. УРОВЕНЬ БЕЗРАБОТИЦЫ (%) 0 2 4 6 8 10+ sk la dc hi na .c om Рис. 0.1. Карты, демонстрирующие уровень безработицы в США с 2004 по 2009 гг. Рис. 0.2. Карта, демонстрирующая уровень безработицы в 2009 г. Источник: Бюро трудовой статистики. Разработано: FlowingData, 12 ВВЕДЕНИЕ Таблица 126. Браки и разводы — общее количество и в расчете на 1000 человек, по штатам, с 1990 по 2007 гг. (Значение 2443,5 представляет собой 2 443 500 человек. По месту проживания.) Браки1 Штат Количество (в тыс.) 1990 США4 2000 Разводы3 На 1000 человек2 2007 1990 2000 2443,5 2329,0 2204,6 9,8 8,3 2007 Количество (в тыс.) На 1000 человек2 1990 2000 ...
View Full Document

  • Fall '19

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

Stuck? We have tutors online 24/7 who can help you get unstuck.
A+ icon
Ask Expert Tutors You can ask You can ask You can ask (will expire )
Answers in as fast as 15 minutes