Всем привет!

Консультанты и разработчики АТК не только внедряют системы бизнес-аналитики, но и бегают, поэтому сегодня у нас пост с марафонской аналитикой.

В это воскресенье, 24 сентября, в очередной раз прошел Московский Марафон, и по этому случаю мы разработали приложение на Qlik Sense с аналитикой результатов марафонцев за 4 года (2014 – 2017).

Общая статистика по марафонцам

Думаю, эту статью будут читать не только поклонники бизнес-аналитики, но и многие бегуны, так что технические моменты оставлю на закуску, а мы сразу начнем с разбора приложения и  аналитических открытий.

Вот такая структура приложения получилась, прямо по ней и пройдемся:

На первой странице приложения собрали общую информацию – сколько участников по годам, сколько мужчин, сколько женщин, сколько не финишировали, сколько было дисквалифицировано, из каких стран больше всего участников.

Общее число марафонцев. В этом году прироста по количеству участников марафона нет. В 2016 год финишеров было больше, чем в 2017: 6.603 мужчины и 1.210 женщин против 6.544 мужчин и 1.235 женщин в этом году. Устроим в следующем сентябре марафонный флешмоб?

Недобежавшие. Данные за 2017 год немного огорчили – в этот раз в протокол не включили участников с пометкой «DNF» (тех, кто не финишировал), так что количество недобежавших за всю историю неполное. Динамика позитивная – все больше марафонцев верно оценивают свои силы и добегают до финиша, но разбивка по мужчинам и женщинам получилась интересная. Если у мужчин процент недобежавших от года к году почти не поменялся (4,5% нефинишировавших в 2014 против 3,5% в 2016 году), то женщины сделали настоящий рывок с 2014 года: 10,4% превратились в 2016 году всего в 6%.

География марафонцев. За все годы по количеству марафонцев лидируют Россия, Франция и Беларусь, но год от года тройка лидеров меняется. Только Россия, естественно, на первом месте. Поэтому, по России и карта городов-участников. Мало марафонцев к нам доехало только из Сибири и Дальнего Востока.

Типичный марафонец

Возраст. Типичный марафонец постарел: если в 2014-2015 ему было 34, то с 2016 ему уже 35.

Скорость. Типичный марафонец обычно немного снижает скорость каждые 5 км, но при этом силы для финального рывка оставляет и ускоряется на последних 5-10 км. Единственное исключение — вторые 5 км. Они обычно быстрее первых, потому что народу стартует много и не всегда получается в самом начале обогнать других бегунов.

Собственно, теперь вы знаете, какой пейс держать, чтобы пробежать хотя бы как средний марафонец =)

Чем старше, тем быстрее? Из забавного – женщины 60-65 лет (категория Ж60) в среднем бегают быстрее женщин 20-23 лет (категория Ж20), а также быстрее предыдущей категории Ж55. У мужчин же все предсказуемо – пиковая средняя скорость у категории М45 (45-50 лет), а затем постепенное снижение показателей.

Изучите графики:

Типичный призер

Теперь аналитика «космоса» – как бежать, чтобы стать лучшим. Хотя бы в своей возрастной категории. Можно я тут без комментариев?

Просто выберете пол и возрастную группу:

Лучшие из лучших: клубы, страны, города, возрастные категории

Беговой клуб. Самые многочисленные беговые клубы за всю историю Московского Марафона – Adidas, Nike + и I LOVE RUNNING. Интересно, что в 2014-2015 с большим отрывом лидировал Nike +, а в 2016 Adidas разбудил районы так, что теперь обгоняет Nike по количеству марафонцев почти вдвое.

Страны и города. ТОП-5 самых быстрых стран меняется каждый год и становится все более европейским (в 2014 году в лидерах были только Кения, Россия и страны СНГ). Самый быстрый город в России, конечно, Уфа. Москва лишь на 5 месте по статистике за все годы, а по итогам этого года мы скатились на 9 место. Московские бегуны, почему расслабились? =)

Возрастные категории. Закон больших чисел работает – самые многочисленные возрастные группы М35 и Ж35 выдают чемпионов с самой высокой скоростью на марафоне.

Результаты участников: найди себя

С точки зрения визуализации на этом листе ничего особенного – просто результаты всех марафонцев с 2014 года. Просто удобно найти себя по фамилии и посмотреть прогресс. Например, финансовый директор Меховой фабрики Каляев и большой фанат Qlik Sense, Денис Ирхин, бежал марафон в 2014 и в 2017 году, вот его результаты:

 

Технические детали по разработке приложения Qlik Sense

Теперь кратко о данных и разработке приложения.

И да, вы все верно поняли — вчера был опубликован протокол с результатами Московского Марафона 2017, а сегодня с утра у нас уже готово приложение с аналитикой за 2014-2017 годы. Именно так быстро.

Чтобы быстрее поделиться с вами аналитикой, разрабатывать приложение я сама не стала — мне помог наш консультант. Влад, спасибо тебе большое!

1. Данные и модель. Итак, дано:

  • Файлы с результатами бегунов за 2014-2017 годы отдельно по мужчинам и женщинам – всего 8 таблиц,
  • Таблица мэппинга по беговым клубам – пришлось ее сделать самой, так как данные очень грязные. При регистрации в этом поле нет выпадающего списка, поэтому даже если человек заполняет поле не с целью поприкалываться, данные все равно приходится обрабатывать (например, приводить к единому знаменателю «Adidas», «Адидас», «Adidas RunClub», «Adidas Boost Team» и прочие)
  • Таблица мэппинга по странам и городам.

Данные за 2013 год нашлись на каком-то стороннем сайте, но не были уверены в их полноте, так что не стали их включать в модель.

Вот такая несложная модель данных у Влада получилась:

Время на создание модели данных: 40 минут (это с учетом поиска в интернете подходящей таблицы для мэппинга стран и городов)

2. Разработка визуализации. Аналитическое приложение Qlik Sense получилось из 5 листов, которые мы рассмотрели выше:

  • дэшборд с основными показателями,
  • портрет типичного марафонца,
  • портрет типичного призера,
  • аналитика по лучшим показателям (в том числе по возрастам, беговым командам и странам),
  • полная таблица с результатами, с возможностью найти себя.

 

Время на разработку визуализации: 4 часа (это с учетом продумывания интересных лично мне и другим бегунам показателей)

3. Встраивание интерактивных визуализаций в этот пост.

Загрузила приложение Qlik Sense в облачный сервис Qlik Cloud сама (по требованиям проходит по бесплатному тарифу Qlik Cloud Free), нажала на шаринг нужных визуализаций и сгенерила Embed-код.

Время на встраивание интерактивных визуализаций в пост: 10 минут (это с учетом загрузки приложения в Qlik Cloud)

Если у вас есть какие-то вопросы, пожалуйста, пишите в комментариях! Вопросы можно задавать как по марафонской аналитике, так и по системе Qlik Sense – как вы уже догадались, мы разрабатываем такие же красивые приложения для аналитики бизнеса компаний.

Всем бег и Qlik! =)

P.s. Пожалуйста, поделитесь ссылкой на статью и аналитикой со своими беговыми друзьями — им тоже будет интересно!

P.p.s. Если кто-то хочет поработать с полноценным приложением по аналитике Московского Марафона, а не с интерактивными диаграммами, которые встроены в статью, напишите мне на marina.payvina@atkcg.ru с темой «Марафонская аналитика 2014-2017» — устроим =) У кого установлен Qlik Sense смогу прислать само приложение.