Posts

Showing posts from April, 2019

R - построение когорт

Image
Итак, я решил продолжить транслировать решения задач показанные Алексеем Куличевским на языке  Python . В этот раз мы будем заниматься трансляцией на R задач по  агрегации и построению когорт (ссылка на оригинал поста с кодом Python) . Датасет будем использовать тот же, что и в первом посте . Original dataset. Начнем с простых агрегаций. Давайте ответим на вопрос: сколько продаж и покупок было сделано в магазине? Simple aggregations and distribution charts. Итак, первый кусок кода делает простые агрегации. Я решил сразу добавить больше агрегаций (mean, median, max) т.к. в e-commerce крайне важно понимать насколько наша аудитория чувствительна к цене . Средний чек (AOV) у нас $459. Неплохо! Но в тоже время медиана (MedOV) = $152, а это значит, что 50% всех чеков намного ниже среднего. С другой стороны, это указывает на то, что должно быть также некоторое количество чеков, которые сильно выше медианы. И такие чеки есть - максимальный чек (MaxOV) = $23661 Интересно, а с

R - прекрасный язык для Data Science

Image
Обычно, когда я пишу очередной пост в своем блоге, я не вставляю туда код, потому как исхожу из того, что аналитикам и маркетологам важнее новые идеи и возможные инсайты. И вот недавно крутой маркетолог и аналитик  Alexey Kulichevsky  сделал большую и интересную шпаргалку (ссылка на пост с оригинальным кодом) для аналитиков про Python. Я зачитывался блогом Леши еще в далеком 2013 году и могу с уверенностью сказать, что он один из немногих, на кого я равнялся. Леша, проделал отличную работу показывая основные конструкции на Python, которыми аналитик будет оперировать на ежедневной основе. И мне пришла в голову идея показать, как задачи описанные Лешей, можно было решить на R. Прежде, чем мы начнем я сразу скажу, что фактически существует два мира R: классический современный, который строится на философии и наборе библиотек tidyverse   Я никогда не писал на классическом R, так как мне он НЕ кажется выразительным, компактным и быстрым.  Также я отмечу, что намного удобне