R - построение когорт
Итак, я решил продолжить транслировать решения задач показанные Алексеем Куличевским на языке Python . В этот раз мы будем заниматься трансляцией на R задач по агрегации и построению когорт (ссылка на оригинал поста с кодом Python) . Датасет будем использовать тот же, что и в первом посте . Original dataset. Начнем с простых агрегаций. Давайте ответим на вопрос: сколько продаж и покупок было сделано в магазине? Simple aggregations and distribution charts. Итак, первый кусок кода делает простые агрегации. Я решил сразу добавить больше агрегаций (mean, median, max) т.к. в e-commerce крайне важно понимать насколько наша аудитория чувствительна к цене . Средний чек (AOV) у нас $459. Неплохо! Но в тоже время медиана (MedOV) = $152, а это значит, что 50% всех чеков намного ниже среднего. С другой стороны, это указывает на то, что должно быть также некоторое количество чеков, которые сильно выше медианы. И такие чеки есть - максимальный чек (MaxOV) = $23661 Интересно, а с