Сообщения

Outliers, anomalies и прочие выбросы в ваших данных

Изображение
Часто в ваших данных попадаются выбросы. С точки зрения маркетолога выбросы - это такие данные, которые выходят за ожидаемый диапазон значений.

Как с этим работать - тема сегодняшнего поста.

Чтобы проще было понимать о чем дальше будет идти речь, я сгенерировал 2 тестовых датасета. Каждый датасет состоит из таких полей:
порядковый номер записи (idx), средний чек заказа (AOV), средний чек первого заказа (first_AOV).
Первый датасет состоит из 100 записей и в нем нет outliers (выбросов).

Второй датасет состоит из 30 записей и в нем точно есть outliers (я вручную задал 2 значения выше диапазонов случайных значений, которыми я параметризировал датасеты).

Outliers

Ожидаемый диапазон значений понятие субъективное (иногда вы можете оценить его адекватно, но чаще - нет). Поэтому здесь лучше опираться на математическую базу.

Одно из самых простых и в тоже время рабочих определений дал в свое время известный математик Tukey: outlier это значение, которое выходит за рамки диапазона ± 1.5 * IQR.


Когда …

Активация клиентов - мощный источник роста бизнеса

Изображение
Для роста все бизнесы занимаются привлечением новых клиентов. Вы покупаете рекламу и получаете из нее новых клиентов. Это простая и понятная схема.

Однако, многие онлайн-сервисы часто предлагают клиенту зарегистрироваться.
Здесь, как правило, возможны два варианта:
покупка, где в фоном режиме клиента регистрируют в сервисерегистрация, только после которой можно совершить покупку Так вот шаг регистрации (с виду кажущийся незначительным) является важным дифференцирующим фактором, дающим возможность делать интересные исследования.
Мысль первая
Клиентов, которые зарегистрировались и готовы купить сразу (обычно в тот же день) очень не много.


Мы видим, что % клиентов, которые пришли, зарегистрировались и купили в тот же день (is_same_day_TRUE) - действительно мало. В примере выше, в зависимости от месяц привлечения, это, в среднем, около 5%.
Мысль вторая
Занимаясь улучшением привлечения через оптимизацию Landing Pages и Sign Up Forms мы можем улучшить эти показатели, однако, учитывая объемы кл…

Дисконты, которые могут убить ваш бизнес

Изображение
После поста "Несколько мыслей о дисконтах", мой друг data scientist Sergey Bryl, упомянул о своем опыте анализа клиентов, которые получали дисконты.

Смотрел churn rate на одном проекте в разрезе пришел клиент по демпинговой цене или близкой к обычной.По ритейл-клиентам около 2.5х разница на следующую покупку и на третью уже более 3х.По "оптовикам" это 6х... до третьей вообще почти никто не доходил.
Не долго думая, я решил посмотреть, а как будут обстоять дела с анализом, который я делал в прошлом посте, если я прежде промаркирую клиентов следующим образом:
клиенты, которые вообще не пользовались скидками (0)клиенты, у которых скидка была, как минимум, в первую покупку (1)клиенты, у которых скидка была, как минимум, со второй покупки (2+) Посмотрим вначале на доходность на клиента по 3-м группам:

На графике просматривается, что медиана у клиентов из группы (1) немного выше, чем у клиентов из группы (0). Т.е. скидка дающаяся на первую покупку все же подталкивает клиент…

Несколько мыслей о дисконтах

Изображение
Недавно я выступал на одном мероприятии. И там мы затронули тему дисконтов. Сегодня я хочу немного углубиться в этот вопрос. Начну со своей позиции.
Давать дисконты всем клиентам - бессмысленно. Часть клиентов, очевидно, купила бы и так.Сумма дисконта очень тонкий вопрос. Повышение суммы дисконта не гарантирует повышения дохода на клиента. Перед тем как давать дисконт нужно четко понимать свою цель:сгенерировать покупку, которая не состоялась бы без дисконтаповысить средний чек. Обсуждать такой вопрос без цифр достаточно сложно. Поэтому я решил подготовить несколько графиков на базе данных одного из e-commerce.

Начнем с начала.
Давать дисконты всем клиентам - бессмысленно. Часть клиентов купила бы и так
На графике выше четко видно, что клиентов покупающих без дисконта много (на уровне discount = 0 этих точек очень много, а потому они сливаются вместе и фактически образуют сплошную красную линию).

Для того, чтобы понять сколько точек слилось вместе, я добавил под осью Х вертикальные черт…

Кластерный анализ клиентов. Номинал покупки.

Изображение
Ранее, я в значительной степени полагался на Excel. На мой взгляд, это самый доступный и в тоже время недорогой из аналитических инструментов для маркетолога. Ведь, с одной стороны, Excel есть у многих пользователей. Обмениваться Excel-файлами очень легко. С другой стороны, к отчетам в Excel в значительной степени привыкли топ-менеджеры многих компаний.

Однако, со временем, я начал сталкиваться с ситуациями, где надо не просто что-то рассчитать, а понять почему цифра и/или тренд такие, какие есть, найти факторы, которые определили результат. Я активно пользуюсь сводными таблицами т.к. они позволяют быстро делать разные срезы (drill-down) и это дает свои плоды. Часто - но далеко не всегда.

В последнее время я больше думаю о базовой математике и алгоритмах, которые стоят за продвинутой аналитикой. Откладывать изучение и использование алгоритмов машинного обучения дальше уже нельзя. Это вопрос выживания для современного аналитика.

Для себя я планирую ~ раз в 4 недели описывать свой опыт …

Карта роста

Изображение
Десять лет тому назад я активно изучал наработки и практики от лучшей компании по стратегического консалтингу - McKinsey & Company.
Если у вас нет свободного времени, то хотя бы прочтите книгу от одного из бывших сотрудников этой компании: Принцип Пирамиды. Именно тогда я познакомился с такими крутыми техниками как MECE и деревья.

И вот несколько лет тому назад, готовясь к одной конференции с крутыми ребятами (Валик Гончаров, Дима Кудренко, Олег Лесов, Андрей Косецкий) я синтезировал схему, части который я использовал когда оценивал стартапы и/или работал в них.
Чем примечательна эта схема?
Она проста в понимании.
Читая это дерево слева направо, вы понимаете, что и откуда следует.
Она практична.
Фактически каждый элемент это метрика или вопрос, который м.б. покрыт метрикой.
Она совмещает тактику и стратегию.
Вам не нужно думать, чем бы еще заняться, и в тоже время вы видите картину в целом.Какие недостатки этой схемы?
Это схема не учитывает цикличность отношений с клиентом. Фактически …

Retention curve - вчерашний день аналитика

Изображение
Я давно хотел написать этот пост про retention curve (кривую удержания).

Дело в том, что современная клиентская аналитика развивается очень быстро. SaaS компаний с инструментами аналитики достаточно много. Но не каждая смогла сделать значимый вклад в новые подходы к аналитике.

Тем не менее, для себя я могу выделить следующие компании, которые сильно повлияли на мое видение аналитики и на мой подход к онлайн-маркетингу через аналитику. Итак,
в 2012 году я равнялся на Kissmetrics.com;в 2013 это была уже RJMetrics.com;в 2014 году это была Custora.com;в 2015 году это была Optimove.com И вот в 2016 году я познакомился с think-tank компанией Amplitude.com.

Мое глубокое убеждение в том, что компания предоставляющая аналитический продукт не удержит свои позиции, если будет просто создавать еще один продукт (даже если он будет немного быстрее и удобнее). Аналитическая компания должна искать новые способы выжать больше инсайтов из данных, отобразить суть происходящего коротко и предельно ясно.

Т…