Posts

Showing posts with the label logistic regression

Drill-down: или как найти перспективную точку роста?

Image
Аналитика - это постоянный поиск сигналов. Часто аналитику приходится делать десятки срезов, прежде чем какой-то один из них окажется перспективным или хотя бы любопытным. А значит неплохо было бы найти способ, когда такой поиск можно сделать более управляемым, а в идеале - оптимальным. Недавно я наткнулся на одну статью , где описывался простой, быстрый способ находить перспективные срезы. Более того, при желании, такой подход можно автоматизировать. Любой бизнес так или иначе работает с воронками. Например, у вас есть лэндинг с формой регистрации и такой конверсией: Overall Conversion Rate. Сама по себе конверсия уже может нам что-то рассказать. Например, используя свой опыт или benchmarks мы можем сказать - мала она или велика. Также мы могли бы сравнить конверсию этого лэндинга с конверсиями других наших лэндингов.  Но, если мы хотим улучшить конверсию, нам определенно нужна другая (дополнительная) информация.  Подумав с минутку, можно прийти к мысли, что внутри этого лэнд...

h2o - лучший друг маркетолога в машинном обучении

Image
Часто маркетологи сталкиваются с неопределенностью: им нужно оценить вероятность какого-то события, имея под рукой набор признаков относящихся к этому событию. Такая задача обычно сводится в бинарной классификации т.е. прогнозированию одного из двух возможных исходов: да или нет (1 или 0). Сегодня мы рассмотрим платформу машинного обучения  h2o . Для меня эта платформа давно уже стала эталоном того, как с минимальными усилиями (как по предобработке данных так и по моделированию и пост оценке) можно быстро делать качественное прогнозирование на данных любого масштаба. Итак, у нас есть датасет клиентов со следующими характеристиками:  Age (Возраст) Income (Доход) Subscribe (флаг: 1 - подписан, 0- не подписан) Сырые данные выглядят вот так: raw data И мы хотим построить модель машинного обучения, которая позволит: предсказать флаг Подписки, а также  оценить качество такой модели машинного обучения. 1. Что такое h2o? Это Java-платформа и веб-интерфейс для работы с задачами ма...

Как построить профили клиента?

Image
Итак, сегодня мы разберем две простые техники, объединив которые вы можете создавать профайлы клиентов. Обычно, когда вы работаете с клиентами, вы сохраняете в Базу Данных их характеристики. Для примера я взял датасет, в котором по каждому клиенту есть такие характеристики: Age Income Subscribe С характеристиками Age и Income все понятно. Это возраст и сумма дохода. Есть также третья, целевая характеристика - Subscribe - есть ли у клиента платная подписка. Так вот, будучи маркетологами, наша с вами задача состоит в том, что понять какие профайлы клиентов в клиентской базе у нас есть. Для этого мы воспользуемся двумя простыми подходами: Information Value (IV) Logistic Regression (glm) Первый подход (IV) позволит проанализировать отдельно каждую из характеристик и выделить группы в которых доля платных подписок будет преобладать над долей тех, кто не подписался.  Второй подход (glm) позволит изучить датасет и спрогнозировать вероятность платной подписки. Так вот, объединив об...