targmath yandex

Post on 16-Jun-2015

460 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

κρυπτή

Математика таргетинга

κρυπτή

Таргетинги в интернете

способ ограничить коммуникацию интерактивность позволяет принимать

решение по каждому контакту география, сайт, формат и технология

баннера, слова на странице, слова из поиска, броузер, провайдер

параметры контакта c ID(регистрация, частота)

знание о пользователе

Самоцензура рекламы в Интернете ;)

κρυπτή

Аффинити

каждый человек ведет себя по разному в разное время

при анализе статистики- данные объединяются и усредняются

у рекламодателя нет точного знания как говорить с каждым потребителем, только со статистической группой

Большая часть из нас еще не определилась с соц.демом ;)

κρυπτή

Идея проекта

собрать статистику в разрезе пользователя/ID проанализировать выборку, про которую что-

либо точно известно найти закономерности отличающие одну

целевую группу от другой анализируем статистику каждого ID и

приводим к вероятности попадания в группу

Применяем дедуктивный метод ;)

κρυπτή

Источник знания (data)

privacy и сбор данных уникальный ID и время его жизни контекстность, как идеал майнинг информации данные о любых действиях

пользователя и их взаимосвязях

Логи и Размышления. Т. 2-128

Вероятностный подход

противоречивость и неполнота данных степень достоверности возможность перевзвешивания под

внешние факторы 100% аудитории выбираем лучших\характерных при

использованииОптимизируем монетку ;)

κρυπτή

Выделение факторов

анализируем зависимости между целевой группой и поведением

вычисляем метрики из любой известной информации

отбираем сильные факторы для конкретной классификации

несколько наборов факторов для разных аудиторий

для соц.дема используется 300 факторов никто их не знает)

κρυπτή

Машинное обучение

обучающая выборка

алгоритм ищет закономерности между признаком и логами

применяем формулу ко всем пользователям

Классификация

берем внешние категориисмотрим похожее «поведение»предполагаем, что этому пользователю

это свойственнооцениваем достоверность

предположения

Можно вычислить людей, которые живут в нечетных квартирах ;)

Цифры и факты

объемo 35 днейo 3 млрд. событийo 3,4 Tb в деньo 235 млн. IDo 730 тыс. обучающая

выборкаo 490 тыс. проверочнаяo 7,5Tb данные

технологии

oMap&Reduce

oMachine learning

oMatrixnet

o SVD (cингуляZрное

разложение)

κρυπτή

Результат и применение

проверяем TNSКорреляция с группой (пол- 78%)

выбираем лучшихповышаем аффинитивностьсоц.дем таргетинг на страницах

Яндексаматематический подход- как это

объяснить рынку?У нас есть такие приборы ;)

κρυπτή

Планы

мультипрофилиaudience extensionдолгосрочные интересытематический таргетинг модели потребительского поведенияAPI для внешнего использования

Автоматически отделять копытных от хищников ;)

κρυπτή

Почему это революция?

не на базе регистрацийвсе пользователикаждый пользователь- уникаленклассификаторы могут быть по чему угоднорегенерация информации, которой никогда

не былоданные собираются и пересчитываются

постоянно

Почта не работает, телеграф отменен, но вот мосты?

κρυπτή

Снятся ли андроидам электрические овцы?

распределение пола среди роботов:

60% роботы мальчики

40% роботы девочки

Спасибо

lev@yandex-team.ru

top related