Все новости

Атрибуция мобильной аудитории в эпоху пост-IDFA: решения programmatic-платформы Hyper AdTech

Введение ограничений в области сбора данных со стороны глобальных интернет-компаний Apple и Google влечет серьезные изменения для игроков рекламного рынка, использующих идентификаторы пользователей для создания эффективных кампаний. Programmatic-платформа Hyper AdTech, входящая в IAB Russia и специализирующаяся на размещении видеорекламы в мобильной среде, поставила перед собой задачу разработать решение, которое позволило бы максимально точно определить профиль аудитории в мобильной среде. Создать такое решение было предложено участникам финала самого масштабного IT-соревнования в России — «Цифровой прорыв 2021».

Изменение  политик в отношении конфиденциальности существенно затруднили получение обезличенных данных пользователей, а также построение на их основе сегментов для таргетинга и атрибуции их поведения. Основополагающими факторами, влияющими на эффективность рекламных кампаний в мобильной среде являются охват аффинитивной аудитории брендов и качество рекламного контакта. Достижение заданных KPI обеспечивается благодаря использованию широкого спектра данных, получаемых по IDFA, таких как: соцдем профиль, интересы, уровень дохода, лояльность к покупке товарной категории, геолокация, а также паттерн поведения пользователя в контентной среде и взаимодействия с рекламными сообщениями.

Теперь же приложения не могут отслеживать IDFA пользователей по умолчанию и обязаны запрашивать разрешение на передачу данных, что означает потерю связи с профилем аудитории и существенно влияет на эффективность проведения рекламных кампаний.

Какие есть решения?

Ограничение передачи мобильных идентификаторов существенно влияет на работоспособность рекламных инструментов и результативность кампаний, в связи с этим разработка технологий по атрибуции пользователей является неизбежной и жизненно необходимой для рынка. На данный момент в качестве стандартизированных решений можно выделить такие как: SKAdNetwork, Fingerprinting и вероятностная атрибуция.

Apple предложила решение SKAdNetwork в качестве альтернативы IDFA. С помощью данного инструмента Apple дает возможность связывать показы и клики с установками приложения без раскрытия информации о пользователях и их устройствах. К недостаткам SKAdNetwork эксперты относят отложенную статистику о целевых действиях, непрозрачность системы аналитики, а также ограниченность количества кампаний и креативов. Эти и другие ограничения SKAdNetwork приводят к тому, что рекламодатели не могут точно определить LTV и ROI при In-App размещении или запустить ремаркетинговые кампании.

Fingerprinting не новая технология атрибуции. Она уже использовалась рекламодателями для определения пользователя в случае, если у SDK не было доступа к IDFA. Однако по мнению Apple такой способ комплексно противоречит установленным правилам сбора данных.

Вероятностная атрибуция подход, при котором предикция осуществляется на основе таких идентификаторов, как IP-адрес, тип устройства, браузера или операционной системы, но стоит отметить, что не все MMP (Mobile Measurement Partner) поддерживают такой тип атрибуции.

Все эти решения уже используются на глобальном рекламном рынке, но по отзывам имеют ряд минусов и являются не совсем очевидными.

В настоящее время различными российскими AdTech-платформами и компаниями, работающими с данными, также ведутся разработки технологий по идентификации аудитории в цифровой среде, но готовых решений на данный момент нет.

Решения Hyper AdTech

Programmatic-платформа Hyper AdTech поставила перед собой задачу разработать уникальное решение, которое позволит максимально точно определить профиль аудитории в мобильной среде на основе больших исторических данных, без использования уникального идентификатора мобильного устройства. 

За прошедший год на стороне платформы формировались гипотезы и наработки в области работы с данными. Накопленный опыт команды Hyper AdTech и важность задачи для рекламного рынка, определили необходимость разработки такого решения на уровне крупнейшего соревнования среди IT-специалистов России “Цифровой прорыв”. В финале конкурса победители прошедших тематических хакатонов, в сжатые сроки разрабатывают актуальные и инновационные технологические решения для ведущих компаний из различных отраслей.

Таким образом рекламная платформа Hyper AdTech стала одним из 12 кейсодержателей финала Хакатона “Цифровой прорыв 2021” с технологическим кейсом: «Решение по определению цифрового портрета аудитории в мобильной среде».

Участникам Хакатона был предоставлен датасет, состоящий из сегментов целевых аудиторий с различными историческими параметрами активности пользователей. На основе предложенных данных командам необходимо было создать алгоритмы, позволяющие выявлять поведенческие модели пользователей по косвенным признакам и определять профиль аудитории по полу, возрасту и интересам. 

На финальном этапе хакатона кейс привлек большое внимание и был выбран для решения максимальным количеством команд. Это является подтверждением высокого интереса специалистов к области работы с данными и актуальности данного решения для рекламной индустрии.

По итогам конкурса было выбрано 3 лучших решения. Рассмотрим каждое решение чуть подробнее.

Использование эмбедингов и иерархической кластеризации

Программное решение победителей основывается на алгоритме Catboost, который способен на основе сформированных эмбеддингов и косвенных признаков классифицировать сегмент, к которому принадлежит пользователь. Эмбендинги представляют из себя текстовые признаки общедоступных данных по названиям, описаниям, категориям и жанрам из магазинов приложений. В качестве косвенных признаков были взяты параметры, основанные на таких пользовательских характеристиках, как местоположение, время захода в приложение, день недели и операционная система. Командам нужно было не только классифицировать пользователей, но и выделить новые уникальные кластеры среди них. Отличительной особенностью решения команды стало применение эмбеддингов в том числе и для кластеризации. Использование текстовых признаков в дополнение к предоставленному участникам датасету, позволяет повысить точность модели. Командой был использован алгоритм HDBSCAN, который позволяет оперировать плотностью предоставляемых данных. Программное решение позволяет находить «соседей» по косвенным признакам и присваивает им определенный кластер, а также дает возможность определять уровень принадлежности пользователя к нему. Для 3D визуализации кластеров команда использовала библиотеку tensorflow. Уникальность подхода команды к решению задачи кластеризации также заключается в использовании алгоритма HDBSCAN, в то время как большинство участников конкурса предпочли использование K-Means. Разработанное решение показало наилучший результат с точки зрения процента попадания в модель по критерию ROC_AUC (критерий оценки качества классификатора), которое составило 91%.

Использование бустинга для классификации  

Решением команды, занявшей второе место, является разработка платформы для автоматической сегментации аудитории в мобильной среде, также без использования идентификатора мобильного устройства. Удобный веб-интерфейс позволяет наглядно показать принадлежность пользователя к определенному сегменту. Второй командой был использован такой же алгоритм классификации, как и первой, но в данном случае для кластеризации использовался алгоритм K-Means. На входе в алгоритм были задействованы только данные из датасета, в который входили показатели активности пользователя с разбивкой на определенные признаки, такие как: время, день недели и область, т.е. без использования сторонних данных. Работа алгоритма заключается в разделении датасета на N-кластеров с одинаковым отклонением внутри каждого, отталкиваясь от заданных внутри данных. Уникальность решения заключается в сегментации аудитории с использованием машинного обучения на основе данных активности пользователя, что позволяет сохранять качество таргетинга даже при ограничении доступа к идентификатору мобильного устройства.

Обогащение датасета из открытых источников

Замыкает тройку победителей команда, которая презентовала технологию для автоматического определения социально-демографических профилей пользователей в мобильной среде. Ключевым отличием разработки является возможность использования дополнительных данных о пользователях из общедоступных баз данных, социальных сетей и сторов мобильных приложений. Команда сфокусировала внимание именно на качестве трафика, достижение которого осуществлялось благодаря использованию комментариев пользователей, с целью выявления ключевой семантики, с возможностью определять и исключать нежелательные сегменты формируя их в black-list. Решение позволит сегментировать профили пользователей и определять релевантную аудиторию в связке косвенных и исторических данных. 

В совокупности все эти подходы обеспечивают классификацию трафика по косвенным признакам поведения пользователей и выделяют кластеры по социально-демографическим признакам. Это даст возможность максимально точно определять профиль аудитории в мобильной среде и позволит с большой точность таргетировать рекламу, в условиях ограничения передачи данных идентификаторов мобильных устройств. Алгоритмы выбранных решений легли в основу разработки нового уникального решения, финализация разработки которого запланирована на начало 2022 года. 

Залогом проведения эффективных и результативных рекламных кампаний в мобильной среде является точное попадание в целевую аудиторию бренда и интересы пользователей, а также определение совершаемых ими действий. Уверены, что разработанное решение существенно повысит прозрачность и привлекательность мобильного инвентаря для рекламодателей, а также положительно повлияет на весь цифровой рекламный рынок.

Ткачев Иван, директор по продукту programmatic-платформы Hyper AdTech:

"Верю, что in-app это новая медийная среда будущего, которая когда-нибудь вберет в себя лучшие практики как "классического" digital, так и традиционного телевидения и прессы. Вместе с командами "Цифрового прорыва" мы прошли долгий и интересный путь, и полученные инсайты помогут нам оперативнее ответить на вызовы этой новой медийной среды. Полученный опыт будет применяться нами уже в самое ближайшее время для улучшения сегментации in-app трафика, что безусловно поможет нам лучше оптимизировать закупку и целевые рекламодательские показатели. Новые алгоритмы и подходы не только помогают решать классические медийные задачи, но также и приближают нас к качественному выполнению performance-показателей в свете грядущего ужесточения приватности в digital и мобильной среде."

Сергей Коренков, заместитель генерального директора по развитию бизнеса сейлз-хауса СберСеллер: 

«Задача, которую Hyper AdTech поставила в рамках хакатона, действительно имеет особую актуальность на фоне серьезных изменений, касающихся конфиденциальности данных пользователей на цифровом рекламном рынке. От коллег по цеху все чаще слышу, что многие компании крайне заинтересованы в решении данной проблематики и в настоящее время ведут внутренние разработки. Кроме этого, есть зарубежные примеры стандартизированных подходов, которые пока не нашли широкого применения на российском рекламном рынке. В данном случае, убежден, что успешное использование полученных решений приведет к повышению привлекательности инвентаря Hyper AdTech для рекламодателей за счет более точного попадания в целевую аудиторию, а также, несомненно, выделит их платформу на фоне конкурентов на рынке digital-рекламы».