Performancegewinn im Real-Time Advertising aus wissenschaftlicher Perspektive (Teil 1)

11. Dezember 2012
 

Im Laufe der letzten Jahre haben sich sowohl die Menge als auch der Detaillierungsgrad der Daten, die werbetreibenden Unternehmungen im Bereich des Onlinemarketing zur Verfügung stehen, deutlich erhöht. Gleichzeitig steigt mit zunehmender Vielfalt und Komplexität der Werbemöglichkeiten im Onlinebereich der Anspruch an das Management, diese Daten zu verstehen und analysieren, um die Effizienz und Effektivität der Werbeaktivitäten auch langfristig sicherzustellen. Insbesondere mit der Ankunft der neuen Werbetechnologie des Real-Time Advertising (RTA), in der Werbetreibende auf individueller Nutzerebene für die Anzeige ihrer Displaywerbung bieten – und das in Echtzeit – ist die Kenntnis über die Erfolgsaussichten (bspw. Click oder Conversion) einzelner Nutzer von höchster Bedeutung. Um Aussagen über Erfolgsaussichten eines einzelnen Nutzers machen zu können, ist die Kenntnis über den Einfluss zurückliegender Werbeaktivitäten – aber auch Onsite-Aktivitäten (Anzahl betrachteter Produkte etc.) – auf diese Erfolgsaussichten erforderlich.

Im Rahmen ihrer Forschungstätigkeiten am Institut für Elektronische Geschäftsprozesse an der Leuphana Universität Lüneburg haben Dr. Florian Nottorf und Prof. Dr. Burkhardt Funk ein mischverteiltes, binäres Logit Modell entwickelt, welches mithilfe Bayes’scher Statistik und Markov Chain Monte Carlo (MCMC)-Methoden berechnet wird. Es bildet den Wertbeitrag unterschiedlicher Werbeaktivitäten (bspw. Search und Retargeting) sowie deren Interaktionseffekte auf Ebene einzelner Nutzer ab. Genauso, wie die Anzahl der Erklärungsvariablen variieren kann (bspw. Anzahl betrachteter Werbekanäle), kann die zu erklärende Größe angepasst werden: es können damit zu jedem Zeitpunkt Aussagen über Klick- und/oder Kaufwahrscheinlichkeiten auf Ebene einzelner Nutzer gegeben werden.

Das Modell wurde anhand von Daten einer großen, deutschen Direktbank getestet. In dieser Untersuchung wurde der Einfluss unterschiedlicher Display Ads (Standard Display, Retargeting und Video) sowie von Paid Search Ads auf die Klickwahrscheinlichkeiten abgebildet und das Modell entsprechend angepasst:

wobei

.

In dem Modell sind mehrere Ad-spezifische Intercepts (Iist) integriert, die die Klickwahrscheinlichkeiten unterschiedlicher Nutzer (i) in einer bestimmten Session (s) zu einem bestimmten Zeitpunkt (t) berücksichtigen – bspw. unabhängig davon, ob und wieviele Werbeeinblendungen der jeweilige Nutzer bisher eingeblendet bekommen hat. Die Variable Xist berücksichtigt u.a. die kumulative Anzahl werbespezifischer Einblendungen innerhalb einer Session (s), die ein Nutzer (i) bis zum Zeitpunkt (t) bereits gesehen hat. Die Variable integriert darüberhinaus weitere Größen (bspw. die kumulative Anzahl von bisherigen Klicks). Die Variable Yis berücksichtigt die langfristigen, session-übergreifenden Effekte, die die Klickwahrscheinlichkeiten determinieren (bspw. die gesamte Anzahl an Werbeeinblendungen, die ein Nutzer bis einschließlich der letzten Session gesehen hat). Das Modell wird mithilfe Bayes’scher Statistik und Markov Chain Monte Carlo (MCMC)-Methoden berechnet.

Die Analysen haben ergeben, dass es für den hier vorliegenden Datensatz zwei unterschiedliche Gruppen von Nutzern gibt, die sich elementar in der Wahrnehmung bzw. Wirkung von Onlinewerbung unterscheiden: während bei dem Großteil der User (ca. 90%) jede eingeblendete Display Ad die Klickwahrscheinlichkeit verringert (demnach die Klickwahrscheinlichkeit der Nutzer bei der Anzeige der ersten Display Ad am größten ist), gibt es eine kleine Gruppe von Nutzern (10%), die werbeaffin auf Werbung reagiert. Bei dieser kleinen Gruppe (10%), erhöht die mehrmalige Anzeige von Display Ads die Klickwahrscheinlichkeiten.

Darüber hinaus sind positive Wechselwirkungen zwischen der Paid Search Ads und Display Ads festgestellt worden: die wiederholte Anzeige von Displaywerbung hat bei Nutzern, die bereits auf eine Paid Search Ad geklickt haben, einen weitaus positiveren Effekt auf die Wahrscheinlichkeit, auf eine Display Ad zu klicken,  als bei Nutzern, die noch nicht auf Paid Search Ads geklickt hatten.

Das Wissen, welche Nutzer wie auf Werbung reagieren und wie die Klickwahrscheinlichkeiten von Nutzern bestimmt werden können, eröffnet großes Potential in der Optimierung von der individuellen Auslieferung von Onlinewerbung, wie es bspw. im RTA der Fall ist. Anhand eines Out-Of-Sample Tests (Houldout-Test) können zum einen die Qualität der Vorhersagegenauigkeit und zum anderen das mögliche Einsparpotential, was durch die gezielte Auslieferung der Displaywerbung erreicht werden kann, verdeutlicht werden. Dafür werden die Klickwahrscheinlichkeiten in t+1 aller Nutzer errechnet, aufsteigend sortiert und in Dezile eingeteilt. Die Vorhersagegenauigkeit von Klicks durch das hier vorgestellte Modell ist dabei erstaunlich: während in dem Dezil mit den niedrigsten Klickwahrscheinlichkeiten nur 1,5% aller tatsächlichen Klicks angefallen sind, entfallen über 70% aller tatsächlichen Klicks in t+1 auf die Nutzer mit den 10% höchsten Klickwahrscheinlichkeiten.

Auf Basis dieses Wissens über die Klickwahrscheinlichkeiten einzelner Nutzer können nun Click-Through Rates (CTR) und – unter Berücksichtigung entsprechender Kosten für die Anzeige einer Display Ad (bspw. über TKP) – die erwarteten Cost Per Click (CPC) ermittelt werden – und dies auf Ebene einzelner Nutzer. Wird dieses Wissen nun in den RTA-Prozess integriert, können entsprechende Gebote für einzelne Ad-Impressions angepasst (erhöht oder gesenkt) werden, was die Performance im RTA nachhaltig steigert.

Testen