Datengetriebene Attribution: Voraussetzungen und Grenzen
Datengetriebene Attribution, oft als Data-Driven Attribution oder kurz DDA bezeichnet, gilt vielen als das ehrlichste Modell, weil es die Gewichte nicht vorgibt, sondern aus den eigenen Daten lernt. Das stimmt, hat aber Bedingungen. Ohne genug Conversions kippt das Modell ins Rauschen, ohne kanalübergreifende Datenbasis sieht es nur Ausschnitte. Dieser Artikel ordnet nüchtern ein, wie DDA lernt, welche Voraussetzungen sie braucht, wo ihre Grenzen liegen und wann sie sich gegenüber einem regelbasierten Modell wirklich lohnt.
Worum es geht
Die regelbasierten Attributionsmodelle haben eines gemeinsam: Du legst vorher fest, wie der Umsatz verteilt wird. Last-Click gibt alles dem letzten Touchpoint, Position-Based gibt Anfang und Ende je den größten Anteil, Linear teilt gleichmäßig auf. Die Regel ist transparent, aber sie ist eine Annahme. Sie unterstellt, dass deine echte Journey so aussieht, wie das Modell es vorgibt.
Datengetriebene Attribution dreht das um. Statt einer festen Regel lernt das Modell die Gewichte aus deinen eigenen Conversion-Daten. Es schaut sich an, wie deine Journeys tatsächlich verlaufen, und schätzt für jeden Touchpoint, wie viel er zur Conversion beigetragen hat. Die Verteilung ist damit nicht mehr deine Annahme, sondern ein Muster, das aus den Daten kommt. Genau deshalb gilt DDA im Prinzip als das ehrlichste Modell.
Das Wort Prinzip steht hier mit Absicht. Datengetrieben ist nicht automatisch besser als regelbasiert. Es ist besser unter Bedingungen: genug Daten, ein Kanalmix, der eine feste Regel überfordert, und eine Datenbasis, die alle relevanten Touchpoints kennt. Sind diese Bedingungen nicht erfüllt, lernt das Modell Zufall statt Muster und wirkt dadurch präziser, als es ist. Dieser Artikel zeigt, woran du erkennst, ob die Voraussetzungen bei dir gegeben sind.
Zurück zum Überblick: Multi-Touch Attribution, der vollständige Leitfaden. Im Glossar: Attributionsmodell, Multi-Touch-Attribution.
Wie datengetriebene Attribution lernt
Der Kern jedes datengetriebenen Modells ist ein Vergleich. Das Modell nimmt alle beobachteten Journeys und fragt für jeden Touchpoint: Wie verändert sich die Conversion-Wahrscheinlichkeit, wenn dieser Touchpoint in der Journey vorkommt, und wie sieht es aus, wenn er fehlt. Aus diesem Unterschied leitet es ab, wie viel der Touchpoint tatsächlich beigetragen hat.
Ein vereinfachtes Beispiel macht das greifbar. Nehmen wir an, das Modell beobachtet zwei Gruppen von Journeys. In der einen Gruppe kommt eine Meta-Anzeige als früher Touchpoint vor, in der anderen nicht. Wenn die Journeys mit der Meta-Anzeige spürbar häufiger zur Conversion führen als die ohne, dann hat dieser Touchpoint einen echten Beitrag geleistet, und das Modell weist ihm entsprechend Gewicht zu. Macht die Meta-Anzeige dagegen keinen erkennbaren Unterschied, bekommt sie wenig oder nichts.
Die Shapley-Grundidee
Hinter vielen datengetriebenen Modellen steckt eine Idee aus der Spieltheorie, der sogenannte Shapley-Wert. Die ursprüngliche Frage lautet: Wenn mehrere Spieler gemeinsam ein Ergebnis erzielen, welchen fairen Anteil hat jeder einzelne daran. Die Antwort findet man, indem man durchspielt, wie sich das Ergebnis ändert, je nachdem ob ein Spieler dabei ist oder nicht, und das über alle möglichen Reihenfolgen mittelt.
Übertragen auf Attribution sind die Spieler die Touchpoints und das Ergebnis ist die Conversion. Das Modell betrachtet, wie sich die Conversion-Wahrscheinlichkeit verändert, wenn man einen Touchpoint zu einer Journey hinzunimmt oder weglässt, und bildet daraus über viele Kombinationen einen fairen Beitragswert. Das ist kein Marketing-Zauber, sondern angewandte Statistik. Der Vorteil gegenüber einer festen Regel: Das Modell unterstellt keinen Verlauf, es misst ihn.
In der Praxis nutzen die Modelle Vereinfachungen und Näherungen, weil sich nicht alle Kombinationen exakt durchrechnen lassen. Das ändert nichts an der Grundlogik. Wichtig ist nur zu verstehen: DDA gewichtet nicht nach Bauchgefühl, sondern nach dem gemessenen Unterschied, den ein Touchpoint macht. Und dieser Unterschied lässt sich nur dann sauber messen, wenn genug Beobachtungen vorliegen. Damit sind wir bei der ersten harten Voraussetzung.
Wie sich die einzelnen Modelle gegenüberstehen: Attributionsmodell auswählen. Im Glossar: Touchpoint, Conversion.
Welche Daten du brauchst
Datengetriebene Attribution braucht Futter. Sie vergleicht Journeys mit und ohne einen Touchpoint, und dieser Vergleich wird erst dann belastbar, wenn von beiden Arten genug Fälle vorliegen. Bei dünnem Volumen ist der Unterschied zwischen zwei Gruppen kaum von Zufall zu unterscheiden, und das Modell verwechselt Rauschen mit Signal.
Genug Conversions pro Monat
Die entscheidende Größe ist die Zahl der Conversions in einem überschaubaren Zeitraum, üblicherweise pro Monat. Eine pauschale Mindestzahl gilt nicht für jeden Shop, weil sie von der Zahl der Kanäle und der Vielfalt der Journeys abhängt. Das Prinzip ist aber eindeutig: Je mehr Kanäle und je verschiedenere Journey-Verläufe du hast, desto mehr Conversions braucht das Modell, um jeden Touchpoint sauber gegen den Rest abzugrenzen. Plattformen, die DDA anbieten, koppeln die Verfügbarkeit deshalb oft an eine Volumen-Schwelle und fallen darunter automatisch auf ein einfacheres Modell zurück.
Vollständige Journeys statt Bruchstücke
Neben der Menge zählt die Vollständigkeit. Wenn ein erheblicher Teil der Touchpoints gar nicht erfasst wird, etwa weil die Einwilligung fehlt oder Browser-Restriktionen Klicks verschlucken, lernt das Modell auf einer Journey mit Löchern. Es kann nur gewichten, was es sieht. Fehlende frühe Touchpoints führen dann systematisch dazu, dass die Awareness-Kanäle unterschätzt werden, also ausgerechnet das, was Multi-Touch eigentlich sichtbar machen soll.
Wie groß diese Lücke werden kann, zeigt sich in unseren Website-Audits. Bei den von uns geprüften Shops bleibt regelmäßig ein erheblicher Teil der Bestellungen, oft über ein Drittel, ohne sauber erkannten Channel. Genau diese Bestellungen kann ein datengetriebenes Modell nicht korrekt verarbeiten, weil die Touchpoint-Daten dahinter fehlen. Bevor du in DDA investierst, lohnt sich deshalb der Blick auf die Datenbasis: Ein gutes Modell auf lückenhaften Daten bleibt ein lückenhaftes Ergebnis.
Konsistente Touchpoint-Erfassung
Schließlich muss die Erfassung über alle Kanäle hinweg nach derselben Logik funktionieren. Wenn ein Kanal serverseitig sauber getrackt wird und ein anderer nur lückenhaft im Browser, verzerrt das die gelernten Gewichte, ohne dass es im Modell sichtbar wird. Eine einheitliche, einwilligungskonforme Datenerfassung ist damit keine Kür, sondern die Voraussetzung dafür, dass datengetriebene Attribution überhaupt verlässliche Werte liefert.
Die Datenbasis prüfen: kostenloses Website-Audit. Zur sauberen Erfassung über Kanäle hinweg: Customer-Journey-Tracking.
Die Grenzen von DDA
Datengetriebene Attribution wird gern als Endpunkt der Entwicklung verkauft, als das Modell, das alle anderen ablöst. So einfach ist es nicht. DDA hat eigene Schwächen, die in der Vermarktung gern untergehen.
Black-Box und schwere Erklärbarkeit
Der größte praktische Nachteil: Datengetriebene Modelle sind weniger transparent als regelbasierte. Bei Position-Based kann jeder im Team nachvollziehen, warum ein Touchpoint vierzig oder zwanzig Prozent bekommt. Bei DDA ergibt sich das Gewicht aus einer statistischen Schätzung über viele Journeys. Warum ein Kanal in einem Monat mehr Gewicht bekommt als im nächsten, ist nicht immer leicht in einem Satz zu erklären. Das senkt die Akzeptanz, gerade wenn Budget-Entscheidungen begründet werden müssen.
Kippt bei kleinem Volumen ins Rauschen
Die zweite Grenze hängt direkt an den Datenvoraussetzungen. Reicht das Volumen nicht, lernt das Modell zufällige Schwankungen und stellt sie als Erkenntnis dar. Das ist besonders tückisch, weil ein datengetriebenes Modell auch bei dünnen Daten konkrete Zahlen ausgibt. Diese Zahlen wirken belastbar, sind es aber nicht. Ein einfaches, durchschaubares Modell, das offen mit einer Annahme arbeitet, ist in dieser Lage ehrlicher als ein komplexes, das eine Genauigkeit vortäuscht, die seine Datenbasis nicht hergibt.
Bewegliche Gewichte erschweren Vergleiche
Weil DDA laufend aus neuen Daten lernt, können sich die Gewichte über die Zeit verschieben. Das ist gewollt, erschwert aber den Vergleich zweier Zeiträume: Wenn sich die Zahlen ändern, weiß man nicht sofort, ob sich die Realität verändert hat oder nur das Modell neu kalibriert wurde. Regelbasierte Modelle sind hier stabiler, weil ihre Logik konstant bleibt. Für die nüchterne Steuerung kann es deshalb sinnvoll sein, ein datengetriebenes Modell gegen ein stabiles regelbasiertes zu spiegeln und auf die Differenz zu schauen, statt blind dem komplexeren Modell zu folgen.
Der direkte Vergleich der Logiken: Last-Click vs. Multi-Touch.
Plattform-DDA vs. unabhängige DDA
Datengetriebene Attribution gibt es nicht nur als einen Ansatz. Es gibt die DDA der großen Werbeplattformen und es gibt unabhängige, kanalübergreifende DDA. Der Unterschied ist nicht technisch fein, er ist grundlegend, und er entscheidet darüber, ob die gelernten Gewichte überhaupt etwas wert sind.
Jede Plattform sieht nur ihre eigene Welt
Googles datengetriebenes Modell rechnet auf den Daten, die Google vorliegen. Es sieht die Touchpoints aus dem Google-Universum, also Search, Shopping, YouTube, Display. Was davor oder dazwischen auf Meta passiert ist, sieht es nicht. Metas Modell ist umgekehrt blind für die Google-Kontakte. Jede Plattform schreibt sich dadurch genau den Anteil zu, den sie aus ihrer eigenen Perspektive erkennt, und keine Plattform kennt die ganze Journey.
Die Folge ist ein vertrautes Problem: Addiert man die Conversions, die Google und Meta sich jeweils zuschreiben, liegt die Summe oft über den tatsächlichen Bestellungen. Beide attribuieren dieselbe Conversion teilweise sich selbst, weil keine die Touchpoints der anderen abziehen kann. Datengetrieben hin oder her: Solange das Modell nur einen Ausschnitt der Journey kennt, verteilt es Gewichte auf einer unvollständigen Grundlage.
Kanalübergreifend braucht eine zentrale Schicht
Wer datengetrieben über alle Kanäle hinweg attribuieren will, kommt um eine zentrale Schicht nicht herum. Diese Schicht sammelt die Touchpoints aus allen Quellen, ordnet sie der richtigen Journey zu, dedupliziert doppelte Kontakte und legt erst dann ein Modell darüber. Nur so sieht das Modell die vollständige Journey, statt sich an dem zu orientieren, was eine einzelne Plattform zufällig erfasst hat.
Diese zentrale Schicht ist der eigentliche Unterschied zwischen Plattform-DDA und unabhängiger DDA. Die Mechanik des Lernens ist in beiden Fällen ähnlich, die Datenbasis ist es nicht. Eine datengetriebene Gewichtung auf vollständigen, kanalübergreifenden Daten beantwortet eine andere Frage als die jeweilige Plattform-Sicht, und es ist die Frage, die für die Budget-Verteilung über Kanäle hinweg zählt.
Mehr zum Vergleich von Plattform-Messung und unabhängiger Messung: Attribution in Google Ads und Meta. Die zentrale Schicht in der Praxis: Multi-Channel Attribution.
Wann sich datengetrieben lohnt
Datengetriebene Attribution ist kein Standard-Upgrade, das jeder Shop machen sollte. Sie lohnt sich, wenn zwei Bedingungen zusammenkommen. Fehlt eine davon, ist ein regelbasiertes Modell die nüchternere und oft bessere Wahl.
Bedingung eins: genug Volumen
Ohne ausreichend Conversions pro Monat kippt das Modell ins Rauschen, wie in den vorigen Abschnitten gezeigt. Das ist die harte Eintrittskarte. Liegt dein Volumen darunter, bringt dir DDA keine bessere, sondern eine scheinbar genauere und damit gefährlichere Sicht. In diesem Fall fährst du mit Position-Based oder Time-Decay besser, weil diese Modelle auch bei wenig Daten stabil und nachvollziehbar bleiben.
Bedingung zwei: komplexer Kanalmix
Die zweite Bedingung ist die Komplexität deines Kanalmix. Wenn fast alle Verkäufe über ein bis zwei kurze, suchgetriebene Journeys laufen, bildet eine feste Regel diese Welt sauber ab, und der Mehraufwand für DDA lohnt nicht. Erst wenn viele Kanäle mit unterschiedlichen Rollen beteiligt sind, Awareness über Meta, Vergleich über Preisportale, Abschluss über Brand-Search, Wiederkehr über E-Mail, wird der Verlauf so vielschichtig, dass keine starre Regel ihn mehr sauber trifft. Genau dort spielt datengetrieben seine Stärke aus.
Beides zusammen, dann lohnt es sich
Die Faustregel ist also einfach: viel Volumen plus komplexer Kanalmix gleich ernsthafter Kandidat für DDA. Ein hohes Volumen bei simplem Kanalmix braucht die Komplexität nicht, ein komplexer Mix bei niedrigem Volumen verträgt sie nicht. Erst die Kombination rechtfertigt den Schritt. Und selbst dann gilt: Spiegele das datengetriebene Modell gegen ein stabiles regelbasiertes und gegen unabhängige Signale, statt ihm blind zu vertrauen. Ein Modell ist ein Werkzeug, kein Orakel.
Wer die Voraussetzungen erfüllt und kanalübergreifend datengetrieben attribuieren will, braucht beides: die zentrale Datenschicht aus dem vorigen Abschnitt und ein Modell, das mehrere Logiken nebeneinander rechnen lässt. In DataFirst Track laufen regelbasierte und datengetriebene Modelle auf derselben, deduplizierten Touchpoint-Basis, sodass du die Sichten direkt vergleichen kannst, statt dich auf eine festzulegen.
Modelle an einer Beispiel-Journey durchrechnen: der Attribution-Rechner. Mehrere Modelle nebeneinander im Produkt: Multi-Touch Attribution in DataFirst Track.
Häufige Fragen zu datengetriebener Attribution
Was ist datengetriebene Attribution einfach erklärt?
Datengetriebene Attribution, kurz DDA, verteilt den Umsatz nicht nach einer festen Regel, sondern lernt die Gewichte aus deinen eigenen Conversion-Daten. Das Modell vergleicht Journeys, in denen ein bestimmter Touchpoint vorkam, mit Journeys, in denen er fehlte, und schätzt daraus, wie viel dieser Touchpoint tatsächlich zur Conversion beigetragen hat. Statt einer Annahme bildet es das echte Muster deines Shops ab.
Wie viele Conversions braucht datengetriebene Attribution?
Eine harte Zahl gilt nicht für jeden Shop, das Prinzip schon: Das Modell braucht genug Conversions pro Monat, damit der Unterschied zwischen Journeys mit und ohne einen Touchpoint statistisch belastbar wird. Bei niedrigem Volumen lernt es eher Zufall als Muster. Als grobe Orientierung gilt, dass die Gewichte erst stabil werden, wenn pro Kanal über einen längeren Zeitraum genug Beobachtungen zusammenkommen. Bleibt das Volumen dünn, ist ein regelbasiertes Modell die ehrlichere Wahl.
Was ist die Shapley-Methode bei der Attribution?
Die Shapley-Idee stammt aus der Spieltheorie und beantwortet die Frage, welchen Beitrag ein einzelner Mitspieler zum gemeinsamen Ergebnis leistet. Übertragen auf Attribution heißt das: Wie viel ändert sich an der Conversion-Wahrscheinlichkeit, wenn ein Touchpoint in der Journey vorkommt oder nicht. Indem das Modell viele solcher Vergleiche bildet und mittelt, schätzt es den fairen Anteil jedes Touchpoints. Viele datengetriebene Modelle bauen auf dieser Grundidee auf.
Ist datengetriebene Attribution besser als regelbasierte?
Nicht pauschal. Datengetrieben ist im Prinzip ehrlicher, weil es die Realität deines Shops abbildet statt einer Annahme. Es setzt aber genug Volumen voraus und ist weniger transparent. Regelbasierte Modelle sind nachvollziehbar, stabil und funktionieren auch bei wenig Daten. Welcher Ansatz passt, hängt von deiner Datenlage und deinem Kanalmix ab, nicht von einer Glaubensfrage. Bei dünnem Volumen schlägt ein einfaches Modell ein datengetriebenes, das nur Rauschen lernt.
Warum sehen Google und Meta bei DDA jeweils nur die eigenen Kanäle?
Die datengetriebenen Modelle der Plattformen rechnen auf den Daten, die der jeweiligen Plattform vorliegen. Googles Modell kennt die Touchpoints aus dem Google-Universum, sieht aber die Meta-Kontakte einer Journey nicht. Metas Modell sieht umgekehrt die Google-Kontakte nicht. Jede Plattform schreibt sich dadurch den Anteil zu, den sie aus ihrer eigenen Sicht erkennt. Für kanalübergreifende DDA brauchst du eine zentrale Schicht, die alle Touchpoints zusammenführt, bevor ein Modell darüber rechnet.
Wann lohnt sich der Umstieg auf datengetriebene Attribution?
Wenn zwei Dinge zusammenkommen: genug Conversion-Volumen pro Monat und ein Kanalmix, der komplex genug ist, dass keine feste Regel ihn sauber abbildet. Hast du überwiegend kurze, suchgetriebene Journeys oder niedriges Volumen, bleibt ein regelbasiertes Modell die bessere Wahl. Verteilst du dagegen Budget über viele Kanäle mit unterschiedlichen Rollen und genug Daten, fängt datengetrieben Muster ein, die eine starre Regel übersieht.