Raffinierte Algorithmen für das perfekte Sortiment

Die Bedeutung von Daten für das 21. Jahrhundert wird gerne in Metaphern ausgedrückt: Daten seien die neue Elektrizität, oder das neue Öl.
16 Juli 2020
Raffinierte Algorithmen für das perfekte Sortiment
Kontakt

Die Öl-Metapher ist insofern besonders interessant als sie die Bedeutung von Daten zweidimensional zum Ausdruck bringt. Sie sind einerseits unverzichtbar als Antrieb für die Wachstumsmaschinerie vieler Märkte. Andererseits sind Daten, genau wie Erdöl, in ihrem Urzustand – man spricht auch von „Datenseen“ – von geringem Nutzen. Erst die Raffinerie mit ihren Konversionsverfahren und Additiven macht aus dem Rohstoff ein hochwertiges Produkt.

Wenn Daten das Öl von heute sind, dann ist Data Science die Raffinerie. Hier werden gezielt bestimmte Dateneigenschaften verbessert und verschiedene Datentypen miteinander verbunden. Für den Endnutzer entsteht ein neues Produkt von höherer Qualität, weil es direkt auf seine Bedürfnisse und Ziele zugeschnitten ist. Was das konkret bedeutet, soll im Folgenden am Beispiel der Regaloptimierung im stationären Handel beispielhaft beschrieben werden. Wir zeigen wie unsere Perfect Category Software verschiedene Datentypen integriert und welcher konkrete Mehrwert sich daraus für den Anwender, in diesem Fall den Category Manager, ergibt.

Auf der Suche nach dem optimalen Sortiment

Markenhersteller und Händler verwenden Sortimentsoptimierungen, um die begrenzte Regalfläche in einer Produktkategorie möglichst effizient zu nutzen. Dafür stehen umfangreiche Verkaufsdaten zur Verfügung, die an Scannerkassen erfasst werden.

Raffinierte Algorithmen für das perfekte Sortiment
Scannerkassen liefern wöchentliche oder monatliche Daten zu Verkaufsvolumen und Umsatz aller Artikel in einer Kategorie.

So kann beispielsweise ein monatliches Ranking aller Produkte in einer Kategorie nach ihren Verkaufsdaten erstellt werden. Ein Regal mit Platz für 80 Artikel könnte dann mit den 80 umsatzstärksten Produkten gefüllt werden. Aber das wäre ein großer Fehler. Statt einfach den von Scannerkassen gespeisten Datensee abzupumpen, sollten lieber raffinierte Daten für eine gezielte Analyse genutzt werden.

Eine raffinierte Sortimentsoptimierung prüft, wie jedes Produkt im Regal zum Wachstum der Kategorie beiträgt. Dazu müssen wir den inkrementellen Umsatz jedes Produkts kennen, also den Teil des Gesamtumsatzes, der nicht auch von anderen Produkten geleistet werden kann. Wenn ein bestimmtes Produkt nicht erhältlich wäre, wie oft würden Käufer dann zu einem anderen Produkt im Regal greifen? Oder würden sie gar kein Produkt auswählen? Dieser Verlust des Umsatzes ist für den Händler kritisch. Wir bezeichnen den Teil des Produktumsatzes als inkrementell, der sich nicht auf andere Produkte transferieren lässt und deshalb besonders wertvoll für Hersteller und Händler ist. Genau hier muss die Optimierung ansetzen.

Inkrementelles Wachstum erfordert spezialisierte Daten

Die Quantifizierung inkrementeller Umsätze ist deutlich anspruchsvoller als das einfache Auszählen von Abverkäufen. Mit Perfect Category werden dafür Scannerdaten von Supermarktkassen mit Käuferdaten verknüpft. Letztere helfen uns, das Kaufentscheidungsverhalten zu verstehen und insbesondere die Entscheidungshierarchien: Welche Produktmerkmale lenken das Substitutionsverhalten in einer Kategorie und welche Eigenschaften sind weniger wichtig beim Kauf? Mit einem Teil der Handelsdatenbank wird zunächst ein Regressionsmodell „trainiert“, um das Substitutionsverhalten am Regal vorherzusagen. Ein anderer Teil der Datenbank wird dann verwendet, um das Modell anhand realer Out-of-stock-Situationen zu validieren.

Raffinierte Algorithmen für das perfekte Sortiment
Scannerkassen erfassen nicht die Kaufkriterien, nach denen Produkte ausgewählt und substituiert werden.

Beobachtungen von Haushaltskaufverhalten oder Befragungen von Käufern liefern ergänzende Informationen zu Entscheidungshierarchien.

Wenn die Struktur des Entscheidungsprozesses in der Kategorie bekannt ist, lassen sich zudem hypothetische Neuprodukte in eine bestehende Datenbank analytisch einfügen. Der Optimierungsalgorithmus kann dann das Volumen dieser hypothetischen Innovationen mit einbeziehen. Zusätzlich bestimmt er – was noch wichtiger ist – welche bestehenden Artikel an Volumen verlieren werden und wie die gesamte Kategorie von der Innovation profitiert.

Effiziente Regalflächennutzung: Artikel und Facings

Ein Händler wird allerdings nicht alle Artikel gleich behandeln, sondern den besonders erfolgreichen Produkten mehr Regalfläche einräumen. Das geschieht durch die Zuweisung von sogenannten „Facings“, also der Anzahl der frontal sichtbaren Packungen eines Artikels. Die Regalflächenoptimierung wird dadurch deutlich komplexer: Es reicht nicht, die besten Artikel zu bestimmen, stattdessen muss der optimale Mix aus Artikeln und Facings bestimmt werden. Erschwerend kommt hinzu, dass Scannerkassen nur erfassen, welche Artikel gekauft werden, aber nicht wie viele Packungen des gekauften Artikels neben- oder übereinander im Regal stehen. Auch hier müssen die Daten raffiniert werden, um das Problem zu lösen.

Wie schon bei der Substitutionsmodellierung hilft auch hier ein „Additiv“: Grundlagenstudien mit Käufern in verschiedenen Kategorien und Kanälen werden genutzt, um den Grenznutzen eines weiteren Facings zu quantifizieren und die Effekte verschiedener Einflussfaktoren zu bestimmen.

Raffinierte Algorithmen für das perfekte Sortiment
Scannerkassen liefern keine Informationen zur Regalsituation und zur relativen Sichtbarkeit eines gekauften Artikels.

Anhand von Käuferbeobachtungen können wir den Effekt von Facinganpassungen bestimmen. Der Grenznutzen eines zusätzlichen Facings für einen Artikel hängt zum Beispiel ab von der Packungsgröße und der Anzahl der schon sichtbaren Packungen. Die Integration der beiden Datenquellen, Scannerdaten einerseits und Käuferdaten andererseits, erlaubt nun auch komplexe Regalsimulationen: Wie reagiert der Kategorieumsatz, wenn diese fünf Produkte ausgelistet und jene drei hinzugenommen werden? Welche Facing-Anzahl wäre für jedes der verbleibenden 78 Produkte optimal? Lässt sich der Regalumsatz weiter optimieren, wenn mehr Artikel und weniger Facings zugelassen werden (oder umgekehrt)?

Vom Data Lake zur Data Science

Während der Besitz von Öl in größeren Mengen zweifellos reich macht, ist das bei Daten nur scheinbar der Fall. Nicht wer sie besitzt ist reich, sondern wer sie gezielt zu nutzen weiß. Die Metapher vom Datensee ist deshalb eine nützliche Ergänzung zum Ölbild, verweist sie doch auf den geringen Energiewert von stehenden Gewässern. Wer Daten gewinnbringend nutzen will, muss raffiniert vorgehen. Unser Beispiel zeigt, wie die Integration verschiedener Datenquellen und -typen genutzt werden kann, um komplexe Optimierungsprobleme zu lösen. Allein schon mit einem auf diese Weise optimierten Sortiment, das zeigen Perfect Category-Validierungen, kann der Umsatz einer Kategorie um durchschnittlich 3-5 Prozent gesteigert werden. Die Integration von Daten genau da, wo sie gebraucht werden, hat einen zweiten Effekt: Durch Echtzeit-Simulationen brauchen Category Manager gerade einmal die Hälfte der sonst üblichen Zeit für die Ableitung und Begründung von Regalempfehlungen.

Raffinierte Algorithmen für das perfekte Sortiment

Kontakt