Kassenlose Einkaufsfilialen – ein Schritt in die Zukunft?

Amazon schreitet mit seiner „Just Walk Out“ Technologie Richtung autonomen Einzelhandel.

Am 4. März dieses Jahres eröffnet Amazon seinen ersten kassenlosen Supermarkt in Europa. Das Konzept ist für Händler und Verbraucher angenehm unkompliziert. Beim Betreten des Ladens authentifiziert sich der Kunde via App und wird mittels framebasierter Bilderkennung im Laden getrackt. Dabei unterstützen Sensoren wie Regalwaagen die Verfolgung des Einkaufs. Bezahlt wird automatisch beim Verlassen der Filiale.

Für Läden mit hochfrequentierten Besucherzahlen wie in Flughäfen oder Läden in Fußballstadien könnten von dieser Technologie am meisten profitieren.

Doch die Investitionskosten sind auch für Amazon sehr hoch, so schlägt das Aufrüsten einer Pilot-Filiale schätzungsweise mit drei Millionen US-Dollar schwer zu buche.

Unklar ist bis heute, wann die ersten Supermärkte nach Deutschland kommen werden.

Um dieses Konzept zu nutzen, ist es zwingend notwendig, dass alle Kunden den Datenschutzrichtlinien zugestimmt haben. Dies gestaltet sich jedoch schwierig bei deutschen Einzelhändlern, da Kundenüberwachung für die meisten einen schlechten Beigeschmack hat.

Kundenvertrauliche Informationen dürfen laut DSGVO nicht ohne Zustimmung analysiert und verarbeitet werden.

Die neue Art der Videoaufnahme

Unser Ansatz bei HS Analysis ist es das Kaufverhalten getrennt von der Person zu analysieren, um eine maximale Informationsgewinnung und den Schutz der Privatsphäre des Kunden zu garantieren.

Dank neuster Kameratechnologien, der eventbasierten Kameras, sind Rohdatenströme nicht wie bei konventionellen digitalen Kameras einzelne Bilder, sondern mathematische Matrizen die Pixelveränderungen erfassen. Neuromorphe Kameras, wie sie auch genannt werden, funktionieren ähnlich dem menschlichen Sehsinn.

Im Gegensatz zu konventionellen, auf Bildern basierende Kameras erkennt der eventbasierte Photodetektor lokale Änderungen einzelner Pixel. In Abbildung 1 wird der Unterschied an der Aufnahme einer laufenden Wildkatze veranschaulicht. Bei üblichen Kameras wird in getakteten Intervallen ein Bild gemacht. Alle Bildinformationen wie Hintergrund, Farben und Katze sind vorhanden. Der eventbasierte Photosensor erkennt nur Pixelveränderungen, in diesem Fall die laufende Katze und die Dauer der Änderung für jeden Pixel individuell.

Es werden also nur Bewegungen getrackt. Neben dem Schutz der Person bietet dieser Ansatz einen weiteren Vorteil. Die Datenmenge ist laut eignen Erfahrungswerten ungefähr fünf Mal niedriger als bei konventionellen digitalen Kameras. Dies wirkt sich positiv auf die Bildverarbeitung mit Neuronalen Netzen aus, da statische Bildinformationen nicht erfasst werden.

Erste Datenerhebungen wurden schon gemacht. Zu diesem Experiment gibt es auch Aufzeichnungen.

Biologische Programmierung mit Spiking Neural Networks

Wie die meisten Erfindungen, kommt auch der Ursprung der Spiking Neuronal Networks, kurz SNN aus der Natur. Die SNN-Architektur ist eine Imitation des Gehirns. Das menschliche Gehirn ist der leistungsfähigste und optimierteste Computer, den die Natur hervorgebracht hat. Wie in Abbildung 2 zu sehen ist, befindet sich das Gehirn die meiste Zeit im Ruhemodus, um Energie zu sparen.

Da ungefähr 10% der weltweiten CO2 Emissionen für Berechnungen, besonders für das Internet aber auch immer mehr für künstliche Intelligenz, ist von großem Interesse eine ressourcensparende Lösung zu finden. Eine Lösung könnten die SNNs sein.

Die Funktionsweise kann man sich wie folgt vorstellen. Der kleineste Baustein ist wie im Gehirn das Neuron. Die Eingänge, die an das Nervensystem geknüpft sind, können eine Spannung bei Erregung an das Neuron anlegen. Wird die Durchbruchsspannung, auch Threshold Spannung genannt überschritten, kommt es zu einer Erregung und Reaktion.

Eventbasierte Videos als Eingabe für SNNs

In Kombination mit eventbasierten Kameradaten wie in Kapitel Die neue Art der Videoaufnahme beschreiben, werden die Vorteile des Deep Learning Netzwerks vervielfacht. Denn das Konzept der Rechen-Sparsamkeit wirkt sich vor allem positiv auf den Energieverbrauch aus. Verändert sich das Eingabebild nicht, wird der Input nicht verarbeitet.

Die Vorteile für den Einzelhandel

Was bedeutet dies für den Einzelhandel? Amazons Konzept ist für viele Einzelhändler nicht umsetzbar. Es kann unmöglich garantiert werden, dass alle Kunden den Datenschutzrichtlinien zugestimmt haben. Es bedarf also eines Überwachungssystems, welches ohne Eingriff in die Privatsphäre das Kaufverhalten der Kunden analysieren kann.

Eventbasierte Daten wären eine vielversprechende Möglichkeit, Bewegungen zu tracken, ohne die Identität der Person zu enthüllen. Dies ein wichtiger Baustein für die Automatisierung des Einzelhandels. Jedoch kann ist unwahrscheinlich, über eventbasierte Datenwolken die gekauften Produkte zu identifizieren. Lösungsansätze könnten RFID Chips sein, Regalwagen oder ein weiteres neuronales Netz, dass auf Produkterkennung trainiert wurde.

Kaufverhalten

Es bewiesen, dass sich Kunden in ihrer Filiale der Wahl schon nach wenigen Besuchen sehr gut zurecht finden. Dies hat zur folge, dass die Einkaufsdauer drastisch Reduziert wird. Durch die Analyse der Kundenbewegungen durch die Filiale, kann ermittelt werden, wenn es Zeit wird die Regale umzuräumen.

Filialen Design

Bei genauerer Betrachtung des Verhaltens einzelner Personen, könnte ermittelt werden welche Produktplatzierungen optimiert werden könnten.

Kaufatmosphäre

Nichts ist schlechter für den Umsatz als gestresste Kunden. Mittels der Bewegungsanalyse lassen sich auch die Gefühle der Kunden bestimmten. Mittels der DVS-Überwachung könnten auch Stresspunkte in der Filiale ermittelt werden. Es könnten volle

HSA KIT

Künstliche Intelligenz wird für Bilderkennung im medizinischen Bereich schon seit Jahren bei HS Analysis erfolgreich genutzt.

Durch das Know-How und die akademische Expertise zeichnet sich HS Analysis aus und bietet ein solides Fundament für Forschung und Integration bestehender Technologien im Einsatzgebiet Einzelhandel. Diese Expertise wurde genutzt um das Annotationstool HSA KIT um das HSA TRAC Modul zu erweitern.

HSA TRAC

Mittels des HSA TRAC Moduls lassen sich eventbasierte Videodaten annotieren und aufbereiten.

Durch die Bestimmung und Annotation ausgewählter Key-Frames werden dazwischenliegende Frame-Annotationen interpoliert um eine möglichst genaue Objekt-Detektion zu garantieren.

Annotierte Groundtruth Daten können anschließend mit fortschrittlichen KI-Modulen analysiert werden.

Mittels der Vernetzung multipler Kamerasysteme können Räume virtuell Vernetzt werden. Diese Vernetzung ermöglicht ein flächendeckendes Tracking

Die Trainierten Modelle können innerhalb des HSA-TRAC ohne Programmierkenntnisse trainiert werden. Der Experte bekommt dabei eine zahlenbasierte und visuelle Übersicht der Ergebnisse verschiedener niedrigenergie KI-Modelle und kann sich für die optimalste Lösung entscheiden. Dieser Prozess des Modelltrainings wird iterativ aufgebaut und ermöglicht eine kontrollierte Erstellung der Analysemethoden. Dabei ist dieser Prozess reproduzierbar, nachvollziehbar und objektiv. So weiss der Nutzer, welche Anzahl und Version der GTDs zu welchen Versionen der niedrigenergie KI-Modellen gehört. So kann er kontrolliert eine Verschlechterung und Verbesserung der Modelle in Abhängigkeit von neu hinzugefügten GTDs verstehen.

Im HSA TRAC ist es möglich die erstellten KI-Modell für eine automatisierte Datenverarbeitung der niedrigenergie KI-Modelle werden für eine Massendatenauswertung

Training mittels GTD. Nach Training Validierung mit fundierter Modellauswertung visuell und mit Metriken. Modell Architekturen werden für spezielle USE-Cases bereitgestellt und können auch vom Nutzer optimiert werden. Der Benutzer bekommt zahlen als Ergebnis. Aufbauend auf diesen Resultaten ist die Software in der Lage, Prediktionen für die USE-CASES zu erstellen. Somit eine mögliche Entwicklung der Geschäftsprozesse vorher zu sehen. Dadurch wird die Optimierung innerhalb kürzester Zeit möglich. Beispielsweise werden so Lieferketten von Waren in Abhängigkeit der Region und zu liefernden Produkt optimiert, sodass der Empfänger seine bestellte Ware schnellstmöglich erhält.

HSA TRAC bietet eine hochqualitative Groundtruth Datenbibliothek.

Keine KI ist sofort perfekt und READY-TO-USE und muss auf jeweilige Datenszenarien angepasst und optimiert werden. Dies ist möglich ohne Programmier-Kenntnisse mit HSA TRAC. HSA liefert vollen Kunden-Support und volle Expertise in DVS-Kameraanbindungen. Unsere Deep-Learning-Ingineure haben ein tiefes Verständnis für die Art der eventbasierten Daten und können Deep Learning Netze perfekt an die USE-Cases und daraus entstehenden Datencluster anpassen.

Weiterlesen

weiterlesen