Mobiles Arbeiten 4 - OCR - KI - Service
Digitalisieren, OCR, KI und menschlicher Service
Wie gut funktioniert eigentlich das automatische Auslesen von Belegen?
In dieser Mini-Serie zum mobilen Arbeiten haben wir uns die 4 Phasen einer Geschäftsreise angesehen und welche Möglichkeiten mobiles Arbeiten jeweils hat (Mobiles Arbeiten 1). Auch haben wir gezeigt, wie leicht es sein kann unterwegs bereits easy Belege zu erfassen und zu digitalisieren. (Mobiles Arbeiten 2). Und im dritten Teil haben wir uns dann mit der Erfassung der Verpflegungsmehraufwandsentschädigung (VMA) und dem km-Geld beschäftigt (Mobiles Arbeiten 3). Bei beiden Themen gibt es ganz sicher viele falsche Vorstellungen und einiges zu beachten.
Wenn Sie das interessiert und Sie diesen Blog-Beitrag noch nicht gelesen haben, finden Sie ihn hier:
Viele Anbieter werben heute mit einer APP für die Reisekostenabrechnung. Und im besten Fall werde dort Belege nicht nur digitalisiert, sondern auch wichtige Werte automatisch ausgelesen. Damit wollen wir uns heute befassen.
Digitalisierung von Belegen via Reisekosten-APP
Nahezu alle verfügbaren APPs für Reisekostenabrechnung digitalisieren natürlich die Belege. Viele Belege sind heute schon von Beginn an digital verfügbar. So bekommen Sie Rechnungen der Deutschen Bahn, der Fluggesellschaften, von Hotels usw. heute ja bereits häufig als PDF via E-Mail.
Nur wie kommt diese Rechnung jetzt in ein Tool für die Reisekostenabrechnung. Muss es erst ausgedruckt werden, um es dann wieder einzuscannen oder mit der Fotofunktion der APP aufzunehmen? Beides wird leider heute z.T. noch so angeboten oder umgesetzt. Mit unserer Lösung senden Sie diese E-Mail einfach an eine Ihnen zugeordnete System-E-Mail und das war alles. Das System erkennt automatisiert, dass es ein Beleg ist, der Ihnen zuzuordnen ist, hinterlegt und archiviert den Beleg GoBD-konform und liest die daten aus (Dazu kommen wir später noch einmal ausführlicher.) Und selbst wenn nicht Sie diese Rechnung bekommen, sondern die E-Mail im Travelmanagement oder der Assistenz ankommt, kann sie auch vor dort direkt ins System geschickt werden. Ein kleiner Hinweis im Betreff und schon landet der Beleg genau da, wo er hingehört.
Und auch bei der Art und Weise, wie die Belege via APP ins System kommen, gibt es wieder Unterschiede. Wird bspw. erst ein Foto mit der Kamera erzeugt und dann das Foto in die APP gezogen, widerspricht das dem Datenschutz, sobald private Smartphones benutzt werden. Denn betriebliche Daten dürfen in keinem Fall auf privaten Endgeräten gespeichert werden. Oder wollen Sie für alle Reisenden Firmen-Smartphones kaufen?
Die besseren Anbieter werden das berücksichtigen, aber prüfen Sie es ab, bevor es Ärger gibt. Im optimalen Fall wird gar nichts in der APP gespeichert. Sie dient lediglich als Portal zum Erfassen und Durchleiten.
Ein Scan, ein Foto, ein PDF usw. sind natürlich der erste Schritt für die Digitalisierung. Und wird das rechtskonform getan, danach auch noch GoBD-konform abgelegt und archiviert und haben Sie dann noch eine entsprechende Verfahrensdokumentation, sind Sie einen großen Schritt weiter und können die Papierbelege vernichten. Das spart ggf. nicht nur Zeit, sondern auch bares Geld, wie es uns letztens ein Kunde berichtet hat, der es sich gespart hat weitere verschließbare Aktenschränke zu kaufen für die er auch noch entsprechend sicheren Raum hätte anmieten müssen, da es ja auch für physische Archive hohe Anforderungen gibt. Oder wo legen Sie Ihre Reisekostenbelege heute ab?
Optical Character Recognition (OCR)
Neben der reinen Digitalisierung bietet eine gute Reisekosten-APP natürlich auch an, wichtige daten aus den Belegen auszulesen und im System für die Weiterverarbeitung zur Verfügung zu stellen.
Dafür wird in aller Regel eine OCR benutzt. Diese sind heute auch tatsächlich recht gut darin. Leider wird es oft unterlassen offen über die Limits zu reden. Klassische OCR’s sind nicht intelligent, sondern sind so gut oder schlecht, wie sie sind. Was heißt das konkret? Liest man aus Belegen Werte aus wie.
- Bruttobetrag
- Mehrwertsteuer
- Ort
- Datum
- Lieferant
Dann liegt die Erfolgsquote bei ca. 80 – 85%. Das hört sich richtig toll an. Oder?
Schauen wir uns das genauer an.
- Wir erinnern uns, dass OCR nicht intelligent ist. Liest sie auf einer bestimmten Art Beleg einen Wert falsch aus. Lernt sie NICHTS. D.h. beim nächsten Mal geht es wieder schief und wieder und wieder…
- Wenn 80% korrekt heißen würde, dass von 10 Belegen 8 richtig und 2 falsch wären, könnte ich als Reisender damit leben. Dann muss ich nicht mehr 10 erfassen, sondern nur noch 2 korrigieren.
Leider ist es aber nicht so. Was ist, wenn bei allen 10 Belegen 80% richtig und jeweils 20% falsch ist? Dann muss ich 10 von 10 Belegen nachkorrigieren. In dem Fall würde ich die APP nicht benutzen.
Können Sie sich die Stimmung vorstellen, wenn Sie ein neues System einführen und ankündigen, dass jetzt alles besser wird und dann das???
Ist künstliche Intelligenz (KI) die Lösung?
In den letzten Wochen konnte man nahezu täglich neue Meldungen über ChatGPT lesen oder hören. Sehr vereinfacht gesagt, handelt es sich um eine KI, welche auf Fragen eigenständig Antworten erzeugt und sogar ganze Artikel usw. schreiben kann.
KIen können heute in sehr vielen Fällen auch schon sehr gut Bilder erkennen (Und Schrift ist am Ende ein Bild.). Meist sind diese jedoch von Modell zu Modell nur auf EINE spezifische Art von Bild trainiert.
So ist es also in jedem Fall von Vorteil, wenn bspw. ein zweites System, welches auf maschinellem Lernen basiert den bereits digitalisierten Beleg noch ein zweites Mal prüft und dabei den digitalen Beleg mit den Werten vergleicht, welche die OCR ausgelesen hat. So kann ein technisches 4-Augenprinzip integriert werden. Und der große Vorteil ist dabei, dass ein solches Modell ständig dazulernt. Er kennt es einen spezifischen Fehler nicht und wird darauf trainiert, wird der Fehler beim nächsten Mal erkannt.
Wir haben ein solches technisches 4-Augen-Prinzip integriert. Und wissen deshalb auch um die Grenzen oder Schwierigkeiten selbst eines solchen Systems. Nehmen wir ein für uns Menschen so triviales Attribut wie das Rechnungsdatum. Aus unserer Erfahrung wissen wir ziemlich schnell und genau, wo auf der Rechnung das Rechnungsdatum steht (auch wenn es auf verschiedenen Belegen an verschiedenen Stellen stehen kann). Selbst wenn mehrere Datuums auf der Rechnung stehen, wie das z.B. auf einem Hotelbeleg sein kann (Anreisedatum, Abreisedatum, Buchungsdatum, zu zahlen bis-Datum usw.), wissen wir sehr schnell, welches das korrekte Rechnungsdatum ist.
Das zu lernen ist auch für KI Modelle nicht so einfach und braucht Zeit und jede Menge Daten.
Wir können also feststellen, dass eine Kombination aus OCR und einem zweiten lernenden System schon einmal deutlich besser ist. Doch wie gehen wir mit den von der KI erkannten Fehlern beim Auslesen und den Begrenzungen der KI um?
Der Mensch machts – Service ist mehr als nur Software oder APP‘s
Bei uns laufen alle OCR Fehler (und auch Fehler bei manuellen Eingaben usw.), welche die KI erkannt hat, in einen Service. Hier werden die entsprechend digitalisierten Belege von Menschen angesehen und die Werte in der Datenbank korrigiert.
Das hat gleich zwei Vorteile. Zum einen lernt die KI aus der Korrektur und was wichtiger ist, unsere Kunden müssen nahezu keine Belege nachbearbeiten. So erreichen wir in der Kombination von OCR, KI und menschlichem Service nahe 99% korrekte Belege. D.h. Reisende können sich komplett auf die ReisekostenAPP verlassen.
Da dieses technische 4-Augen-Prinzip und auch der menschliche Service etwas Zeit braucht, bieten wir unseren Kunden zwei Varianten an:
- Sehr schnelles Scannen und Auslesen via OCR
- Kombination OCR / KI / menschlicher Service (sehr viel genauer, etwas langsamer)
Welche Variante würden Sie wählen?
Und in den seltenen Fällen, wo dann doch etwas „durchrutscht“ werden die Prüfenden bei Ihrer Freigabe optisch hingewiesen, dass hier ein Fehler vorliegen könnte.
Fazit
Auf der einen Seite gibt es tatsächlich große Fortschritte in den Bereichen Digitalisierung, Texterkennung usw. Diese so in eine Lösung einzubinden, dass sie realen Nutzen für unsere Kunden bringen, ist unser Ziel. Gleichzeitig gibt es leider einige APP Anbieter, welche in den letzten Jahren auf diesen Markt streben, die mit auf den ersten Blick coolen APP’s um Kunden werben. Dort fehlen aber neben solchen ausgefeilten Kontrollmechanismen oft auch noch ganz andere fachliche Expertisen.
Prüfen Sie also sehr genau, was Sie kaufen und ob es neben einer offensichtlichen Digitalisierung auch tatsächlich hilft, Prozesse zu verschlanken, Ihre Reisenden zu entlasten und Ihnen eine rechtssichere und GoBD-konforme (Dokumentation nicht vergessen) Lösung gibt.
Im nächsten Teil der Miniserie werden wir uns abschließend noch mit dem Thema digitale Genehmigungsworkflows beschäftigen
Sollten Sie den Anfang verpasst haben, lesen Sie gern auch hier:
Um nichts zu verpassen, folgen Sie uns gern unter LinkedIn oder facebook.