Speech Mining – die Zukunft der prozessorientierten Unternehmensführung?5 | 06 | 24

Speech Mining, Prozesse, Handy

In der heutigen schnelllebigen und digitalisierten Geschäftswelt sind Unternehmen ständig auf der Suche nach innovativen Methoden, um ihre Prozesse zu optimieren und ihre Effizienz zu steigern. Eine dieser vielversprechenden Methoden ist Speech Mining – eine Technologie, die das Potenzial hat, die Art und Weise, wie Unternehmen ihre Prozesse modellieren und verwalten, grundlegend zu verändern. Aber was genau ist Speech Mining und wie fügt es sich in den Kontext der Digitalisierung ein?

Speech Mining

Traditionelles Process Mining konzentriert sich auf die Analyse digitaler Spuren in IT-Systemen, was eine rein technische Betrachtung der Prozesse ermöglicht. Doch was passiert, wenn wir uns nicht mehr auf digitale Spuren, sondern auf das gesprochene Wort konzentrieren? Hier entsteht ein innovatives Konzept: Speech Mining. Vielleicht haben Sie noch nie von Speech Mining gehört – das ist verständlich, denn streng genommen existiert es noch nicht. Vielmehr ist es unsere visionäre Vorstellung davon, wie KI die Prozessmodellierung revolutionieren könnte.

Speech Mining vereint die Grundprinzipien von Speech Analytics und Audio Mining. Speech Analytics, auch als Interaktionsanalyse bekannt, nutzt künstliche Intelligenz (KI), um menschliche Sprache zu verstehen und zu analysieren. Audio Mining wiederum extrahiert Informationen aus Audioquellen. Durch die Verschmelzung dieser Prinzipien entsteht Speech Mining, das menschliche Interaktion und effiziente Prozessgestaltung miteinander verbindet.

Es handelt sich also um eine Methode, die menschliche Interaktion in Echtzeit nutzt, um Prozesse zu beschreiben und zu modellieren. Dieser Ansatz basiert auf der Extraktion prozessrelevanter Informationen aus gesprochener Kommunikation.

Die Vision hinter Speech Mining ist es, die Art und Weise zu verändern, wie wir Prozesse verstehen, dokumentieren und optimieren. Anstatt sich ausschließlich auf technische Daten zu stützen, ermöglicht Speech Mining eine humanzentrierte Prozessmodellierung in Echtzeit. Dadurch eröffnen sich neue Möglichkeiten für die Erfassung und Dokumentation von Prozessen, die bisher zeitaufwendig und fehleranfällig waren.

Praxisbeispiel: Von der Theorie zur Anwendung

Um die Theorie in die Praxis umzusetzen, betrachten wir ein konkretes Beispiel im Montagebereich. Traditionell wird der Ablauf eines Montageprozesses manuell dokumentiert. Dies geschieht häufig durch schriftliche Notizen und anschließende Abtippen. Mit Speech Mining könnte dieser Prozess jedoch erheblich vereinfacht werden:

  1. Beschreiben Sie einen Montagevorgang, während Sie ihn durchführen. Mit der Speech-to-Text-Funktion Ihres Smartphones können Sie Ihre gesprochene Beschreibung direkt in Text umwandeln. Das ist viel einfacher, als den Prozess während der Durchführung selbst zu verschriftlichen. Probieren Sie es beispielsweise mit der Montage eines Kugelschreibers.
  2. Kopieren Sie den transkribierten Text in ChatGPT und lassen ihn in Ihre gewünschte Formatierung für eine Montageanweisung transformieren.
  3. Machen Sie ein paar Bilder vom Montageprozess und lassen Sie ChatGPT4 die Bilder automatisch den Montageschritten zuordnen.
  4. Fertig ist die perfekte Montageanweisung.

Diese Funktionsweise, die jeder jetzt schon mit generativer KI nutzen kann, lässt sich auch weiterdenken:

Stellt man ein Raummikrofon auf und spricht in einer Gruppe über einen Prozess, kann das Gespräch transkribiert werden. Je strukturierter das Gespräch ist, desto besser. Das Transkript können Sie dann in eine generative KI eingeben, die das Gespräch in ein gewünschtes Ausgabeformat transformiert.

Auf diese Weise kann aus einem Gespräch über einen Prozess eine strukturierte Prozessbeschreibung/ein strukturiertes Prozessmodell erzeugt werden. Diese Form der Prozessmodellierung bedarf natürlich immer noch eines menschlichen Korrektivs, stellt aber eine sehr gute Basis für eine Prozessbeschreibung dar.

Was heißt das für die Prozessmodellierung? Deutlich weniger Aufwand!

Dadurch verbessert sich der Business Case für das Prozessmanagement erheblich. Im Ergebnis wird es wirtschaftlich sinnvoll, deutlich mehr Prozesse zu modellieren. Es ist durchaus denkbar, dass die Dokumentation des Managementsystems zu einem Digital Twin der vereinbarten Spielregeln und Best Practices des Unternehmens wird. Der Digital Twin ist dabei als virtuelles Abbild der Organisation zu verstehen, das die Summe aller Vereinbarungen und Absprachen und damit aller Prozessbeschreibungen, Arbeitsanweisungen und Rollendefinitionen darstellt.

KI-basierte Suche

Wir erleben gerade einen Wandel in der Art und Weise, wie wir Informationen suchen und finden. Statt langer Trefferlisten erwarten wir von Suchmaschinen immer häufiger direkte Antworten. Bald werde ich beispielsweise, wenn ich wissen möchte, ob ich die Freigabe für den Kauf von zehn Bleistiften selbst erteilen darf, von der Suchmaschine (oder besser: Antwortmaschine) direkt ein „Ja“ erhalten. Diese Antwort steht so nicht wörtlich in der Managementsystem-Dokumentation, kann aber von der KI automatisch und semantisch aus den vorhandenen Vorgaben und Dokumenten abgeleitet werden.

Zusätzlich könnte die Antwort auf Wunsch auch vorgelesen werden.

Da es jedoch zu Interpretationsfehlern durch die KI kommen kann, wäre es ideal, wenn die Suche neben der Antwort auch eine Trefferliste der Seiten anzeigt, aus denen die Antwort generiert wurde. Diese Technologie wird beispielsweise von der US-amerikanischen Firma Perplexity genutzt, die mit einer KI-basierten Suchmaschine Google Konkurrenz machen will.

Push von Managementsystem-Informationen

Oft denken Mitarbeitende nicht daran, in der Managementsystem-Dokumentation nach Informationen oder Antworten zu suchen, obwohl dort die Lösung zu finden wäre. Dieses Problem kann durch einen Managementsystem-Push gelöst werden. Ein Browser-Plugin wertet beispielsweise den Content des Browsers und den Kontext, in dem sich der Mitarbeitende bewegt, aus. Mit einem semantischen Mapping, idealerweise durch KI, aber auch manuell möglich, werden dann die relevanten Informationen aus der Managementsystem-Dokumentation bedarfsgerecht eingeblendet.

Ein Beispiel: Ein Mitarbeiter plant eine Bahnreise über eine entsprechende Website. Parallel erkennt das Browser-Plugin, dass es sich vermutlich um eine Dienstreise handelt und blendet die entsprechenden Informationen zur Planung von Dienstreisen auf dem Bildschirm ein.

Diese Ansätze hängen stark vom Aufwand der Prozessmodellierung ab. Wenn durch Speech-Mining Prozessmodellierung und -änderungen wenig Aufwand erfordern, könnte sie eine zentrale Plattform für die Kommunikation von Führung, Vorgaben und Wissen werden. Die notwendige Technologie ist bereits verfügbar.

 

Erfahren Sie, wie Sie Künstliche Intelligenz im Qualitätsmanagement einsetzen können

Welches Potential steckt hinter Künstlicher Intelligenz in Bezug auf die Arbeit im Qualitätsmanagement? Lernen Sie im Seminar „Künstliche Intelligenz im Qualitätsmanagement“ anhand praktischer Beispiele, wie Sie KI in Ihrem Unternehmen einsetzen können. Auf Basis aktueller Normen bekommen Sie einen Überblick über die wichtigsten Anforderungen beim Einsatz von KI. Jetzt anmelden »

Über den Autor: Carsten Behrens

Dr. Carsten Behrens ist Experte und Speaker für agile Managementsysteme. Seit 2009 ist er Geschäftsführer der Modell Aachen GmbH, eine Transfergesellschaft der RWTH Aachen und des Fraunhofer IPT. Mit rund 50 Mitarbeitern und über 1.400 namhaften Kunden ist das Software- und Beratungsunternehmen mit der Lösung Q.wiki ein führender Anbieter Interaktiver Managementsysteme auf Basis der Wiki-Technologie. In der DGQ engagiert er sich als Leiter des Fachkreises Organisationsentwicklung, als Delegierter sowie im Rahmen der Regionalkreisaktivitäten.