Serie Buzzwords schnell erklärt – von AI bis Machine Learning  – Teil 1 „Machine Learning“

Die Sache mit den Buzzwords ist die: Man hört und liest sie gefühlt überall. Aber die Komplexität mancher Begriffe überfordert selbst Profis.

In unserer neuen Serie „Buzzwords schnell erklärt“ erfahren Sie ab jetzt kompakt Hintergründe zu den wichtigsten Schlagwörtern der digitalen Transformation. Und auch darüber hinaus. In Teil 1 unserer Serie geht es um den Begriff Machine Learning.
Informiert bleiben? Jetzt Newsletter abonnieren!
Beitrag teilen:

Kurze Geschichte des Machine Learnings

  • Machine Learning ist eine Disziplin aus der Computer Science

  • Der Fachbegriff stammt aus der Statistik (genauer genommen aus der Stochastik)

  • Geprägt wurde er vom englischen Mathematiker Thomas Bayes

  • Die ersten wissenschaftlichen Ausarbeitungen zum Thema gab es bereits 1988

  • Verschiedenste Algorithmen wurden anhand der angewandten Stochastiktheorien entwickelt

  • Komplexe Datenverarbeitungsverfahren waren durch die damalige „computational power“ nicht möglich

  • Die hardwaretechnischen Grenzen wurden 2010 durch die Entwicklung der Cloud gebrochen

  • Heute ist die Anwendung dieser vormals theoretischen Inhalte nicht mehr Großunternehmen vorbehalten, sondern einer breiteren Öffentlichkeit zugänglich.

Machine Learning – ein kurzer Abriss

Machine Learning ist quasi der technologische Starting Point der Artificial Intelligence Entwicklung und deshalb als Hintergrundthema besonders interessant. Klingt zu abgehoben? Weit entfernt: Fast jeder von uns kommt tagtäglich mit Machine Learning in Kontakt. Egal ob wir die Sprachsteuerung am Mobiltelefon benutzen, durch Anti-Spamprogramme unliebsame Mails für uns herausfiltern lassen oder auf Social Media Plattformen die Gesichtserkennung für Fotos nutzen – wir sind mittlerweile überall von selbstlernenden Systemen umgeben.

Was ist Machine Learning?

Machine Learning ist quasi der Wissenserwerb durch ein künstliches System mithilfe von selbstlernenden Algorithmen. Ein Algorithmus wiederum ist vereinfacht gesagt eine eindeutige Handlungsvorschrift, die für die Lösung eines Problems oder einer Klasse von Problemen eingesetzt wird und beispielsweise auf einen Computer übertragen werden kann. Algorithmen werden dann angewandt, wenn jemand eine hohe Anzahl an Daten besitzt, aus denen man als Mitarbeiter oder Mitarbeiterteam nicht mehr so einfach Schlüsse ziehen kann. Ein Machine Learning Programm analysiert Beispiele, sucht wiederkehrende Muster und versucht Gesetzmäßigkeiten zu erkennen und daraus beispielsweise Prognosen zu entwickeln. Durch das intelligente Verknüpfen von Daten können Zusammenhänge erkannt werden und Rückschlüsse daraus gezogen werden.

Wie funktioniert das?

Es gibt so viele unterschiedliche Methoden für Machine Learning wie Einsatzgebiete. Prinzipiell unterscheidet man jedoch zwischen zwei Arten:

Sogenannte „aussagenlogische Systeme“ und „künstliche neuronale Netze“. Die ersteren funktionieren auf der Basis von Symbolen, die zweiteren ähneln in ihrer Funktionsweise dem menschlichen Gehirn. (Siehe auch Infokasten Deep Learning) Die Umsetzung erfolgt entweder durch überwachtes oder unüberwachtes Lernen. (Dazu kommen wir ein anderes Mal im Detail).

Nehmen wir eine Katze als Beispiel für Bildsegmentierung. Um einem beispielsweise den Unterschied zwischen einer „Katze“ und einer „Nicht-Katze“ beizubringen, fütter ich es mit Bildern, die die typischen physiologischen Merkmale einer Katze wie Schnurhaare, Ohren, Größe, Fellstruktur etc. und die Bezeichnung „Katze“enthalten als Positivbeispiel und z.B. Bildern, die einen Otter oder ein Frettchen (haben ebenfalls Schnurhaare und ein Fell) als Negativbeispiel enthalten und lasse es dann später selbst entscheiden, ob auf einem Foto Katzen zu sehen sind oder nicht und bessere nach. Während die Klassifizierung anfangs noch ungenau sein wird, wird sie später immer genauer werden und nur mehr eine minimale Fehlerquote aufweisen.

Umgemünzt auf Unternehmensdaten, wie beispielsweise Umsatz-oder Gewinnzahlen, würde man so vorgehen:

Man teilt seinen kompletten Datensatz (z.B. Umsatz- und Gewinnzahlen des ganzen Konzerns) in zwei Teile, nämlich einen Trainingsdatensatz und einen Testdatensatz.

  1. Auf das Trainings-Set wird ein Modell aufgebaut
  2. Die Ergebnisse aus diesem trainierten statistischen Modell werden dann mit dem Test-Set verglichen und das Modell gegebenfalls angepasst
  3. Punkt 2 wird so lange gebetsmühlenartig durchgeführt, bis man ein brauchbares Prognosemodell erstellt hat
  4. Das neu erstellte Modell wird mit den neuen (aktuellen) Daten verwendet

Welches Modell für welche Zwecke?

Welches Verfahren schlussendlich auf einen Datensatz angewandt wird, hängt grundsätzlich von der gestellten Hypothese und der Art der Daten ab.

Eines der bekanntesten Verfahren ist die Regression. Die Regression ist ein statistisches Analyseverfahren, die zum Ziel hat, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen darzustellen. Eine Anwendung der Regression ist beispielsweise die Trennung von Signal (Funktion) und Rauschen (Fehler) sowie die Abschätzung des dabei gemachten Fehlers und die Prognose der weiteren Entwicklung der Variablen anhand der vorhandenen Datenpunkte. (Falls Sie es genau wissen wollen. ;-))

Auch noch oft bekannt ist das Clustering, wo Daten in Gruppen nach Gemeinsamkeiten aufgeteilt werden.

Ein auch sehr beliebtes Verfahren, vor allem in der Finanzbranche, ist die Anomaly Detection, wo bestimmte unübliche Muster im Datensatz entdeckt werden.

Zur guter Letzt gibt es auch noch die 2-Klassen-Klassifizierung und die Multi-Klassen-Klassifizierung, wo die Daten in Klassen unterteilt werden sollen, um z.B. Entscheidungsbäume generieren zu können.

Praktische Beispiele für Machine Learning

Die Anwendungsbereiche von Machine Learning sind bereits jetzt sehr zahlreich und werden laufend mehr:

  • Clustering im Marketing: Bestimmte Kundengruppen oder Produktsegmente werden in einzelne Cluster (Gruppen) unterteilt und ermöglichen damit ein gezielteres Marketing (targeted marketing), wodurch Marketingkosten reduziert und Marketingaktivitäten optimiert werden können.
  • Campaign Management im Marketing: Zukünftige Marketingkampagnen können anhand von historischen Daten optimiert werden.
  • Customer Lifetime Value im Verkauf: Anhand von Daten in einem CRM- (Customer Relationship Management) System können die Interaktionen mit (potentiellen) Kunden analysiert und dementsprechend angepasste Sales Pipelines erstellt werden.
  • Recommender im Verkauf: Man kann anhand von historischen Einkäufen von Kunden ein gewisses Schema erkennen, sei es ein gewisser Stil oder Preisklasse und mittels einer Analyse können passende Alternativen oder Ergänzungen angeboten werden, z.B. Kauf eines Drucker –> passender Toner dazu
  • Churn Prevention im Verkauf: Kunden, die mit dem Gedanken spielen, einen Vertrag zu kündigen, können vorausschauend kontaktiert werden, um eine Vertragsanpassung zu ermöglichen.
  • Predictive Maintenance in der Produktion: Mit vernetzten Sensoren an Produktionsmaschinen können Produktionsdaten ausgelesen werden und just-in-time analysiert werden, um mögliche Wartungen vorzeitig zu erkennen.
  • Faulty Part Detection in der Produktion: Mittels Sensoren können defekte Bauteile auf einem Fließband erkannt werden und aus dem Produktionsprozess vorzeitig herausgenommen werden.
  • Shop Floor Digitization im Verkauf: Anhand vom Kaufverhalten bzw. Bewegungsabläufen in einem Geschäft können auf Bildschirmen Vorschläge und maßgeschneiderte Rabatte für Kunden angezeigt werden.
  • Produktionsprozessoptimierung in der Produktion: Mit verschiedenen Sensoren und externen Daten können Produktionsprozesse optimiert werden, z.B. die richtige Anpassung der Raumtemperatur an den Produktionsprozess am Fließband
  • Health Monitoring in der Medizin: automatische Gesundheitschecks von Patienten und automatische Diagnosen

Machine Learning – spezielle Anwendungsbereiche in der Finanzbranche

Anomaly Detection bei Girokonten/Kreditkarten: mittels ausgetüftelten und gut trainierten Machine Learning Algorithmen kann mit einer schon sehr hohen Wahrscheinlichkeit prognostiziert werden, ob sich jemand in das Konto des Kundens Zugang erschafft hat und ungewöhnliche Transaktionen durchführt. Somit kann in kürzester Zeit der Besitzer des Kontos informiert werden.

Klassifizierung bei Kredit-/Leasingvertragvergabe: Anhand von Klassifizierungsalgorithmen kann die Kreditwürdigkeit von Kreditnehmern ausgerechnet werden. In weiterer Folge können die ausgerechneten Risiken in den Zinssatz einkalkuliert werden, bzw. bei riskanten Kunden der Kredit komplett verweigert werden.

Automatische Regressionsanalysen im Trading: Mit Regressionsanalysen können komplette Tradingstrategien von Aktien/Anleihen/Optionen modelliert werden (oder Finanzproduktportfolios erstellt werden) und automatische Kauf- bzw. Verkaufspositionen eingeleitet werden (meist wird auch von high-frequency trading gesprochen)

Buzzwords schnell erklärt

In unserer neuen Serie bringen wir Ihnen Schlagwörter der Digitalisierung näher. Haben Sie Themen, die Sie besonders interessieren?

Kontaktieren Sie uns!