Machine Learning (ML), das ist eines der vielen Buzzwörter, die rund um die Disziplin der Künstlichen Intelligenz ranken. Daher habe ich mich ein wenig umgesehen, was für ein besseres Verständnis in Sachen Machine Learning helfen kann. Und da das ziemlich viele Informationen sind, werde ich daraus einen Mehrteiler „bauen“. Viel Spaß beim Schmökern.

Zunächst einmal liegt dem Konzept des Machine Learning das Fachgebiet der Mustererkennung zugrunde. Und mit der beschäftigen sich viele kluge Köpfe bereits seit den 80er-Jahren. Nur dass zu dieser Zeit die Rechenleistung, wie wir sie heute kennen, einfach noch nicht bereit stand, zumindest nicht in dieser Breite. Dann aber brachten Nvidia und Co. leistungsstarke, bezahlbare GPU-Karten (Graphics Processesing Unit) auf den Markt, was Schwung brachte in das Machine Learning.

  • Multicore-CPUs & In-Memory-Datenbanken
  • Facebook, Twitter und Sensoren
  • Machine Learning-Lernmethoden

Dasselbe geschieht seit vielen Jahren auf Prozessorebene. Auch hier sind CPUs mit vielen, vielen Kernen weit verbreitet, und so konnten Algorithmen entwickelt werden, mit denen die Mustererkennung im Sinne des Machine Learning deutlich schneller verarbeitet werden kann als noch vor vielen Jahren. Und das auch wesentlich wirtschaftlicher, sprich kostengünstiger.

Doch auch auf Speicherebene erfuhrt das ML dank neuer und verbesserter Techniken und Technologien einen weiteren Schub. So enterte eine In-Memory-Datenbanktechnik namens SAP HANA vor allem das Big Data-Umfeld, in dem immer größere Datenmengen bewertet, analysiert und verarbeitet werden müssen. Und so ermöglicht SAP HANA das Verarbeiten großer Datenbestände direkt im Arbeitsspeicher, was den gesamten Prozess erheblich beschleunigt. Denn wo sonst Daten aus dem Festplattenspeicher genutzt werden mussten, erfolgt die Verarbeitung der Daten dank SAP HANA direkt im RAM. Und das hat natürlich wesentlich schnellere Verarbeitungszyklen zur Folge.

Das menschliche Gehirn als Vorbild Neuronaler Netze

Aber auch die Art der Daten, die für das Machine Learning erforderlich sind, hat deutlich zugenommen. So stehen neben den klassischen strukturierten Daten (aus Datenbanken und ähnlichen Quellen) immer mehr unstrukturierte Daten zur Verfügung.

Dazu gehören unter anderem Tweets und Posts aus den zahlreichen sozialen Netzwerken (Facebook, Twitter, etc.) genauso wie die Bilderfluten und digitalisierten Dokumente, mit denen zum Beispiel Neuronale Netze deutlich besser und schneller trainiert werden können als ohne diese Vielzahl an Daten.

Darüber hinaus profitiert das Machine Learning von einer Fülle an Quellen, die ebenfalls benötigte und notwendige Daten liefern. Dazu gehören beispielsweise Sensoren und Aktoren, die mittlerweile an jeder Ecke vorhanden sind. Dazu zählen Bewegungssensoren, die in Kraftfahrzeugen installiert sind und die auf dem Gebiet des Autonomen Fahren ein wesentlicher Baustein sind.

Das Machine Learning kennt zwei Verfahren, wie zugrunde liegende Systeme ihr notwendiges Wissen aufbauen. Das ist zum einen das symbolische Lernen, das klassischerweise bei der Mustererkennung eingesetzt wird, und zweitens das subsymbolische Lernen, so wie man es von Neuronalen Netzen kennt. Im wesentlichen unterscheidet man dabei zwischen explizitem und implizitem Wissen, also wie viel das antrainierte System von seinem Wissen preis gibt.

Zudem wird beim Machine Learning von unüberwachtem und überwachtem Lernen gesprochen. Diese zwei Ansätze kommen für unterschiedliche Anwendungen zum Einsatz. Beim unüberwachten Lernen fehlen konkrete Ein- und Ausgabewerte. Hier versucht das ML-System selbstständig, bestimmte Muster zu erkennen, die es anhand der Eingabedaten bewertet. Mit der Zeit lernt das System, jedem Input einen zugehörigen Output zuzuordnen.

Im Gegensatz dazu funktioniert das überwachte Lernen mithilfe von Paaren, die je einem Ein- und Ausgabewert zugewiesen werden. Damit weiß das System nach einer gewissen Zeit des Lernens auf jedes Eingabedatum das passende Ausgabedatum darzustellen.

Exemplarisch sei hier die automatisierte Handschrifterkennung genannt. Hier steht am Anfang ein (menschlicher) „Lehrer“, der dem ML-System Stück für Stück beibringt, geschriebene Buchstaben, Zahlen und Wörter in das richtige, digitale Gegenstück zu übersetzen.

Handschriterkennung ist eine mögliche Anwendung des Machine Learning

 

Und was das Ganze mit Neuronalen Netzen und Deep Learning zu tun hat, erfahrt ihr im nächsten Teil dieses Machine-Learning-Specials.

 

Ein Gedanke zu „ML-Special: Das sollten Sie über Machine Learning wissen

Kommentare sind geschlossen.