Transfer Learning - rasche Erfolge mit wenigen Daten

Transfer Learning ist ein wichtiger Trend im Bereich der KI. Breno Faria, AI-Experte bei IntraFind, erklärt, warum diese Methode bei der Arbeit mit Textdaten immer wichtiger wird.

Mehr Einsatzszenarien für Künstliche Intelligenz

Transfer Learning ist eine Methode aus dem Deep Learning. Dabei wird ein vortrainiertes künstliches neuronales Netz für die Lösung neuer Problemstellungen genutzt. Weil man damit schnelle und ressourcenschonende Erfolge bei neuen Aufgabenstellungen erzielt, ist Transfer Learning ein wichtiges Werkzeug, um Künstliche Intelligenz leichter und in einer größeren Zahl von Anwendungsfällen einsetzen zu können.

KI funktioniert gut für diejenigen Firmen, die viele Daten besitzen und sich Modelle maßschneidern lassen können: DeepL hat einen leistungsfähigen Übersetzungsdienst, weil das Unternehmen Daten gesammelt hat und weil es viel in sein Übersetzungsverfahren investiert hat. Google kann Chihuahuas von anderen Hunden in Bildern unterscheiden, weil man dort über die entsprechenden Daten verfügt und sich Modelle gezielt für diese Sorte Bildklassifikation zurechtschneiden kann. Automobilhersteller arbeiten mit großen Datenmengen an der Entwicklung und Perfektionierung autonomer Fahrsysteme.

Funktioniert KI auch ohne Massendaten?

Trotz dieser Erfolge werden die meisten Bürojobs durch KI kaum vereinfacht. Woran liegt das? Es liegt nicht nur daran, dass die Massendaten fehlen, sondern auch daran, dass Bürotätigkeiten sehr vielfältig sind. Es ist also praktisch unmöglich für jede einzelne Tätigkeit in einem Unternehmen große Datenmengen zu sammeln, ein Modell maßzuschneidern, es den Knowledge Workern wie ein Spracherkenner als fertiges System an die Hand zu geben und ihnen zu sagen: “Ab jetzt musst du dieses SAP-Formular nicht mehr ausfüllen, die KI macht es für Dich”.

Was genau ist Deep Learning?

Deep Learning ist ein Teilbereich des maschinellen Lernens und basiert ebenfalls auf einem Set von Algorithmen. Die Datenstruktur stellt hierbei ein künstliches neuronales Netzwerk dar, das eine große Anzahl an Neuronen umfasst, die untereinander Informationen beziehungsweise Datenmengen austauschen. Das System zieht sich hierbei selbstständig Erkenntnisse aus der Analyse von großen Datenbeständen.

Praktische Anwendungsbeispiele für Deep Learning sind vollautomatisierte Call Center, selbstfahrende Autos oder Gesichtserkennung bei Fotoprogrammen. Auch NLP – also das Verstehen von natürlichsprachlichen Suchanfragen und die Ausgabe von entsprechenden Ergebnissen – ist ein Anwendungsbeispiel von Deep Learning.

IntraFind verfolgt als Spezialist für Enterprise Search und Content Analytics deshalb das Ziel, den Wissensarbeitern das Werkzeug an die Hand zu geben und der Maschine beizubringen, was die Anwender von ihr brauchen. Unsere Software lernt im Praxiseinsatz an Ort und Stelle den Menschen zu helfen. Die Optimierungen werden nicht a priori eingebaut. Vielmehr muss das System gewissermaßen als generische Lernmaschine fungieren.

Transfer Learning kommt also dann ins Spiel, wenn man das Lernen einer Aufgabe durch generisches Vorwissen beschleunigen möchte. Wählen wir das Beispiel Vertragsanalyse: Nehmen wir an, die Tätigkeit verlangt die Erkennung von Home Office-Regelungsklauseln in Arbeitsverträgen. Anstatt bei der Erkennung von Fachthemen bei Null anzufangen (Was sind Buchstaben? Wie unterscheiden sich Wörter syntaktisch, morphologisch? etc.) macht es Sinn, ein System ab einem bestimmten Wissenstand zu trainieren. Das heißt, man nimmt ein vortrainiertes Modell mit einem umfassenden Sprachverständnis, das Sätze und Grundformen von Wörtern etc. bereits erkennt. Dann trainiert beziehungsweise justiert man es mit relativ wenigen Trainingsdaten auf ein bestimmtes Fachgebiet, wo es dann in der Lage ist, Zusammenhänge zu erkennen. Die Erkennung von Home Office-Klauseln basiert dann also auf einem schon funktionierenden Sprachmodell. Dieses Vorwissen ist bereits codiert und somit benötigt man weniger Dokumente, um die Fähigkeit zu trainieren, dass entsprechende Klauseln und Regelungs-Textstellen automatisch erkannt werden.

Transfer Learning als Werkzeug für die Demokratisierung von KI

Transfer Learning, das ursprünglich aus der Bildverarbeitung stammt, hat sich auch für Sprachmodelle als zukunftsfähige Methode erwiesen. Diese Technik kann mit verhältnismäßig wenigen Daten und geringeren Rechenressourcen dabei helfen, Modelle mit hoher Qualität zu erzeugen, wozu sonst riesige Datensätze und enorme Rechenleistungen nötig wären. Das klingt vielversprechend und einfach, ist in Wirklichkeit aber ein höchst komplexer Prozess, der des Einsatzes von Experten bedarf. Transfer Learning wird sich weiterentwickeln und ist bereits jetzt ein wichtiger Schritt den Einsatz von KI in der Unternehmenswelt vermehrt zu ermöglichen - also KI zu demokratisieren.

Der Autor

Breno Faria

Product Manager AI

Breno Faria beschäftigt sich schon seit mehr als 10 Jahren mit den Themen Suche, Verarbeitung natürlicher Sprache und Künstliche Intelligenz. Der Experte für Natural Language Processing und KI-basierte Suche ist seit 2012 für die IntraFind Software AG tätig und in seiner aktuellen Rolle verantwortlich für das Produktmanagement im Bereich Künstliche Intelligenz.

07.08.2020 | Blog Transfer Learning - rasche Erfolge mit wenigen Daten

Was genau ist Deep Learning?

Ähnliche Artikel & Inhalte

Aus dem IntraFind Blog: Künstliche Intelligenz augmentiert menschliche Intelligenz

Aus unserer Produktwelt: Verträge intelligent analysieren mit Legal Tech

Der Autor

Breno Faria