Menschen von oben fotografiert, die an einem Tisch sitzen.

adesso Blog

Ein Einblick in die aufregende Welt der auf KI basierenden Transformer-Architekturen

Die Nachfrage nach innovativen, auf KI basierenden Transformer-Modellen ist kaum zu übersehen. Insbesondere in Bereichen wie der maschinellen Übersetzung sowie der Sprach- und Texterkennung wurden in den letzten Jahren große Fortschritte bei der Entwicklung erzielt. Heutige auf der Transformer-Architektur basierende Sprachmodelle nutzen beispielsweise Mechanismen der Selbsterkenntnis. Mit Hilfe dieser Mechanismen lässt sich die Effizienz von maschinellen Lernmodellen erheblich steigern. Hierbei wird auf intuitive und spontane Prozesse der menschlichen Wahrnehmung gesetzt.

Was ist ein Transformer Modell?

Transformatoren, die erstmals in einem Artikel von Google aus dem Jahr 2017 beschrieben wurden, gehören zu den neuesten und leistungsstärksten Modellklassen, die bisher entwickelt wurden. Sie treiben eine Welle von Fortschritten im Bereich des maschinellen Lernens voran, insbesondere mit einem sehr großen Fokus auf die KI.

Sie werden häufig in Sprachanwendungen wie Sprachsynthese, Spracherkennung und maschineller Übersetzung eingesetzt. So wird beispielsweise ein Übersetzungsmodell mit Hilfe des Aufmerksamkeitsprozesses für die Übersetzung eines bestimmten Wortes in einen Zustand versetzt, in dem es die Bedeutung anderer Wörter stärker berücksichtigt. Seit ihrem Erscheinen im Jahr 2017 haben sich unter anderem Sprachmodelle weiterentwickelt und in viele verschiedene Varianten verzweigt, die über Sprachaufgaben hinaus in andere Bereiche reichen.

Daten treiben die Entwicklung von Transformer-Architekturen auf Hochtouren an

Durch das Sammeln und Verarbeiten von Daten trainiert die KI ihre Algorithmen, zieht Schlüsse aus den Daten und wendet diese auf die Erstellung neuer und unabhängiger Inhalte an. Mit immer mehr gewonnenem Feedback optimiert die Transformer-Architektur ihre Algorithmen immer tiefgründiger. Auf dieser Grundlage ist sie in der Lage, eigene hochwertige Texte zu generieren und auch nuancierte Zusammenfassungen von Millionen von Textwörtern zu liefern. Das von Google entwickelte Aufmerksamkeitsverfahren wird hierfür seitens der Transformer-Architektur verstärkt eingesetzt.

Das Besondere daran ist, dass die KI die Möglichkeit hat, sogar auf die Kundin oder den Kunden zugeschnittene Inhalte zu erstellen. Sie lernt aus Nutzungsinformationen sowie -interaktionen und präsentiert somit hochpersonalisierte Inhalte, die auf nachhaltige Weise immer präziser werden.

Abbildung 1: Ein Transformer-Modell kann auf eine Vielzahl von Aufgaben angepasst werden

Abbildung 1: Ein Transformer-Modell kann auf eine Vielzahl von Aufgaben angepasst werden

Der GPT-3, ein Paradebeispiel unter den Sprachmodellen

Ein Beispiel ist der Generative Pre-Training Transformer 3, kurz GPT-3. Anders als alternative Angebote geht GPT-3 einen Schritt weiter: Er transformiert nicht nur, sondern hat auch zusätzlich einen schöpfenden Charakter. GPT-3 ist in der Lage, selbständig neue Texte zu erstellen, ohne dabei nur bestehende Texte zu verarbeiten. Diese Aufgabe meistert GPT-3 sehr präzise und liefert sehr gute Ergebnisse. Es ist der größte Natural Language Processing Transformer (NLP), der menschliche Denk- und Argumentationsmuster akkurat und effektiv reproduzieren kann.

Das Sprachmodell verwendet mehrere Encoder und Decoder. Eine wichtige Neuerung dabei ist auch, dass das GPT-3-Sprachmodell nicht nur in Englisch, sondern auch in anderen Sprachen wie Chinesisch, Russisch und Deutsch trainiert wurde. Dadurch ist es in der Lage, auch Sätze in anderen Sprachen zu verstehen und zu übersetzen.

Künstliche Intelligenz einfach nutzen

Gemeinsam mit unseren Kunden setzen wir seit etwa 2 Jahren verschiedene Transformer-Modelle ein und begegnen damit diversen Herausforderungen. So sind wir in der Lage, innerhalb weniger Tage oder Wochen komplexen Herausforderungen zu begegnen.

Als Beispiel ist hierbei die Nutzung im Rahmen des Input-Managements zu nennen, mit einem vortrainierten Transformer-Modell sind wir in der Lage, innerhalb weniger Tage die eingehenden Dokumente korrekt zu klassifizieren, die relevanten Aussagen und Informationen zu extrahieren und für die Weiterverarbeitung zur Verfügung zu stellen.

Die Qualität und Geschwindigkeit bei der Umsetzung ist traditionellen Ansätzen deutlich überlegen und sorgt für eine sehr hohe Akzeptanz bei den Mitarbeitenden. Der Nutzen ist sofort ersichtlich und die Fähigkeiten sorgen für kreative Innovation bei unseren Kunden sowie bei dem Entwickeln und Umsetzen weiterer Use Cases.

Dies ist nur ein Beispiel von vielen, vereinfacht kann man sagen, dass viele der Tätigkeiten, die ein Mensch explizit formulieren kann, durch das Modell übernommen werden können.

Also zum Beispiel: Extrahiere alle Informationen mit einem Nachhaltigkeitsbezug aus den Geschäftsberichten des Kunden.

Zusammenfassend kann man sagen, dass mit Transformer-Modellen der nächste große Schritt bei der Anwendung von Künstlicher Intelligenz in Unternehmen erreicht ist. Der Einsatz und die Nutzung sind dabei nur durch die fehlende Bereitschaft zur Veränderung limitiert, nicht durch die technischen Fähigkeiten der Lösungen.

Gemeinsam helfen wir unseren Kunden genau dieser Herausforderung zu begegnen, bei Interesse sprechen Sie mich gerne an – ich freue mich Ihnen die Details dazu vorzustellen.

Weitere spannende Themen aus der adesso-Welt findet ihr in unseren bisher erschienenen Blog-Beiträgen.

Bild Tim Strohschneider

Autor Tim Strohschneider

„Komplizierte Zusammenhänge einfach dargestellt“ – Tims Motto als Problemlöser in der Line of Business Banking motiviert ihn jeden Tag, mit dem Kunden im Fokus, alle Themen rund um intelligente Automatisierung und Künstliche Intelligenz im Geschäftskontext zugänglich zu machen. Über 15 Jahre in der IT-Welt, im Herzen Berater, Führungskraft und Innovationstreiber – seine Sicht auf die aktuellen Entwicklungen beschreibt er hier im Blog und auf seiner LinkedIn-Seite.

Kategorie:

KI

Schlagwörter:

Künstliche Intelligenz

Daten

Diese Seite speichern. Diese Seite entfernen.