Bei mehr als einer Gelegenheit haben wir bewiesen, dass die Verwendung der Keras-Bibliothek zur Lösung eines Textklassifizierungsproblems die beste Wahl für den schnellen Aufbau eines starken und effizienten Deep Learning-Modells ist.
Nach unseren Erkenntnissen über die Herausforderungen der Textklassifizierung möchten wir heute weitergeben , wie hilfreich Keras bei der Bewältigung der Bedürfnisse unserer Kunden im Bereich des maschinellen Lernens ist und welche Vorteile die Verwendung von Keras gegenüber anderen bekannten Bibliotheken für neuronale Netzwerke wie Tensorflow hat.

Keras ist eine Python-Bibliothek, die quasi von der Stange bekannte Deep-Learning-Modelle bietet. Sie wurde so entwickelt, dass die Bibliothek einfach zu erlernen und zu verwenden ist. Die Idee hinter der Arbeit des Keras-Teams ist es, die Forschung im Bereich des maschinellen Lernens zu erleichtern: "Von der Idee zum Ergebnis mit der geringstmöglichen Verzögerung zu kommen, ist der Schlüssel zu guter Forschung".

Seit TensorFlow 2.0 ist Keras in TensorFlow integriert und wird als High-Level-API empfohlen.

Vorteile, die Keras uns bietet

Einer der praktischen Vorteile, die wir bei der Verwendung von Keras finden, ist die Tatsache, dass es APIs für jeden Schritt bietet, den wir auf unserer Vorhersagereise durchlaufen, von der Vorverarbeitung bis zur Vorhersage und Auswertung (siehe Abbildung 1 für die Vorhersageschritte).

Außerdem haben wir die Wahl zwischen der Sequential Model API für den Aufbau neuronaler Netze in Form eines Stapels von Schichten, der Functional API für den Umgang mit komplexen Modellen mit mehreren Eingängen und Ausgängen oder der Model Subclassing API, um ein vollständig anpassbares Modell zu erhalten.

Zusammenfassend lässt sich sagen, dass die API sehr benutzerfreundlich ist und die erforderliche Abstraktionsebene bietet.

Welche Arten von Herausforderungen können mit Keras gelöst werden?

Bei einem unserer Kunden waren wir im Besitz von unstrukturierten Daten, nämlich Text in freiem Format, der größtenteils beschriftet war. Da die besten Leistungen bei der Textklassifizierung mit dem Deep-Learning-Algorithmus https://nlpprogress.com/english/text_classification.html erzielt wurden beschlossen wir, die Verwendung von Convolutional Neural Networks (CNN) und Long-Short Term Model (LSTM)-Algorithmen zu untersuchen.

Um intensive Vorverarbeitungsschritte wie die Entfernung von Stoppwörtern oder die Lemmatisierung von Wörtern zu vermeiden, verließen wir uns auf die Fähigkeiten neuronaler Netze, um das Rauschen zu entfernen. Neuronale Netze sollten die latenten Variablen aus dem Text ableiten, die die Wörter mit starkem Einfluss auf das Klassifikationsergebnis lernen.

Wir mussten noch eine notwendige Vorverarbeitung durchführen, um unseren Eingabedatensatz in eine Matrix kodierter Sequenzen umzuwandeln und die Datenausgabe ebenfalls zu kodieren. Für die Transformation der Eingabedaten verwendeten wir die Keras-Funktion "text_to_sequences", gefolgt von der Funktion "pad_sequences", um gleich lange Einträge zu erhalten. Die Kodierung der Output-Labels basierte auf der Zuweisung eines anderen Codes für jede mögliche Klasse.

Der Datensatz war dann bereit, mit Algorithmen für maschinelles Lernen verarbeitet zu werden, und wir konnten unser Klassifizierungsmodell mit der sequenziellen API von Keras gestalten. Sehr einfache Modelle benötigen nicht mehr als 2 Zeilen Code, um eingestellt zu werden. Unser Basisalgorithmus kann aus einer dichten Schicht, die die Neuronen setzt, die die Parameter aus den Eingabedaten lernen, und einer Aktivierungsschicht, die die Ausgabeklasse liefert, bestehen.

Die letzten beiden Schritte, um unsere ersten Ergebnisse zu erhalten, sind die Kompilierung des Modells mit der richtigen Verlustfunktion und einer guten Optimierungsfunktion sowie die Anpassung des Modells an die Eingabe- und Ausgabedaten.

Mit einem iterativen Ansatz erzielten wir beeindruckende Ergebnisse, wie in diesem Kundenfall beschrieben(https://openwt.com/de/cases/automatisierung-von-produktspezifikationen-mit-kunstlicher-intelligenz/). Anhand der Beschreibung des Produktherstellers konnten wir die Marke und die Attribute des Produkts erfolgreich klassifizieren und unserem Kunden helfen, seine Online-Produktplatzierung auf seiner E-Commerce-Plattform zu optimieren.

Sie können mehr über den Anwendungsfall des maschinellen Lernens lesen: Textklassifizierung und KI-E-Mail-Klassifizierung

Andere News

Alle anzeigen
Read more
Read more
Read more
Helfen Sie uns, unsere Website zu verbessern
Um den Inhalt zu verbessern und Ihr Erlebnis zu steigern, verwenden wir Cookies für Analysezwecke.
Alle Cookies ablehnen