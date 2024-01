Das Erstellen und Verwenden von Modellen für maschinelles Lernen (ML) erfordert in der Regel zumindest ein mittleres Verständnis der Softwaretechnik.

Während die meisten Unternehmen die Zusammenarbeit zwischen technischen und nicht-technischen Teams praktizieren, kann das technische Personal aufgrund von Ressourcen nur eine begrenzte Anzahl von Aufgaben übernehmen. Diese Einschränkung macht sich besonders im Bereich des maschinellen Lernens bemerkbar, da es mehrere zeitaufwendige Iterationen erfordert. Daher kann die Bereitstellung von ML-Funktionen für nicht-technische Teammitglieder die Teamproduktivität erhöhen und einen Mehrwert bieten.

Amazon SageMaker Canvas bietet Benutzern, die keine Erfahrung mit Softwarecodierung haben, die Möglichkeit, ML-Modelle zu erstellen und zu verwenden, um Ergebnisse auf der Grundlage verfügbarer Datensätze vorherzusagen. Dieses Tool trägt dazu bei, ML-Technologie in einem Unternehmen allgemein zugänglich zu machen. SageMaker bietet eine benutzerfreundliche GUI in der AWS-Konsole, die die Authentifizierung mit Single Sign-On unterstützt. Das erleichtert den Benutzern den Zugriff, ohne dass sie einen expliziten AWS-Konsolenbenutzer benötigen.

Das Starten der Benutzeroberfläche nimmt einige Minuten in Anspruch.

In der Amazon SageMaker-Konsole klicken Benutzer auf den Canvas -Link.

Um mit SageMaker Canvas zu beginnen, müssen Kontoadministratoren zunächst eine SageMaker-Domäne konfigurieren. Diese Domäne bietet Konfigurationen in Bezug auf Identitäts- und Zugriffsmanagementberechtigungen und Benutzerprofile sowie VPC - und Speicherdetails.

Daten importieren und Datensätze erstellen

Abbildung 3: Canvas erstellt eine Anwendung.

Sobald SageMaker alle Ressourcen erstellt hat und die Benutzeroberfläche einsatzbereit ist, besteht einer der ersten Schritte darin, die Daten zu importieren, die analysiert werden sollen. Canvas unterstützt eine Vielzahl von Datenformaten, wie zum Beispiel CSV, unverschlüsselter Text, Bild- und Dokumentdateien (PNG, JPG, PDF, TIFF). Der geeignete Datentyp hängt von der Art der Vorhersage und des ML-Modells ab, das verwendet wird.

Canvas bietet gebrauchsfertige ML-Modelle, die auf AWS-Services basieren, wie zum Beispiel die folgenden:

Amazon Comprehend für Sentiment-Analyse, Extraktion von Entitäten, Spracherkennung und Erkennung persönlicher Informationen in CSV- oder unverschlüsselte Textdateien

Amazon Rekognition für Objekt- und Texterkennung in Bildern

Amazon Textract für Ausgabenanalyse, Analyse von Identitätsdokumenten und Dokumentenanalyse in Dokumenten- und Bilddateien

Auf der Canvas-Hauptseite wählen Benutzer gebrauchsfertige Modelle aus. Für dieses Beispiel habe ich die Objekterkennung in Bildern (Object detection in images) ausgewählt. Dabei handelt es sich um ein nützliches Modell, das Unternehmensanalysten und Anwendungsentwickler unterstützt, bestimmte Muster und Themen in mehreren Bilddateien zu erkennen. Das Modell agiert auf der Grundlage der berechneten Vorhersagen.

Abbildung 4: Die Objekterkennung in Bildern wurde ausgewählt.

Als nächstes bietet das Tool die Möglichkeit, ein einzelnes Bild hochzuladen, da ich die Option Einzelvorhersage (Single prediction) ausgewählt habe (siehe Abbildung 5).

Abbildung 5: Es wurde Einzelvorhersage ausgewählt.

Das Modell erstellt dann Vorhersagen für das hochgeladene Bild.

Abbildung 6: Die Vorhersagen werden generiert.

Es bietet auch die Möglichkeit, einen bestehenden Datensatz zu erstellen oder zu verwenden, um mehrere Dateien als Batch-Vorhersage zu analysieren. Diese Funktion ermöglicht es verschiedenen Teams, relevante Datensätze innerhalb eines Unternehmens gemeinsam zu nutzen.

Abbildung 7: Mehrere Dateien werden als Batch-Vorhersage analysiert.

Abbildung 8: Erstellen Sie einen Datensatz.

Canvas bietet die Möglichkeit, einen Datensatz entweder aus einer lokalen Datei oder aus einem S3-Speicherort zu erstellen. Wie bereits erwähnt, bestimmt der Typ des ausgewählten ML-Modells das Datenformat, das der Datensatz verwendet.