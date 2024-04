AWS stellt verschiedene KI-Diensten bereit, die Entwicklungsprozesse unterstützen und intelligente Funktionen in bestehende Systeme integrieren. Einige dieser Services sind kostenlos nutzbar beziehungsweise bieten Testversionen an. Wir stellen in diesem Beitrag ausgewählte KI-Dienste von AWS vor, die für Entwicklungsprojekte relevant sind.

Polly erlaubt eine nahtlose Integration in Anwendungen über verschiedene Schnittstellen. Mit der AWS CLI, den AWS SDKs für gängige Programmiersprachen und einer REST API bietet der Dienst flexible Anbindungen. Die Unterstützung von SSML erlaubt es, granulare Einstellungen wie Sprechgeschwindigkeit, Tonhöhe und Pausen für eine personalisierte Sprachausgabe zu konfigurieren. Für spezialisierte Anforderungen an die Aussprache unterstützt Polly die Definition eigener Lexika, um die Aussprache von Akronymen oder firmenspezifischen Begriffen zu optimieren.

Amazon Polly wandelt Text in eine natürliche Sprachausgabe um. Der Dienst unterstützt eine breite Palette von Sprachen und Stimmen, die für die Erstellung von Anwendungen, die Sprachausgabe benötigen, eingesetzt werden können. Amazon Polly eignet sich für die Entwicklung von Sprachassistenten, die Bereitstellung von Audioinhalten und die Verbesserung der Zugänglichkeit von Anwendungen. Ein kostenfreies Kontingent erleichtert den Einstieg in den Dienst.

Amazon Rekognition: Erkennung und Analyse von Bildern und Videos

Amazon Rekognition bietet Analysefunktionen für Bilder und Videos. Der Dienst kann Objekte, Personen, Texte, Szenen und Aktivitäten in Bildmaterial erkennen und automatisiert Bild- und Videoanalysen. Rekognition findet Anwendung in der Sicherheitstechnik, bei der Medienanalyse und zur Verbesserung der Kundeninteraktion durch personalisierte Inhalte. Nutzer können den Dienst kostenlos testen, um dessen Potenzial für eigene Projekte zu evaluieren.

Amazon Rekognition bietet eine umfangreiche Menge an Machine-Learning-Modellen, die kontinuierlich mit neuen Daten trainiert werden, um die Genauigkeit zu verbessern. Der Dienst stellt spezialisierte Programmierschnittstellen (API) für die Erkennung von Gesichtern, Texten in Bildern und die Analyse von Videos bereit. Über diese APIs lassen sich komplexe Anforderungen wie die Erkennung von Stimmungen, die Identifikation von Objekten oder die Erstellung von Sicherheitsanwendungen implementieren. Rekognition kann zudem in Echtzeit eingesetzt werden, was die Verwendung in Überwachungssystemen oder für Live-Content-Moderation zulässt.

Abbildung 2: Amazon Rekognition unterstützt bei der Analyse von Bildern und Videos mit KI-Technologien.

Zu den Neuerungen zählt die Einführung von Face APIs Version 7, die eine höhere Genauigkeit und reduzierte Latenzzeiten für nahezu Echtzeit-Gesichtserkennungs-, Vergleichs- und Suchfunktionen bietet. Diese Verbesserungen sind insbesondere für Kunden aus Branchen wie Finanzdienstleistungen, Gig Economy, Telekommunikation, Gesundheitswesen und soziale Medien von Bedeutung, da sie Funktionen wie die Erkennung von Lebendigkeit, Gesichtsvergleich und -suche für virtuelle Onboarding-Prozesse, fortlaufende Authentifizierung und altersbasierte Zugangsbeschränkungen nutzen​.

Darüber hinaus verfügt Amazon Rekognition über neue Funktionen, welche die Erkennung und das Lesen von Text in Bildern, die Echtzeiterkennung von Gesichtern sowie die Erkennung von Gesichtern in überfüllten Bildern ermöglichen. Diese Funktionen sind darauf ausgelegt, die Genauigkeit der Gesichtsverifikation und -identifikation zu verbessern, was insbesondere für Kunden, die bereits Amazon Rekognition für Gesichtsverifizierungs- und Identifikationszwecke nutzen, von Vorteil ist​.

Ein weiteres neues Angebot von Amazon – Rekognition Video – gestattet die Automatisierung von vier häufigen Medienanalyseaufgaben. Dazu gehören die Erkennung von Schwarzblenden, Abspannen, Schnittwechseln und Farbbalken mit vollständig verwalteten, ML-gestützten APIs. Diese Funktionen vereinfachen die Ausführung von Workflows wie Inhaltsvorbereitung, Werbeeinschaltung und das Hinzufügen von Binge-Markern zu Inhalten im großen Maßstab. Die Amazon Rekognition Video Segment Detection API erlaubt es, diese Medienanalysefunktionen zu integrieren und damit beispielsweise Werbung in Bereichen einzufügen, die das Zuschauererlebnis nicht stören​.