Definition

IBM Watson

Watson ist ein Supercomputer von IBM, der Technologien mit künstlicher Intelligenz (KI) und anspruchsvolle analytische Software kombiniert. Das System wird unter anderem als "Frage-Antwort" Maschine eingesetzt. Der Supercomputer wurde nach dem IBM-Gründer Thomas J. Watson benannt.

Die Watson Supercomputer verarbeitet 80 Teraflops (Billionen Gleitkommaoperationen pro Sekunde). Zur Beantwortung von Fragen in natürlicher Sprache greift Watson auf 90 Server mit einem kombinierten Datenspeicher von mehr als 200 Millionen Seiten an Informationen zurück. Diese werden auf der Basis von etwa sechs Millionen logischer Regeln verarbeitet. Die Hardware und Daten befinden sich abgeschlossen in einem Raum, der zehn Kühlschränke aufnehmen könnte.

Die Schlüsselkomponenten von IBM Watson beinhalten:

  • Apache UIMA (Unstructured Information Management Architecture) Frameworks, Infrastruktur und andere Elemente, die für die Analyse von unstrukturierten Daten erforderlich sind;
  • Apache Hadoop, ein freies, Java-basiertes Framework, das die Verarbeitung von großen Datenmengen in einer verteilten Rechnerumgebung unterstützt;
  • SUSE Enterprise Linux Server 11, das schnellste verfügbare Betriebssystem für den Power7-Prozessor;
  • 2.880 Prozessorkerne;
  • 15 Terabyte RAM;
  • 500 Gigabyte vorverarbeitete Informationen;
  • die IBM DeepQA-Software, die für Informationsabfragen entwickelt wurde und natürliche Sprachverarbeitung und maschinelles Lernen beinhaltet.

Anwendungen für die zugrunde liegende Cognitive-Computing-Technologie von Watson sind fast endlos. Da der Rechner in der Lage ist, sowohl Text Mining als auch komplexe Analysen von riesigen Mengen unstrukturierter Daten durchzuführen, kann er sowohl eine Suchmaschine als auch ein Expertensystem mit Fähigkeiten unterstützen, die weit über alles bisher Bestehende hinausgehen.

Hier ein paar Beispiele: Im Mai 2016 unterzeichnete BakerHostetler, eine einhundert Jahre alte Anwaltskanzlei aus Ohio, einen Vertrag für ein juristisches Expertensystem auf Basis von Watson, das mit seinem 50-köpfigen Konkurs-Team arbeitet. ROSS, ein weiteres auf Watson basierendes KI-System, kann über eine Milliarde Textdokumente durchsuchen, die Informationen analysieren und in weniger als drei Sekunden präzise Antworten auf komplizierte Fragen liefern.

Die Verarbeitung natürlicher Sprache ermöglicht es dem System Juristensprache in allgemein verständliche Sätze zu übersetzen und so etwa die Fragen von Anwälten besser zu verstehen. Zudem soll es Anwälte bei der Klärung rechtlicher Fragen helfen. Die Entwickler von ROSS fügen immer mehr Rechtsmodule hinzu, so dass das System immer leistungsfähiger wird. Ähnliche Expertensysteme befassen sich mit medizinischer Forschung.

Der breiten Öffentlichkeit bekannt geworden ist Watson 2011 durch den Sieg in der Quiz-Show Jeopardy. In der US-Fernsehsendung wird den Quizkandidaten eine Antwort vorgegeben, zu der die passende Frage gesucht wird. Oft ist es dabei erforderlich, Zusammenhänge herzustellen, verschiedene Wissensgebiete zu verbinden, frei und komplex zu assoziieren und „um die Ecke zu denken". Watson hat im Duell die zwei bestplatzierten Spieler Ken Jennings und Brad Rutter geschlagen.

In Proberunden zeigte Watson menschenähnliche Fähigkeiten für komplexe Wortspiele. Er reagierte zum Beispiel richtig auf die Antwort „Bekannter Schokoriegel, der Richterin am Supreme Court ist" mit der Frage: „Was ist Baby Ruth Ginsburg?“ (Anmerkung: Baby Ruth ist ein Schokoriegel von Nestle, der in den USA verbreitet ist).

Rutter wies darauf hin, dass die Abfrage dieser Information für Watson „trivial" und für einen Menschen schwierig ist. Der Mensch sei jedoch bei der komplexen Aufgabe des Verstehens noch besser. Dennoch ermöglicht maschinelles Lernen Watson seine Fehler mit den richtigen Antworten zu vergleichen, und das System erkennt, wo Fehler begangen wurden und wie zukünftige Antworten verbessert werden können.

In einem Interview während der Jeopardy! Proberunde wich ein IBM-Vertreter der Frage aus, ob Watson über eine Webschnittstelle breit verfügbar gemacht werde. Der Vertreter sagte, dass das Unternehmen derzeit mehr in vertikalen Anwendungen wie Gesundheitswesen und Entscheidungsunterstützung interessiert war.

Inzwischen ist Watson als Webservice allgemein verfügbar. Aktuell werden über die Cloud-Plattform IBM Bluemix etwa 28 Watson-Services als Application Programming Interfaces (APIs) angeboten. Mit diesen lassen sich Watson-Anwendungen bauen oder Watsons Fähigkeiten in Eigenentwicklungen integrieren.

Language Identification erlaubt zum Beispiel die Bestimmung von Sprachen, der Service Machine Translation die automatische Übersetzung von einer Quell- in eine Zielsprache. Den höchsten Bekanntheitsgrad dürfte der Watson Service Question and Answer haben. Damit können Apps programmiert werden, die anhand einer Frage die zugehörige Antwort auf Basis von hinterlegten Broschüren, Internetseiten, Handbüchern oder Blogeinträgen geben.

Das folgende Einführungsvideo zeigt, wie Watson funktioniert:

Diese Definition wurde zuletzt im März 2017 aktualisiert

Erfahren Sie mehr über Business-Software

ComputerWeekly.de
Close