Semantic Web (semantisches Web)
Was ist das Semantic Web (semantisches Web)?
Das Semantic Web (semantisches Web) ist eine Vision für die Verknüpfung von Daten über Webseiten, Anwendungen und Dateien hinweg. Einige betrachten es als Teil der natürlichen Entwicklung des Internets: beim Web 1.0 ging es um die Verlinkung von Webseiten, das Web 2.0 verlinkt Apps, und beim Web 3.0 geht es um verlinkte Daten. Das Ziel des Semantic Web ist es, ein maschinenlesbares Netz aus miteinander verbundenen Daten zu schaffen, das eine bessere Datenintegration und einen besseren Wissensaustausch ermöglicht.
Diese Vision betont die Idee, Daten für Maschinen verständlich zu machen, indem Datenbeziehungen, Bedeutungen und Absichten definiert werden. Dadurch können Computer Daten ähnlich interpretieren, wie Menschen Informationen verarbeiten.
In der Praxis werden Semantic-Web-Daten mit Metadaten verknüpft, sodass Maschinen die Beziehungen zwischen verschiedenen Daten definieren können.
Die große Vision des Semantic Web besteht darin, dass alle Daten in einem einzigen Semantic Web miteinander verbunden sein werden. In der Praxis sind die heutigen Semantic Webs auf verschiedene spezialisierte Anwendungen aufgeteilt, darunter Suchmaschinenoptimierung (SEO), Wissensmanagement in Unternehmen und kontrollierte Datenfreigabe.
Im Bereich der Suchmaschinenoptimierung unterstützen alle großen Suchmaschinen inzwischen Semantic-Web-Funktionen zur Verknüpfung von Informationen mithilfe spezieller Schemata über gängige Kategorien von Entitäten, wie zum Beispiel Produkte, Bücher, Filme, Rezepte und Unternehmen, die eine Person abfragen kann. Diese Schemata helfen bei der Erstellung der Zusammenfassungen, die in den Google-Suchergebnissen angezeigt werden.
Im Bereich des Wissensmanagements in Unternehmen können Unternehmen verschiedene Tools verwenden, um ein semantisches Netzwerk zu erstellen – eine grafische Darstellung von Entitäten und ihren Beziehungen, auch als Wissensgraph bekannt – aus Informationen, die aus Unternehmensdokumenten, Unternehmensdiensten und dem öffentlichen Internet stammen. Dies kann die Planung, Analyse und Zusammenarbeit im Unternehmen verbessern.
Die kontrollierte gemeinsame Datennutzung ist eher ein Ziel und Experiment. Die Kernidee besteht darin, dass Einzelpersonen und Unternehmen ein sicheres Datenarchiv über sich selbst und ihre Interessen erstellen und dann Links zu diesen Daten mit vertrauenswürdigen Parteien wie Unternehmen, Ärzten oder Regierungsbehörden teilen können.
Das Semantic Web war eigentlich Teil des ursprünglichen Plans des Computerwissenschaftlers Tim Berners-Lee für das World Wide Web, aber es war damals nicht praktikabel, es in großem Maßstab umzusetzen.
Elemente des Semantic-Web-Frameworks
Berners-Lee schlug eine Illustration oder ein Modell namens Semantic Web Stack vor, um die verschiedenen Arten von Tools und Vorgängen zu veranschaulichen, die zusammenkommen müssen, um das Semantic Web zu ermöglichen. Der Stack kann Entwickler dabei unterstützen, Wege zu finden, um von der einfachen Verlinkung zu anderen Webseiten zur Verlinkung von Daten und Informationen über Webseiten, Dokumente, Anwendungen und Datenquellen hinweg zu gelangen.

Hier eine Aufschlüsselung:
- Am unteren Ende des Stacks können Rohdaten mithilfe von Unicode-Textzeichen ausgedrückt werden. Uniform Resource Identifier (URI) können Links zu Daten innerhalb einer bestimmten Seite bereitstellen.
- Als Nächstes wird häufig die Extensible Markup Language (XML) verwendet, um Informationen auf Seiten in einem maschinenlesbaren Format zu strukturieren.
- Darüber hinaus bietet das Resource Description Framework (RDF) eine Standardmethode zur Beschreibung von Entitäten, Eigenschaften und den Beziehungen zwischen ihnen für den Datenaustausch.
- Die Web Ontology Language (OWL) formalisiert eine Möglichkeit, Wissen über und zwischen Entitäten darzustellen. Sie arbeitet mit dem Rule Interchange Format des World Wide Web Consortium (W3C), um Dinge zu beschreiben, die schwieriger zu formalisieren sind.
- Die SPARQL-Abfragesprache kann Daten durchsuchen, die in verschiedenen Quellen gespeichert sind, und mit OWL und RDF zusammenarbeiten, um Informationen zu finden.
- Andere Technologien müssen ebenfalls mit diesen zentralen semantischen Verarbeitungsdiensten zusammenarbeiten, um Daten zu sichern, einen Prüfpfad zu erstellen, um Vertrauen zu schaffen, und eine Benutzererfahrung zu bieten.
Verwendung des Semantic Web
Es gibt mehrere tatsächliche und potenzielle Anwendungen des Semantic Web, darunter die folgenden:
SEO. Dies ist die derzeit häufigste Verwendung von Konzepten des semantischen Webs. Ein Website-Betreiber oder Content-Ersteller fügt verknüpfte Daten-Tags gemäß den Standardsuchmaschinen-Schemata hinzu. Dadurch können Suchmaschinen Daten, zum Beispiel über Öffnungszeiten, Produkttypen, Adressen und Bewertungen von Dritten, leichter automatisch extrahieren. Die Website Rotten Tomatoes steigerte ihre Klickrate um 25 Prozent, als sie strukturierte Daten hinzufügte.
Automatische Zusammenfassung. Websites und Drittanbieter-Apps können getaggte Daten verwenden, um bestimmte Arten von Informationen von verschiedenen Websites automatisch in Übersichtskarten zu übertragen. So können beispielsweise Kinos Spielzeiten, Filmkritiken, Theaterstandorte und Rabattpreise auflisten, die dann bei Suchanfragen angezeigt werden.
Weitergabe von Produktdetails. Mit dem GS1 Web Vocabulary können Hersteller und Großhändler Informationen über Lebensmittel, Getränke und andere Konsumgüter automatisch in einer für Computer zugänglichen Weise über die gesamte Lieferkette hinweg übertragen. Dadurch wird es für Marken einfacher, Informationen auf ihren Websites aufzulisten, wie zum Beispiel Nährwertkennzeichnungen, Produktgrößen, Informationen zu Allergien, Auszeichnungen, Verfallsdaten und Verfügbarkeitsdaten bei Lebensmittelgeschäften und Online-Shops, die ihre Produkte verkaufen.
Standardisierung der Kompetenztaxonomie. Lernplattformen, Jobbörsen und Personalabteilungen verwenden möglicherweise unterschiedliche Begriffe, um berufliche Fähigkeiten zu beschreiben. Unternehmen nutzen zunehmend semantische Webtechnologien, um unterschiedliche Arten der Beschreibung von Fähigkeiten in eine Standardtaxonomie zu übersetzen. Dies kann Teams dabei helfen, ihre Bewerbersuche zu erweitern und die von ihnen entwickelten Schulungsprogramme für Mitarbeiter zu verbessern.
Kontrollierter Datenzugriff. Verbraucher füllen oft Dutzende von Formularen mit den gleichen Informationen – wie Name, Adresse, Sozialversicherungsnummer und Präferenzen – für Dutzende verschiedener Unternehmen aus. Wenn diese Organisationen gehackt werden, sind die Daten eventuell verloren. Um diese Probleme anzugehen, arbeitet Berners-Lees Unternehmen Inrupt mit verschiedenen Gemeinden, Krankenhäusern und Regierungen zusammen, um Daten-Pods auf der Grundlage des Solid-Open-Source-Protokolls einzuführen, die es Verbrauchern erlauben, den sicheren Zugriff auf ihre Daten zu teilen.
Austausch digitaler Zwillingsdaten. Mehrere Anbieter, darunter Bentley und Siemens, entwickeln vernetzte semantische Netze für Industrie und Infrastruktur, die sie als Industrial Metaverse bezeichnen. Diese digitalen Zwillingsplattformen der nächsten Generation kombinieren branchenspezifische Ontologien, kontrollierten Zugriff und Datenkonnektivität, damit Benutzer dieselben Daten über Gebäude, Straßen und Fabriken aus verschiedenen Anwendungen und Perspektiven anzeigen und bearbeiten können.
Wie hängt das Semantic Web mit dem Web 3.0 zusammen?
Das Semantic Web wird oft als Web 3.0 bezeichnet. Berners-Lee begann bereits in den ersten Tagen seiner Arbeit am World Wide Web im Jahr 1989, so etwas wie das Semantic Web zu beschreiben. Zu dieser Zeit entwickelte er ausgeklügelte Anwendungen zum Erstellen, Bearbeiten und Anzeigen verbundener Daten. Diese erforderten jedoch teure NeXT-Workstations, und die Software war noch nicht für den Massenverbrauch geeignet.
Die Beliebtheit des Mosaic-Browsers trug dazu bei, eine kritische Masse an Begeisterung und Unterstützung für Webformate aufzubauen. Die spätere Entwicklung von programmierbaren Inhalten in JavaScript, das bald zum Standard für browserbasierte Programmierung wurde, eröffnete Möglichkeiten für die Erstellung von Inhalten und interaktiven Apps.
Tim O'Reilly, Gründer und CEO von O'Reilly Media, machte den Begriff Web 2.0 mit einer Konferenz gleichen Namens populär. Allerdings gab es im Web 2.0 noch immer keine formale Möglichkeit, die Daten auf einer Seite zu beschreiben – die definierende Fähigkeit des Semantic Web. In der Zwischenzeit setzte Berners-Lee seine Bemühungen fort, Daten durch seine Arbeit beim W3C zu verbinden.
Die Konvention, das Semantic Web als Web 3.0 zu bezeichnen, setzte sich später bei einflussreichen Beobachtern durch. 2006 schrieb der Journalist John Markoff in der New York Times, dass ein Web 3.0, das auf einem semantischen Web aufbaut, die Zukunft des Internets darstelle. Im Jahr 2007 vertrat die Futuristin und Erfinderin Nova Spivak die Ansicht, dass es beim Web 2.0 um kollektive Intelligenz gehe, während es beim neuen Web 3.0 um konnektive Intelligenz gehe. Spivak sagte voraus, dass das Web 3.0 mit einem Daten-Web beginnen und sich im Laufe des nächsten Jahrzehnts zu einem vollwertigen semantischen Web entwickeln würde.
Gavin Wood prägte 2014 den Begriff Web3, um ein dezentrales Online-Ökosystem auf Blockchain-Basis zu beschreiben. Inrupt, das einige der Pionierarbeiten von Berners-Lee fortgeführt hat, argumentiert, dass es beim Semantic Web um den Aufbau von Web 3.0 geht, was sich vom Begriff Web3 unterscheidet.
Der Hauptstreitpunkt ist, dass der Fokus von Web3 auf Blockchain einen erheblichen Mehraufwand mit sich bringt. Im Gegensatz dazu konzentriert sich der Ansatz von Inrupt auf eine sichere, zentralisierte Speicherung, die von den Dateneigentümern kontrolliert wird, um die Identitäts- und Zugriffskontrolle durchzusetzen, die Interoperabilität von Anwendungen zu vereinfachen und die Datenverwaltung sicherzustellen. Befürworter behaupten, dass diese Mechanismen die fehlenden Zutaten hinzufügen, die erforderlich sind, damit sich das Semantic Web von einer Plattform für bessere Suchanfragen zu einem stärker vernetzten Netz vertrauenswürdiger Daten entwickelt.

Einschränkungen und Kritikpunkte am Semantic Web
Die Schaffung des Semantic Web ist mit einer Reihe von Herausforderungen verbunden.
Daten kombinieren
Die erste Generation semantischer Web-Tools erforderte tiefgreifende Fachkenntnisse in Ontologien und Wissensrepräsentation. Daher wurden in erster Linie bessere Metadaten zu Websites hinzugefügt, um die Dinge auf einer Seite zu beschreiben. Es ist ein zusätzlicher Schritt erforderlich, die Metadaten beim Hinzufügen oder Ändern einer Seite auszufüllen. Content-Management-Systeme (CMS) werden immer besser darin.
Dies vereinfacht jedoch nur die Herausforderungen für die Suchmaschinenoptimierung. Die Entwicklung ausgefeilterer semantischer Webanwendungen zur Kombination von Daten aus mehreren Websites ist nach wie vor ein schwieriges Problem, das durch die Verwendung unterschiedlicher Schemata zur Beschreibung von Daten und kreative Unterschiede in der Art und Weise, wie Menschen die Welt beschreiben, noch komplexer wird.
Unbestimmtheit und Missverständnisse
Die semantische Analyse zur Identifizierung von Subjekt, Prädikat und Objekt eines Satzes eignet sich hervorragend zum Deutschlernen, ist jedoch nicht immer konsistent, wenn Sätze analysiert werden, die von verschiedenen Personen verfasst wurden und die sehr unterschiedlich sein können. Populäre Schlagworte machen die Dinge noch komplizierter, da sie unterschiedliche und manchmal widersprüchliche Bedeutungen haben können. Während sich beispielsweise alle Wissenschaftler einig zu sein scheinen, dass ein Quantensprung die kleinste Energieänderung ist, die ein Atom vornehmen kann, scheinen Marketingfachleute der Meinung zu sein, dass es sich dabei um eine ziemlich große Veränderung handelt.
Vertrauen
Die andere große Herausforderung besteht darin, Vertrauen in die Daten zu schaffen, die in einem semantischen Web dargestellt werden. Es wird immer wichtiger, nicht nur zu wissen, was auf einer Seite steht, sondern auch, wer es gesagt hat und welche Vorurteile er möglicherweise hat. Eine Empfehlung von einer angesehenen Quelle hat wahrscheinlich ein anderes Gewicht als eine von einem Spam-Bot auf Amazon. Bemühungen, einen Prüfpfad für das Semantic Web bereitzustellen, kann nicht nur dazu beitragen, die Daten zu verknüpfen, sondern auch die Datenqualität und den Grad der Vertrauenswürdigkeit zu verstehen.
Allgemeine Machbarkeit
Die vollständige Umsetzung des Semantic Web hängt von der weit verbreiteten Einführung von Semantic-Web-Standards und -Frameworks ab, aber vielen Organisationen fehlen möglicherweise die erforderlichen technischen Fähigkeiten und Ressourcen. Für einige kann sich der Aufwand nicht lohnen, da traditionelle Web-Ansätze in Szenarien, die unerwartete Informationsressourcen erfordern, immer noch besser sein können.
Datenschutz
Die Verknüpfung von Daten aus verschiedenen Quellen kann unbeabsichtigt sensible Daten offenlegen, die von Kriminellen zur Erstellung von Profilen anderer Personen verwendet werden können. Das Semantic Web würde einen gründlichen und umfassenden Datenschutz erfordern, um ethische Bedenken zu vermeiden.
Abhängigkeit von strukturierten Daten
Das Semantic Web basiert auf strukturierten und gekennzeichneten Daten, die nicht immer in ausreichender Menge vorhanden sind. Beispielsweise basieren viele Websites immer noch auf unstrukturierten und halbstrukturierten Datenformaten, die die Implementierung eines Semantic Web einschränken würden.
Semantic Web versus semantische Suche
Suchmaschinen wie Google und Bing verwenden eine Suchmethode namens semantische Suche, eine Datensuchtechnik, die Natural Language Processing (NLP) und Algorithmen für maschinelles Lernen verwendet, um die Genauigkeit der Suchergebnisse zu verbessern. Diese Suchmethode zielt darauf ab, das zugrunde liegende Ziel des Suchenden zu identifizieren und kontextrelevante Ergebnisse zu finden, auch wenn diese nicht genau die in der ursprünglichen Abfrage verwendeten Wörter enthalten. Im Vergleich dazu können herkömmliche lexikalische Suchanfragen nur direkte Schlüsselwörter finden, die in der Suchanfrage verwendet werden.
Die semantische Suche ist eine praktische Anwendung des umfassenderen Konzepts des Semantic Web. Das Semantic Web und die semantische Suche basieren auf einer Reihe gemeinsamer Technologien, wie RDF, OWL, SPARQL und Wissensgraphen. Die semantische Suche nutzt jedoch zusätzlich Technologien wie NLP und maschinelles Lernen.
Während sich das Semantic Web auf die Erstellung eines maschinenlesbaren datenbasierten Webs konzentriert, liegt der Schwerpunkt der semantischen Suche auf einem benutzerzentrierten Anwendungsfall.
Die Zukunft des Semantic Web
Obwohl Websuchmaschinen, darunter Google und Bing, die semantische Suche nutzen, ist dies erst der Anfang der Implementierung eines Semantic Web. Auch wenn eine Zukunft mit einem funktionierenden Web 3.0 mit einem dahinterstehenden Semantic Web möglich ist, sind diese Vision und ihre potenziellen Auswirkungen noch in weiter Ferne.
Immer mehr Websites fügen ihren Seiten automatisch semantische Daten hinzu, um die Ergebnisse in Suchmaschinen zu verbessern. Es ist jedoch noch ein weiter Weg, bis diese Daten auf allen Webseiten vollständig miteinander verknüpft sind. Die Übersetzung der Bedeutung von Daten über verschiedene Anwendungen hinweg ist ein komplexes Problem, das es zu lösen gilt.
Innovationen in den Bereichen KI und NLP unterstützen dabei, einige dieser Lücken zu schließen, insbesondere in bestimmten Bereichen wie Skill-Taxonomien, Vertragsintelligenz und digitale Zwillinge. In Zukunft kann ein hybrider Ansatz zum Einsatz kommen, der eine bessere Steuerung der Schemata, die eine Organisation oder Branche zur Beschreibung von Daten verwendet, mit KI und statistischen Verfahren kombiniert, um die Lücken zu schließen. Um der ursprünglichen Vision eines Netzwerks verbundener Daten näher zu kommen, bedarf es einer Kombination aus besserer Struktur, besseren Tools und einer Vertrauenskette (Chain of Trust).
Geräte des Internets der Dinge (IoT) können ebenfalls vom Semantic Web profitieren, da es die Interoperabilität bieten kann, die für die Verwaltung der großen Datenmengen, die von IoT-Geräten generiert werden, erforderlich ist.