Als Multi-Modell-Datenbank vereint MarkLogic die Vorteile eines Dokumentenspeichers mit denen einer RDF-Tripel-Datenbank. So lassen sich alle Ihre Daten problemlos integrieren und abrufen. JSON- und XML-Dokumente bieten Flexibilität für die Modellierung von Entitäten, während RDF-Tripel – das Datenformat für semantische Graphdaten – ideal für die Speicherung von Beziehungen sind. MarkLogic Semantik ist als Datenformat sehr gut geeignet, um Metadaten zu speichern, die Datenintegration zu verbessern und Anwendungen zu entwickeln, die diese integrierten und hochgradig verknüpften Daten nutzen. Zu den weit verbreiteten Anwendungsbeispielen von MarkLogic Semantik zählen hochmoderne Suchanwendungen, Empfehlungs-Engines, Betrugserkennung, Wissensgraphen, Wirkstoffentdeckung und Netzwerksicherheit.

Mehr erfahren

Es funktioniert einfach

MarkLogic hält, was es verspricht: RDF, XML und andere Daten – darunter verschiedene Indexe – werden auf einer einzigen Plattform zusammengeführt. Das Unternehmen hat erstklassige Arbeit geleistet."

Semantische Daten und Abfragen: RDF und SPARQL

Die Beliebtheit von Graphdatenbanken ist in den letzten Jahren stark gestiegen. RDF-Tripel-Datenbanken – in denen semantische Daten gespeichert werden – sind eine Art von Graphdatenbank. Wenn Daten in Form eines Graphen dargestellt werden, in dem Entitäten (Menschen, Orte und Objekte) und die Beziehungen zwischen ihnen eine übergeordnete Rolle spielen, empfiehlt sich die Nutzung von Semantik. So erhalten Sie einen aussagekräftigeren Kontext für Ihre Daten.

Die Standardmethode für die Darstellung semantischer Daten sind RDF-Tripel (Resource Description Framework), wobei als Abfragesprache in der Regel SPARQL verwendet wird. Tripel werden aus Subjekt-Prädikat-Objekt-Konstruktionen abgeleitet, die auf Entitäten (Menschen, Orte oder Dinge) und ihren Beziehungen basieren. Beispiel: "Hr. Schmitz lebt in Köln." Und "Köln liegt in Deutschland." Durch Kombination dieser beiden Fakten lassen sich Herleitungen wie z. B. "Hr. Schmitz lebt in Deutschland" bilden.

Auf diese Weise können simple Fakten zu einem Graphen mit Milliarden von Fakten und Beziehungen verknüpft werden. Solche Wissens-Graphen bilden die Grundlage von Anwendungen, die Sie tagtäglich nutzen, z. B. die Suchfunktion von Google oder "Personen, die Sie vielleicht kennen" in LinkedIn.

RDF (und auch SPARQL) wird zunehmend wichtiger, weil die Datenmodelle selbst immer komplexer, assoziativer und heterogener werden. Dies ist darauf zurückzuführen, dass die Vielfalt von Informationen gegenüber anderen Faktoren wie Volumen und Geschwindigkeit eine immer größere Bedeutung einnimmt."

Warum RDF-Tripel?

Ganz einfach. Weil Tripel Ihre Daten mit Kontext anreichern und so die Datenintegration verbessern.

Tripel bieten in vielen Anwendungsfällen, in denen es um die Beziehungen zwischen Entitäten geht, einen Vorteil gegenüber relationalen Datenbanken: Sie müssen sich nicht über Fremdschlüssel, verschachtelte Abfragen und komplexe Verknüpfungen den Kopf zerbrechen.

WUSSTEN SIE SCHON...?

Tripel sind universell verständlich und lassen sich einfach durchsuchen und weitergeben.

Tripel lassen sich zu maschinenlesbaren Graphen verbinden und können sogar für die Ableitung neuer Fakten eingesetzt werden.

Gemeinsame Standards für RDF-Tripel und die Abfragesprache SPARQL werden vom W33C festgelegt.

Tripel-Datenbanken lassen sich für Größenordnungen von Hunderten Milliarden von Fakten und Beziehungen skalieren.

Tripel-Datenbanken können Ontologien nutzen, um Fakten zu organisieren und zu kategorisieren. Ontologien ähneln Taxonomien, sind jedoch umfangreicher und nützlicher.

Neu in der Welt der Semantik? Wie wäre es zum Einstieg hiermit?

In unserem Webinar "Peek Inside MarkLogic Semantics" erhalten Sie eine technische Einführung in semantische Technologien. Sie können sich auch eine Kopie des E-Books "Semantik für Dummies" herunterladen, das Ihnen nicht nur einen Überblick über die Semantik bietet, sondern auch Anwendungsbeispiele enthält.

E-Book herunterladenWebinar ansehen

"Mit RDF-Tripeln können wir Echtzeit-Verbindungen zwischen Daten herstellen, z. B. Organisationsstrukturen und Beziehungen zwischen Dokumenten und Daten. Wir haben unsere Plattform auf über 40.000 Dokumente pro Stunde mit einem Bestand von 50 Millionen Datenpunkten in 8 Millionen Dokumenten skaliert. Und dabei stößt MarkLogic noch längst nicht an seine Grenzen."

Michael Henry | KPMG

Vorteil MarkLogic: Multi-Modell-Datenbank für Dokumente, Daten und Tripel

Dokumente + Daten + Tripel: MarkLogic speichert Dokumente, Daten und Tripel im nativen Format.

  • Frei zusammensetzbar – MarkLogic basiert auf einem Multi-Modell-Ansatz und ermöglicht es, frei zusammensetzbare Abfragen für alle Datentypen zu erstellen
  • Für Unternehmen geeignet – Umfassende Funktionen für Unternehmen, darunter ACID-Transaktionen, Sicherheit und Disaster Recovery
  • Ausgeklügelte Indexierung – Spezieller Tripel-Index für gesteigerte Abfrageleistung
  • Enorme Datenmengen – MarkLogic kann Hunderte Milliarden von Tripeln speichern

Warum ist der Multi-Modell-Ansatz besser? Er vereinheitlicht Ihr Datenmodell, bietet mehr Flexibilität und ermöglicht effektivere Abfragen.

O'Reilly E-Book zu Multi-Modell-Datenbanken herunterladen

Verwendung von Semantik

MarkLogic-Semantik ist nicht für jeden Anwendungsfall erforderlich. Manchmal reicht das Dokumentenmodell alleine völlig aus. Wenn Ihre Daten jedoch Beziehungen beinhalten, die gespeichert und in großem Umfang abgefragt werden müssen, dann ist Semantik eine großartige Bereicherung. Hier einige der beliebtesten Anwendungsfälle für MarkLogic Semantik.

MarkLogic Semantik fungiert als eine Art Klebstoff für Stammdaten, weil es ein ideales Modell für Referenz- und Metadaten bietet (Herkunft, Abstammung usw.). MarkLogic speichert Daten zu Entitäten, z. B. zu Kunden und Bestellungen, als Dokumente und kann auch die Beziehungen zwischen diesen Entitäten als RDF-Tripel speichern. Darüber hinaus lassen sich auch Metadaten, z. B. wann ein Dokument erstellt wurde bzw. wie es sich auf andere Dokumente bezieht, mithilfe einer Ontologie beschrieben werden. Mit den Multi-Modell-Funktionen von MarkLogic können diese semantischen Beziehungen innerhalb der Dokumente selbst oder als eigenständige RDF-Tripel gespeichert werden.

MarkLogic Semantik unterstützt Sie dabei, personalisierte Empfehlungen in Echtzeit bereitzustellen und Suchanfragen intelligent zu erweitern. Bei Graphen geht es in erster Linie um hochgradig vernetzte Daten. Mit MarkLogic Semantik können Sie diese Beziehungen nutzen, um verwandte Personen, Produkte, Fragen oder beliebige andere in einem Graphen enthaltene Elemente vorzuschlagen. So lässt sich die User Experience am Front-End verbessern. Darüber hinaus können Sie Suchen auf Grundlage semantischer Ontologien intelligent erweitern. Auf diese Weise erhalten Sie selbst dann relevante Ergebnisse, wenn in einem Dokument das gesuchte Schlüsselwort nicht vorkommt. Dies ist eine intelligentere Möglichkeit für die Entwicklung von Suchanwendungen.

MarkLogic Semantik ermöglicht es Finanzdienstleistern, Beziehungen zwischen Parteien zu untersuchen, um so Haftungsrisiken oder potenzielle Betrugsfälle aufzudecken. Für Versicherungsunternehmen bietet es die Möglichkeit, Versicherungsbetrug aufzudecken, da sich in der Regel Verbindungen zwischen Rechnungsadressen, Kunden und den historischen Aufzeichnungen herstellen lassen. Oft gehen diese Arten von Verbindungen in nicht integrierten bzw. nicht indexierten Datenbanken verloren. Dank Semantik ist es möglich, das Beziehungsgeflecht im Handumdrehen darzustellen.

Intelligence-Daten können einen erheblichen Umfang haben, eine komplexe Struktur aufweisen und aus verschiedenen Quellen in unterschiedlichen Formaten und Typen vorliegen. Um aus ihnen schlau zu werden, müssen die Daten integriert werden. Und für eine Analyse müssen Sie verstehen, in welcher Beziehung die Daten zueinander stehen. Mit MarkLogic Semantik können Sie Daten miteinander verknüpfen und diese Beziehungen dann visualisieren, um Schlussfolgerungen daraus zu ziehen. Ob ein Verdächtiger, der vom Geheimdienst überwacht wird, oder ein Einbrecher, dem die Polizei auf der Spur ist – dank MarkLogic Semantik war es noch nie so einfach, Ihre Daten auf intelligente Art und Weise zu nutzen.

MarkLogic Semantik ermöglicht es Ihnen, die Billionen verfügbaren Tripel mit allen möglichen Informationen zu verwenden. Diese Informationen sind frei verfügbar – Sie brauchen nur einen Blick in die DBPedia, das CIA Factbook oder Geonames zu werfen. Sie können auch Ihre eigenen Tripel verwenden. So oder so, diese Tripel können die Struktur eines Wissens-Graphen bilden, der die Suche- und Discovery-Funktion verbessert. Es kann z. B. nützlich sein, einem Benutzer Fakten über London anzubieten, wenn dieser nach dem Begriff London sucht. Oder einem Benutzer, der nach einem bestimmten Unternehmen sucht, anzuzeigen, wem das gesuchte Unternehmen gehört und welche Tochtergesellschaften es besitzt. In der Welt der vernetzten Daten gibt es schier unbegrenzte Möglichkeiten.

MarkLogic Semantik unterstützt Sie bei der Verwaltung aller IT-Assets in einem Großunternehmen oder beliebiger einzelner Ressourcen. Die meisten Großunternehmen besitzen Hunderte, wenn nicht Tausende von IT-Assets. Sie sind wertvoll und erfordern einen hohen Wartungsaufwand. Denken Sie nur an die Racks und Server in einem Rechenzentrum. Mit MarkLogic Semantik können Sie die zugehörigen Daten als Tripel speichern und dann eine einfache Abfrage ausführen, z. B. "zeige mir eine Liste aller Dell-Server, die mehr als zwei Jahre alt sind". So erhalten Sie umgehend eine Antwort.

Unterstützte semantische Funktionen

  • Speichern und Verwalten von Milliarden von RDF-Tripeln
  • Abfragen, die sich über mehrere Dokumente, Daten und Tripel erstrecken
  • Tripel-Index für Suchergebnisse im Millisekundenbereich
  • Tripel-Cache für große high performance Cluster
  • Bulk-load von Tripeln über die MarkLogic Content Pump (mlcp)
  • Reifizierung und Verfolgung des Ursprungs durch Hinzufügen von Metadaten
  • XQuery-Hilfsmodule für Serialisierungen und transitive Abschlüsse
  • Updates und Aggregationen über MarkLogic APIs
  • Graphentraversierung mit Eigenschaftspfaden und transitiven Abschlüssen
  • Semantische Schlussfolgerungen anhand von Regelsätzen bei der Abfrage
  • Regelsätze für RDFS, RDFS+ und OWL Horst
  • Unterstützung benutzerdefinierter Regelsätze
  • Ontology Driven Entity Extraction
  • SPARQL Support  1.1
  • Unterstützung von SPARQL-Endgeräten und Protokollen für Graphdatenbanken
  • SPARQL aus serverseitigem JavaScript, Node.js
  • Unterstützung von Jena und Sesame APIs
  • Integration mit Semantik-Technologiepartnern (wie z. B. Smartlogic, Pool Party, Cambridge Semantics)
  • MarkLogic Funktionen: ACID-Transaktionen, zertifizierte Sicherheit (auf Dokumenten-/Tripel-Ebene), Hochverfügbarkeit und Disaster Recovery, Skalierbarkeit und Elasticity

Ontology Driven Entity Extraction

Die einzigartige Integration von Semantik in MarkLogic verbessert das Auffinden und die Klassifizierung von Daten, indem Entitäten in fortlaufendem Text erkannt werden. Mit dieser Funktion können Sie automatisch Entitäten (Menschen, Orte, Dinge) im Fließtext identifizieren. Die Ergebnisse lassen sich als Liste dieser Entitäten (Extraktion) anzeigen, oder innerhalb des Dokuments markieren (Anreicherung).

Entitäten werden in einem manuell gepflegtem Wörterbuch definiert. Oder erstellen Sie automatisch aus einer SKOS Ontology ein solches Wörterbuch. Wenn Sie NLP (Natural Language Processing) zur Definition einer Entität benötigen, verwenden Sie einfach Tools von Drittanbietern wie Smartlogic, PoolParty, Expert System, NetOwl oder Calais.

Diese Unternehmen nutzen MarkLogic und Semantik

Die auf MarkLogic basierende Digital Labor Automation Platform (DLAP) von KPMG steht an der Spitze der IA-Entwicklung (Intelligente Automatisierung). Mit ihr kann KPMG seine umfassende Fachkompetenz aus den Bereichen Steuerrecht und Meldewesen hochgradig automatisiert auf seine Kundendaten anwenden. KPMG setzt Semantik ein, um Dokumente bei der Erfassung anzureichern und die Suchmöglichkeiten zu verbessern.


Mit MarkLogic können verschiedene Systeme und Funktionen zusammengebracht werden, um den Informationsaustausch und die Schaffung von neuem Wissen zu ermöglichen. Das Endergebnis sind politische Strategien und Grundsätze, mit der die OECD versucht, das wirtschaftliche und soziale Wohlergehen aller Menschen weltweit zu verbessern. Die OECD wählte MarkLogic als ihre Datenbank-Kernplattform aus, um einen Data Hub für die neue OECD-Netzwerkumgebung ONE zu schaffen.


Pearson bietet globale Ausbildungslehrpläne an. Das Unternehmen verwendet MarkLogic, um die Speicherung, Verwaltung und Bereitstellung digitaler Inhalte über eine interaktive Benutzeroberfläche zu ermöglichen. Pearson nutzt die leistungsstarken Multi-Modell-Funktionen von MarkLogic zusammen mit Semantik, um die Daten von Kursbewertungen und die Beziehungen der Schüler mit den Lerninhalten zu verbinden.


Die British Standards Institution (BSI) veröffentlicht Standards und erbringt zugehörige Dienstleistungen für Unternehmen auf der ganzen Welt. Um die Suche nach Standards und Normen zu erleichtern, entwickelte die BSI die auf Semantik basierende Online-Anwendung British Standards Online (BSOL).

Ausgewählte Semantik-Partner

Weitere Ressourcen

Die Daten im Gesundheitswesen sind sehr vielfältig: Labortests, Arztnotizen, Krankengeschichten, Scans, wissenschaftliche Artikel, Informationen in sozialen Medien und öffentlichen Registern, Forderungsdaten und Bestellhistorien, Medikationsdaten usw.
In diesem Webinar erfahren Sie, wie Semantik Versicherungsgesellschaften dabei unterstützt, verschiedenartige Daten zu aggregieren und verborgene Zusammenhänge zu erkennen, um betrügerisches Verhalten zu ermitteln.
In dieser Sitzung zeigen wir anhand eines praktischen Beispiels, wie MarkLogic eine proaktive Polizeiarbeit mit einem datenorientierten Ansatz ermöglicht.

Funktionen speziell für Unternehmen

Auf dieser Website werden Cookies verwendet.

Mit der Nutzung dieser Webseite stimmen Sie der Verwendung von Cookies gemäß der MarkLogic Datenschutzrichtlinie zu.