MLTV now live! New videos, new content hub.

Überblick

Warum sehen wir uns immer noch mit so großen Herausforderungen bei der Datenintegration konfrontiert, obwohl wir auf dem Markt nicht relationaler Datenbanken weit verbreitet sind, die neue Anwendungen erstellen und Legacy-Anwendungen modernisieren können?

Organisationen haben große Mengen unterschiedlicher Daten angehäuft, die normalerweise über viele Systeme verteilt sind, die in Silos arbeiten. Die Anzahl dieser unterschiedlichen Datensilos nimmt aber erst mit der Einführung von Cloud-Diensten und -Anwendungen zu. Um Anwendungen zu entwickeln, die den sich schnell ändernden Geschäftsanforderungen gerecht werden, müssen Unternehmen daher:

  • Verschiedene Datenquellen zur Bereitstellung einer einheitlichen Ansicht schnell laden und integrieren
  • Kosten und Risiken der Datenintegration reduzieren durch eine iterative schnellere Lieferung der Ergebnisse
  • Datenverwaltung und -sicherheit verbessern, um den Selbstbedienungsverbrauch und die gemeinsame Nutzung von Daten zu erhöhen

In diesem Vergleich wird untersucht, wie Unternehmen ihre Datenintegrationsanforderungen mithilfe der beiden Cloud-Datenplattformen – MongoDB Atlas und MarkLogic Data Hub Service – erfüllen können. Insbesondere werden die Fähigkeiten und zugrunde liegenden Unterschiede zwischen den beiden Cloud-Diensten bei der Datenintegration in einem Unternehmen verglichen.

Vergleichstabelle

MarkLogic Data Hub-Service MongoDB Atlas
Zweck
  • Datenintegration und -speicherung
  • Ideal für komplexe Use Cases der Datenintegration – insbesondere für große Datensätze mit mehreren Datenmodellen, sich schnell ändernden Daten oder sich schnell entwickelnde Geschäftsanforderungen
  • Datenspeicherung
  • Ideal für nicht transaktionale Anwendungen, die eine einfach zu bedienende JSON-Dokumentendatenbank benötigen
Zentrale Plattform
  • Ja
  • Multi-Modell-Datenbank mit Funktionen zur Datenintegration und -anreicherung
  • Einheitliche, konsistente Echtzeit-Ansicht aller Daten
  • Detaillierte Sicherheitsrichtlinien
  • Volltextsuche
  • Daten mit moderner Sucherfahrung und Visualisierungen durchforsten
  • Nein
  • Dokumentendatenbank
  • Benötigt Tools von Drittanbietern zur Datenintegration (ETL, MDM, etc.)
  • Benötigt MongoDB Stitch zur Definition detaillierter Sicherheitsrichtlinien und zur Implementierung von Datendiensten und Warnungen
  • Benötigt Tools von Drittanbietern oder MongoDB Atlas-Suche zur Volltextsuche
Datenintegration
  • Agile Datenanreicherung
  • Modellbasierte, iterative Datenharmonisierung
  • Smart Mastering für die meisten MDM-Funktionen
  • Vollständige Herkunfts- und Abstammungsverfolgung
  • Keine Unterstützung
  • Separate, komplexe Handhabung von Metadaten, semantischen und unstrukturierten Daten
  • Benötigt Tools von Drittanbietern für Datenharmonisierung, Mastering und semantische Daten (ETL, MDM, Graph-Datenbank)
Zugrunde liegende Datenbank
  • MarkLogic Server
  • Multi-Model-Datenbank
  • Native Unterstützung für JSON, XML, RDF/OWL/Turtle, Geodaten
  • MongoDB
  • Dokumentendatenbank
  • Native Unterstützung für JSON-ähnliche Dokumente (BSON), Geodaten
Transactions
  • 100 % ACID-konform
  • Leistungsstarke, verteilte Transaktionen
  • Garantiert äußerst konsistente Lese- und Schreibvorgänge
  • Nicht 100 % ACID-konform
  • Abstimmbare Datenkonsistenz
  • Dokumentenübergreifende Transaktionen mit Snapshot-Isolation
  • Hohe Latenzzeit und niedriger Durchsatz bei äußerst konsistenten Lese- und Schreibvorgängen
Sicherheit & Governance
  • Detaillierte Sicherheit auf Unternehmensebene
  • Sicherheit auf Dokument- und Unterdokumentenebene
  • Datenabstammung
  • Regelbasierte Schwärzungsregeln
  • Bitemporales Datenmanagement für vollständigen Prüfpfad
  • Übergibt Entwicklern von Anwendungen die Verantwortung für fein abgestufte Sicherheitslösungen
  • Keine Unterstützung für Sicherheit auf Dokumenten- oder Unterdokumentenebene
  • Keine Datenabstammung
  • Benötigt MongoDB Stitch zur Durchsetzung fein abgestimmter Sicherheitsrichtlinien
Datenzugriff
  • REST-APIs und Abfragesprachen (JavaScript, XQuery, SPARQL, SQL)
  • SQL- und RDF-Projektionsvorlagen
  • Zusammensetzbare Abfragen, optimiert zur Abfrage mehrfach strukturierter Daten
  • Agile Datenanreicherung liefert Datendienste 10-mal schneller
  • Keine SQL-Unterstützung
  • Keine REST-API
  • Ad-hoc-Abfrage von Dokumenten
  • Abfragen von Aggregations-Pipelines
Suche
  • Volltextsuche
  • Synchrone automatische Indizierung (Wörter, Struktur usw.)
  • Rohdaten werden beim Laden zur sofortigen Analyse automatisch indiziert
  • Zusätzliche Indizes für Echtzeit-Alarme, Geodaten, semantische Tripel usw.
  • Index-Verwaltung erforderlich
  • Atlas-Suche für fein abgestimmte Volltextsuche erforderlich (oder Tools von Drittanbietern)
  • Atlas Search indexes are eventually consistent
  • Primärindex voreingestellt
  • Zusätzliche Sekundärindizes auf jedem Feld, einschließlich tief verschachtelter Array-Elemente
Skalierbarkeit
  • Workload-basierte automatische Skalierung
  • Unabhängige Skalierung von angereicherten, analytischen und betrieblichen Workloads und Speicherung
  • Automatische Skalierung von Rechenleistung und Speicherung
  • Scale-out (mit Daten-Sharding)
  • Scale-up (mit Replica-Set)
Kosten
  • Niedrige, vorhersehbare Kosten
  • Bezahlung für eine Dienstleistung
  • Kostenloses automatisiertes Bursting führt nicht zu Kostenspitzen
  • Teuer, unvorhersehbar
  • Bezahlung für mehrere Dienstleistungen
  • Kein kostenloses Bursting
Implementierung
  • Multi-Cloud
  • AWS, Azure
  • Multi-Cloud
  • AWS, Azure, GCP

Was ist MongoDB Atlas?

MongoDB Atlas ist ein vollständig verwalteter Cloud-Datenbankdienst (DBaaS). Für Organisationen ist es kinderleicht, ihre Anwendungen in die Cloud zu migrieren, mit verbrauchsabhängigen Preisen zu arbeiten und die administrativen Aufgaben zur Ausführung, Skalierung und Verwaltung der MongoDB NoSQL-Datenbank zu entlasten.

MongoDB hat sich zur beliebtesten Dokumentdatenbank entwickelt, wobei die Open-Source-Lizenz und die Benutzerfreundlichkeit zum Tragen kommen. Mit der verteilten, skalierbaren Architektur und der einheitlichen Abfrageschnittstelle zur Datenaggregation können Entwickler schnell hochverfügbare und reaktionsfähige Anwendungen erstellen. Im Gegensatz zu relationalen Datenbanken bietet das Dokumentdatenmodell zudem die Flexibilität, Anwendungsdatenmodelle einfach weiterzuentwickeln, ohne Neumodellierung des Datenbankschemas, wodurch Entwickler produktiver arbeiten können. In jüngster Zeit haben neue Funktionen wie dokumentenübergreifende ACID-Transaktionen und neue Cloud-Dienste wie MongoDB Stitch den MongoDB Atlas für eine breitere Palette von Use Cases attraktiver gemacht.

Was ist der MarkLogic Data Hub Service?

Der MarkLogic Data Hub Service ist ein serverloser Cloud Data Hub für die agile Datenintegration. Für Organisationen ist es kinderleicht, ihre Datenintegrations-Workloads in die Cloud zu migrieren und transaktionale, analytische und betriebliche Anwendungen bedarfsgerecht bei vorhersehbaren und niedrigen Kosten auszuführen.

Der Data Hub Service ist einem DBaaS-Angebot überlegen und bietet eine einheitliche Architektur zur Aufnahme und Anreicherung beliebiger Daten sowie zur Steuerung des gesamten Datenintegrations-Lebenszyklus. Zur vollständigen Palette an Funktionen gehören Multi-Modell-Datenmanagement, integrierte Suche, Transaktionen, fein abgestimmte Sicherheitslösungen, Smart Mastering und mehr. Mit diesen Funktionen können Organisationen Daten schnell unternehmensweit integrieren, um dauerhafte Datenbestände zu erstellen, die mehreren Use Cases und Nutzerpersönlichkeiten dienen.

Einige der wesentlichen Vorteile des Data Hub Service sind:

  • Flexibilität, Datenquellen nach Bedarf hinzuzufügen, sich ständig ändernde Daten zu verarbeiten und Schema-on-Read-Vorgänge durchzuführen, um aktuelle und neue Use Cases zu unterstützen (im Gegensatz zur Vorab-Datenmodellierung)
  • Agile Datenintegration (im Gegensatz zu langsamer und komplexer ETL)
  • Beseitigung von Datensilos und vereinfachte Datenarchitektur (im Gegensatz zur Integration verschiedener Datenbanken mit einem Polyglot-Persistenz-Ansatz)
  • Reichhaltigere Modellierung von Geschäftsentitäten und -beziehungen und dadurch reichhaltigere Abfrage- und Datendienste
  • Cloud-neutraler Dienst mit offenen Standards und APIs für die Aufnahme, Abfrage und Freigabe von Daten (im Gegensatz zur Anbieterbindung)

Terminologie und Konzepte

MarkLogic Data Hub-Service MongoDB Atlas
Datenmodell
  • Dokument und Grafik
  • JSON, XML, RDF/Turtle/OWL
  • Dokument
  • JSON
Datenanreicherung
  • Modellbasierte Datenzuordnung
  • Smart Mastering für MDM
  • n. z.
Datenabstammung
  • Die Originaldaten werden in jedem beliebigen Format gespeichert und die integrierten Daten sind zu Daten in jedem beliebigen Format rückverfolgbar
  • n. z.
Indizierung
  • Universeller Index, Volltextsuche
  • Sekundär-Index
Abfrage
  • SQL/SPARQL/Optik-API
  • Aggregations-Pipeline
Sicherheit
  • Dokumenten- und Feldebene/rollenbasiert
  • Regelbasierte Daten-Schwärzung
  • Sammlung/rollenbasiert
Transactions
  • 100 % ACID-konform
  • Hohe Leistung
  • Abstimmbare Datenkonsistenz
  • Hohe Latenzzeit für konsistentes Lesen/Schreiben

 

Wie in der Tabelle oben veranschaulicht wird, unterstützt der MarkLogic Data Hub Service eine Vielzahl von Datenformaten, wobei die Datenintegration durch die Aufnahme von Daten in ihrer nativen Form erleichtert wird. Die Originaldaten können dann nach und nach mit integrierten Tools zur Datenanreicherung in kanonische Daten umgewandelt werden, während gleichzeitig wertvolle Herkunfts- und Abstammungs-Metadaten aufgezeichnet werden. Daher bleiben die Metadaten und Daten über den gesamten Lebenszyklus hinweg zusammen und können sicher durchsucht und für einen geschützten Datenaustausch abgefragt werden.

Warum ist der MarkLogic Data Hub Service die bessere Option für Cloud-Services?

Der MarkLogic Data Hub Service und MongoDB Atlas basieren beide auf einer (nicht relationalen) NoSQL-Grundlage, dienen jedoch recht unterschiedlichen Zwecken. Die folgenden Abschnitte veranschaulichen die wichtigsten Unterschiede zwischen den beiden Datenmanagement-Plattformen.

Zentrale Plattform: Cloud Data Hub im Vergleich zur Cloud-Datenbank

Der MarkLogic Data Hub Service ist ein Cloud-Hub, das eine Full-Stack-Plattform für die Integration von Unternehmensdaten bietet, ohne dabei den Betrieb zu beeinträchtigen. Seine einheitliche Architektur führt zu einer schnelleren Markteinführung und niedrigeren Gesamtbetriebskosten (TCO) als bei einer Zusammenstellung der eigenen Daten Hub-Lösung zur Datenintegration.

Der Data Hub Service bietet die Flexibilität, Daten in jedem beliebigen Format zu laden, diese Daten inkrementell zu integrieren und zu pflegen und sie mit semantischen Metadaten anzureichern – ohne dabei Kompromisse bei der Datenqualität, -sicherheit und -verwaltung in Kauf nehmen zu müssen. Er lässt sich zudem nahtlos in die Plattformdienste von AWS und Azure integrieren, so dass Organisationen den Data Hub Service problemlos in ihre Unternehmensdatenarchitektur integrieren können. Benutzer können verschiedene Cloud-Plattformservices nutzen, um Cloud-native Anwendungen, Workflows und Pipelines zu erstellen, die Datenintegrations-Workloads und Datendienste im Data Hub Service orchestrieren.

MongoDB Atlas ist ein Dokumenten-DBaaS-Angebot. MongoDB bietet auch verschiedene zusätzliche Cloud-Dienste wie Atlas Search, MongoDB Stitch, MongoDB Charts, die in Atlas integriert sind und separat von Atlas abgerechnet werden.

MongoDB Atlas bietet keine fein abgestimmten Datensicherheitsrichtlinien und Anwendungsdienste zum Aufbau von Datendiensten (oder REST-APIs). Deshalb müssen Anwendungen Datenverarbeitungslogik und Datensicherheitsrichtlinien außerhalb der Datenbank implementieren, wodurch Anwendungen anfälliger für Sicherheitslücken werden und mehr Skalierbarkeitsprobleme auftreten. Im Gegensatz dazu sind die Datendienste (oder REST-APIs) beim MarkLogic Data Hub Service in der Datenbank implementiert und profitieren von der integrierten Suchmaschine, dem Caching und den fein abgestimmten Datenzugriffsrichtlinien für eine schnelle und sichere Datenverarbeitung.

Organisationen können den MongoDB Stitch-Dienst abonnieren, der Anwendungsdienste und fein abgestimmte Datenzugriffsrichtlinien für Atlas bietet, jedoch fallen hierfür zusätzliche verbrauchsabhängige Kosten an, die zu höheren TCO führen.

Schließlich bietet MongoDB Atlas keine sofort einsatzbereiten Tools zur Datenintegration. Daher müssen Organisationen Tools von Drittanbietern einsetzen, um Daten für verschiedene Use Cases zu integrieren, wie eine operative Datenebene oder die Modernisierung von Altdaten. Dies erhöht nicht nur die TCO, sondern stellt auch die Governance vor die Herausforderung, Daten und Metadaten über mehrere Tools hinweg konsistent zu halten. Im Gegensatz dazu verfolgt der MarkLogic Data Hub Service Daten zusammen mit den Metadaten während des gesamten Integrationslebenszyklus, sodass Organisationen alles an einem Ort verwalten und sichern können. Daher hat MarkLogic einen bedeutenden Vorteil gegenüber MongoDB bei der Integration von Daten aus Silos.

Daten-Integration: Integrierte Tools oder Tools von Drittanbietern?

Der MarkLogic Data Hub Service ist ein einzelner, speziell entwickelter Dienst für die agile Integration mehrfach strukturierter Daten. Mit ihm können Anwender einen iterativen Ansatz zum Aufbau eines kanonischen Modells verfolgen, Daten harmonisieren und steuern sowie diese mit Semantik anreichern, damit Datendienste schneller an Anwendungen liefern. Mit diesem Ansatz haben Organisationen viel zügigere Ergebnisse erzielt.

Der Data Hub Service bietet End-to-End-Tools zur Datenanreicherung, die nicht nur Profis bei der Verarbeitung nicht relationaler Daten sind, sondern auch Abstammung, Herkunft und andere Metadaten verfolgen, sodass Benutzer den gesamten Prozess steuern können. Die Tools zur Datenanreicherung mit niedrigem/keinem Code umfassen folgende Fähigkeiten:

  • Modellierer zum Definieren hierarchischer (oder verschachtelter) Entitäten, Beziehungen und anderer Metadaten (wie Indizes, PII-Felder usw.)
  • Zuordnung zur Harmonisierung von Quelldaten mit einem kanonischen Modell mithilfe einer reichen Bibliothek eingebauter Funktionen (oder benutzerdefiniertem Code)
  • Smart Mastering zur Definition von Abgleichs- und Zusammenführungsregeln für die Behandlung (oder Entfernung) von Duplikaten mit der Option, diese einzeln zu trennen
  • Explorer, der eine moderne Sucherfahrung und Visualisierungen für den Self-Service-Verbrauch angereichter Daten und Metadaten bietet.

Diese Point-and-Click-Tools unterstützen eine progressive Datenanreicherung. Benutzer können jeden Schritt des Prozesses validieren und Probleme schnell beheben (oder Änderungen berücksichtigen), weil sie zu jedem Schritt des Datenintegrations-Lebenszyklus zurückkehren können. So kann das kanonische Modell leicht erweitert werden, um neue Datenquellen einzubeziehen und geregelte, angereicherte Daten zu liefern, um unmittelbare Geschäftsprobleme zu lösen.

Im Vergleich müssen Benutzer bei MongoDB Atlas verschiedene Tools von Drittanbietern integrieren, wie ETL (zur Harmonisierung der Daten), MDM (zur Stammdatenverwaltung), eine Graphen-Datenbank (zur semantischen Anreicherung) und einige mehr zur Integration von Daten aus Silos. Die Operationalisierung und Wartung dieser Datenintegrationsarchitektur ist teurer. Dafür werden mehrere Dienste benötigt, was die Infrastrukturbelastung (wie Datenduplizierung, Backups usw.), die Komplexität von DevOps und die Governance-Herausforderungen (wie fragmentierte Sicherheitsrichtlinien, Abstammung usw.) erhöht.

Die Datenintegrationswerkzeuge von Drittanbietern (wie ETL, MDM) sind auch eher für relationale Daten geeignet als für nicht relationale Daten. Daher ist bei diesen Tools zur Harmonisierung und Beherrschung komplexer hierarchischer Dokumente ein benutzerdefinierter Code erforderlich, der oft schwierig zu warten und zu skalieren ist.

Die vereinheitlichte Architektur des MarkLogic Data Hub Service sorgt für einen einfachen Betrieb und erhöht die Produktivität, um einen sicheren und vertrauenswürdigen Integrations-Hub aufzubauen. Mit dem iterativen, modellbasierten Ansatz können Organisationen problemlos verschiedene Datenformate (wie IoT, Mainframe, ERP usw.) aus beliebigen Quellen (wie Oracle, Teradata, Hadoop usw.) integrieren, um konsistente und zweckmäßige Datenbestände zu liefern.

Datenmodell: Multi-Modell im Vergleich zu Dokumentenmodell

Der MarkLogic Data Hub Service baut auf der bewährten Grundlage von MarkLogic Server auf, einer Multi-Modell-Datenbank, die Daten als Dokumente und semantische Graphen speichert und relationale Ansichten für SQL-Abfragen unterstützt. Er bietet die Flexibilität, abstrakte Geschäftskonzepte aus mehreren Silos zu verwalten und sie als Entitäten und Beziehungen innerhalb eines einzigen integrierten Backends darzustellen.

Benutzer können Daten in mehreren Formaten speichern (wie JSON, XML, RDF-Triples usw.), sogar für dieselbe Entität, und mit Standard-Abfragesprachen (wie SQL, SPARQL) oder REST-APIs auf Daten zugreifen. Diese Integration von semantischen und Dokumentdaten verleiht den Daten durch die Erfassung hierarchischer Beziehungen zusätzliche Bedeutung. So können Benutzer beispielsweise Entitäten als JSON-Dokumente speichern und sie mit domänenspezifischen Ontologien anreichern, indem sie RDF-Tripel verwenden, um einen Wissensgraphen für semantische Suchen zu erstellen. Dadurch ist MarkLogic viel geschickter und dient bei der Verwaltung von Entitäten und Beziehungen als eine einheitliche Datenintelligenzplattform.

MongoDB Atlas ist eine Dokumenten-Datenbank mit einem einzigen Modell. Sie unterstützt keine anderen nativen Datenmodelle. Sie speichert Daten als BSON, eine binäre Serialisierung von JSON-Dokumenten, und bietet einen flexiblen Aggregationsrahmen zur Verarbeitung von Dokumenten mit verschiedenen Bedienelementen (wie Zusammenfügen, Filtern usw.).

Das Dokumentenmodell sorgt für eine äußerst flexible Datenbank. Es ist jedoch nicht effizient genug, um Beziehungen oder stark verbundene Daten zu speichern und zu analysieren. MongoDB Atlas bietet ein Bedienelement zur Aggregation, das eine rekursive Suche in Dokumenten für eine einfache feldwertbasierte Graphentraversierung durchführt. Komplexe Pattern-Matching-Graph-Abfragen werden jedoch nicht unterstützt, damit mehrere Beziehungen in einem Datensatz analysiert werden können. Deshalb können Benutzer mit MongoDB Atlas keine analytischen Anwendungen auf Graph-Daten erstellen. Im Gegensatz dazu unterstützt der MarkLogic Data Hub Service nativ Graphen zur Beschreibung von Beziehungen und zur Anreicherung von Daten mit Domänenwissen für semantische Suchen. Mit diesem Ansatz können Benutzer schnell ausgereifte analytische Anwendungen wie soziale Grafiken, Betrugserkennung und mehr erstellen.

Schließlich sind die Erfassungen im MongoDB Atlas restriktiver, da ein Dokument nur einer Erfassung zugeordnet werden kann und die Sicherheitsrichtlinien für Erfassungen definiert werden und nicht für Dokumente. Im Gegensatz dazu ähneln die Sammlungen beim MarkLogic Data Hub Service eher Etiketten, die eine flexible Suche bis ins kleinste Detail ermöglichen. Zudem können Sicherheitsrichtlinien auf einer feiner gegliederten Ebene definiert werden. Diese können bei der Erfassung des Dokuments oder der Unterdokumente angewendet werden.

Bei der Integration von Daten aus Silos benötigen Organisationen eine flexible Datengrundlage. Dafür reicht das reine Dokument-Datenmodell von MongoDB Atlas nicht aus. Mit dem MarkLogic Data Hub Service erhalten Benutzer eine flexible Multi-Modell-Datengrundlage in einem einzigen integrierten Backend, die für eine einfachere, schnellere und sicherere Datenintegration sorgt.

Transaktionen: 100 % ACID-Konformität oder eingeschränkte ACID-Konformität?

MarkLogic treibt seit über einem Jahrzehnt hochleistungsfähige transaktionale Anwendungen (oder Aufzeichnungssysteme) voran. Der MarkLogic Data Hub Service unterstützt Transaktionen mit 100 % ACID-Konformität, weil er eine ausgezeichnete Datenkonsistenz sowohl für Lese- als auch für Schreibvorgänge bietet. Er baut auf der bewährten Grundlage von MarkLogic Server auf und bietet Unternehmen kompromisslose Datenintegrität und Langlebigkeit für große, im Betrieb einsatzfähige Systeme für missionskritische Use Cases.

Leistungsstarke ACID-Transaktionen sind ein grundlegendes Merkmal von operativen und transaktionalen Data Hubs. Mit dem Data Hub Service können Benutzer die Daten schnell und branchenübergreifend integrieren, um eine einheitliche, konsistente und in Echtzeit verfügbare Datenansicht für betriebliche Anwendungen zu erstellen. Weitere Einzelheiten darüber, wie MarkLogic ACID-Transaktionen unterstützt, finden Sie in diesem Blog.

Die MongoDB-Unterstützung für Transaktionen hat sich im Laufe der Jahre verbessert, aber ist immer noch keine praktikable Option für jeden Use Case, der eine garantierte Konsistenz in bedarfsgerechter 100 % ACID-Konformität erfordert. Wie sich herausstellt, ist dies eine Funktion, die Entwickler wirklich wollen und die MongoDB-Entwickler seit Jahren wollten.

Beim jüngsten Release wurde die Unterstützung für ACID-Transaktionen mit mehreren Dokumenten bei Replikat-Sets und gesplitteten Cluster-Bereitstellungen hinzugefügt. Standardmäßig sind Transaktionen in MongoDB aufgrund schwacher Standardeinstellungen für Read- und Write-Concerns nicht ACID-konform. Daher liegt es an den Entwicklern, explizit die stärkste Stufe des Read-Concerns (d. h. Momentaufnahme) und des Write-Concerns (d. h. Mehrheit) bei Transaktionen festzulegen, um eine ACID-Konformität zu erreichen. In einem unabhängigen Bericht über die ACID-Konformität der MongoDB-Version 4.6.2 wird jedoch festgestellt, dass es der MongoDB selbst bei strikten Read- und Write-Concerns nicht gelang, die Isolierung durch Momentaufnahmen aufrechtzuerhalten. Die Schlussfolgerung im Bericht lautet, dass die Behauptung der MongoDB, „vollständige ACID-Transaktionen“ anstelle einer „Snapshot-Isolation“ durchzuführen, fragwürdig oder irreführend ist.

Darüber hinaus ist die Leistung bei stark konsistenten Schreibvorgängen (die Mehrheit als Write-Concern) aufgrund hoher Latenz und niedrigem Durchsatz beeinträchtigt, da MongoDB Atlas asynchrone Datenreplikation (oder Master-Slave-Replikation) verwendet. Im Gegensatz dazu verwendet der MarkLogic Data Hub Service eine synchrone Datenreplikation.

Im Allgemeinen können sich Anwendungen bei Datenintegrität und Haltbarkeit nicht auf MongoDB Atlas verlassen, da Lese- und Schreibvorgänge mit abstimmbarer Konsistenz unterstützt werden (d. h. die ACID-Konformität kann für jede einzelne Abfrage aktiviert/deaktiviert werden). Somit müssen Anwendungen stark konsistente Lesevorgänge (z. B. linearisierbare Read-Concerns) verwenden, um schmutzige und veraltete Lesevorgänge zu vermeiden. Dies führt wiederum zu einer hohen Latenzzeit, bei gegebener Mindestzahl zum Lesezeitpunkt.

Die fehlenden 100 % ACID-konformen Transaktionen in MongoDB Atlas bedeutet, dass Anwendungen eine Transaktionslogik codieren müssen, die schwer zu warten und zu skalieren ist. Daher eignet sich MongoDB Atlas nicht für missionskritische transaktionale und operative Anwendungen.

Sicherheit: Zentralisierte detaillierte Sicherheit oder anwendungsbezogene Sicherheit?

Der MarkLogic Data Hub Service bietet eine fein abgestimmte Zugriffskontrolle mit Sicherheit auf Dokumenten- und Elementebene sowie regelbasierte Schwärzungsrichtlinien zur Vermeidung von Datenverlusten. Die Sicherheitsrichtlinien werden mithilfe eines flexiblen rollenbasierten Modells definiert, um den Zugriff bis auf die Ebene der einzelnen Felder zu beschränken und zu kontrollieren. Einmal definiert, werden diese detaillierten Richtlinien von der Datenbank als implizite Einschränkungen auf der Grundlage des Sicherheitsprofils des Benutzers durchgesetzt. Infolgedessen können Administratoren Sicherheitsrichtlinien zentral verwalten, die bei allen Datenzugriffen konsistent angewendet werden (d. h. sowohl für Originaldaten als auch für integrierte Daten), sodass die Organisation Daten vertrauensvoll austauschen und mehrere Use Cases und Nutzerpersönlichkeiten bedienen kann. Kurz gesagt: MarkLogic nutzt die Datenintegration zum Vorteil für Sicherheit und Governance. Weitere Einzelheiten zum Thema Sicherheit finden Sie im Trust Center.

Zum Vergleich: MongoDB verfügt nicht über den gleichen Grad an fein abgestimmter Sicherheit bei der Kontrolle des Datenzugriffs und der gemeinsamen Nutzung sensibler Daten. Wie bereits dokumentiert, sichert MongoDB Atlas nur Daten auf der Erfassungsebene – nicht auf Ebene der Dokumente oder Unterdokumente. Daher liegt die Verantwortung für die Gewährleistung des Schutzes auf Feldebene bei den Entwicklern, die die Anwendungen schreiben. Wie bereits dokumentiert, müssen Entwickler Anwendungen so codieren, dass sie bei jeder Abfrage der Datenbank eine Schwärzungslogik auf Feldebene (wie einen Filter) enthalten. Im Gegensatz dazu werden die Sicherheitsrichtlinien des MarkLogic Data Hub Service von der Datenbank durchgesetzt, wodurch Anwendungen von der Implementierung von Datensicherheitsrichtlinien gelöst werden.

Das Ziel der Datensicherheit muss stets mit einem praktikablen Maß an Datennutzbarkeit vereinbar bleiben.Die robusten Sicherheitskontrollen von MarkLogic haben sich in missionskritischen Systemen auf der ganzen Welt bewährt. MarkLogic genießt das Vertrauen von Finanzdienstleistern, Gesundheitsdienstleistern und Regierungseinrichtungen. Wir haben einen guten Ruf, wenn es darum geht, Datenbestände zu schützen.

Skalierbarkeit: 100 % ACID-kompatibler Scale-Out im Vergleich zu Eventual-Consistency-Scale-Out

MarkLogic hat Kunden, die mehr als drei Petabyte an Daten speichern. Der MarkLogic Data Hub Service verwendet eine verteilte Shared-Nothing-Architektur, die sich elastisch skalieren lässt, ohne dass Sie sich um komplexes Daten-Sharding kümmern müssen.

Zur Bereitstellung nutzt er eine Single-Tenant-Architektur mit Aktiv-Aktiv-Hochverfügbarkeit, synchroner Datenreplikation und automatisiertem Failover. Zudem skaliert er automatisch und unabhängig operative, analytische und Datenintegrations-Workloads sowie Speicher für hohe Leistung und Zuverlässigkeit.

Mit Funktionen wie dem automatischen Datenausgleich und der integrierten Suchmaschine erhalten die Benutzer schließlich eine konsistente Abfrageleistung bei der Skalierung ihrer Anwendungen und minimieren den Bedarf an Datenbank-Caching durch die Anwendungen. Weitere Einzelheiten finden Sie auf der Seite Data Hub Service.

MongoDB Atlas hat eine verteilte Architektur und bietet horizontales Scale-out durch Daten-Sharding. Durch das Sharding kann das bereitgestellte MongoDB Replica Set über die Grenzen eines einzelnen Servers hinaus skalieren. Dieser Ansatz bedeutet, dass Organisationen einen komplexen, manuellen Migrationsaufwand betreiben müssen, um das bereitgestellte Replica Set in gesplittete Cluster umzuwandeln, wobei jeder Shard als unabhängiges Replica Set modelliert wird.

Sharding ist ein komplexes Unterfangen für DataOps-Teams, da Anwendungen bewusst so gestaltet werden müssen, dass sie vom Daten-Sharding profitieren (d. h. Designdatenmodelle auf der Grundlage des Sharding-Schlüssels, die später nicht mehr geändert werden können). Darüber hinaus haben ACID-Transaktionen mit mehreren Dokumenten in MongoDB den Nachteil einer hohen Latenzzeit und einer schwachen bedarfsgerechten Datenkonsistenz. Daher können Benutzer MongoDB Atlas nicht für die Datenanreicherung und Betriebs-Workloads verwenden. Im Gegensatz dazu bietet der MarkLogic Data Hub Service eine 100 % ACID-konforme Scale-Out-Architektur.

Der Aufbau eines 100 % ACID-konformen, verteilten Scale-Out-Systems ist schwierig. Mit dem MarkLogic Data Hub Service können Unternehmen ihre Datenarchitektur verschlanken und missionskritische Workloads bedarfsgerecht ohne Betriebsbelastung ausführen.

Suche, Abfrage und Indizierung: Multi-Modell, suchoptimierte Abfrage gegenüber Nur-Dokument-Abfrage

Der MarkLogic Data Hub Service wurde für hohe Leistungsfähigkeit entwickelt und für einen größeren Self-Service-Verbrauch sowohl von Originaldaten als auch von integrierten Daten. Er verwendet einen suchbasierten Ansatz für den Datenzugriff und bietet eine einheitliche Suchschnittstelle zur Abfrage mehrerer Datenmodelle.

Zudem ist eine Suchmaschine integriert, die die Struktur und den Inhalt (einschließlich Wörter, Sätze, Beziehungen und Werte) von Dokumenten für effiziente und schnelle Suchanfragen automatisch indexiert. Zusammengefasst werden diese indizierten Informationen als Universal-Index bezeichnet, der Daten sofort nach dem Laden indiziert. So können Benutzer eine Volltextsuche über alle aufgenommenen Inhalte durchführen, ohne spezifische Indizes einrichten zu müssen. Dies hilft bei der Profilierung von Originaldaten ohne formale Modellierung.

Die Indizes sind immer mit den Daten synchronisiert, sodass transaktionale und operative Use Cases leicht unterstützt werden können. Zur Unterstützung komplexer Abfragen gibt es zusätzliche Indizes wie Bereichsindizes, umgekehrte Indizes (verwendet für Echtzeit-Warnungen), Geodaten-Indizes, Dreifach-Indizes (verwendet für semantische Graphen oder RDF-Daten) und mehr.

Durch die automatisierte Erstellung und Pflege der Indizes ermöglicht der Data Hub Service den Benutzern eine schnelle und einfache Suche über mehrere Datenmodelle hinweg (d. h. Dokumente, Graphen und relationale) mit einer einzigen, zusammensetzbaren Abfrage wie Optic API. Darüber hinaus können Benutzer Standard-Abfragesprachen, APIs und Programmiersprachen (wie SQL, SPARQL, REST, JavaScript, XQuery usw.) verwenden, um Daten flexibel zu speichern und darauf zuzugreifen. So können Benutzer beispielsweise SPARQL- und Dokumentensuchabfragen für semantische Suchen in Wissensgraphen kombinieren, um Erkenntnisse zu gewinnen, oder SQL-Analysen in relationalen Ansichten ausführen, die alle auf Indizes basieren.

Schließlich können Benutzer mit zahlreichen sofort einsatzbereiten Suchfunktionen schnell erweiterte Suchanwendungen erstellen. Die Liste der Suchfunktionen umfasst u. a. Nähe, Platzhalter, Interpunktion, diakritische Zeichen, Groß- und Kleinschreibung, Rechtschreibkorrektur, Thesaurus, Ausschnitte, Facetten, Hervorhebung von Suchergebnissen, Funktionen zur automatischen Textvervollständigung, Wortstammerkennung, Reihenfolge nach Relevanz, Unterstützung mehrerer Sprachen und mehr.

Zum Vergleich unterstützt MongoDB Atlas Ad-hoc-Dokumentabfragen und Aggregationsabfragen unter Verwendung eines Aggregations-Pipeline-Struktur, die Dokumente als mehrstufige Pipeline verarbeitet. Die Aggregations-Pipeline-Struktur ist eine einheitliche Abfrageschnittstelle zum Erstellen von zusammensetzbaren Abfragen. Sie bietet eine reichhaltige Auswahl an Bedienelementen für verschiedene Datenoperationen (wie Schwärzung, Facetten, Aggregation, Verknüpfung, Filter, Graphen, Geodaten usw.).

Wie andere DBaaS-Angebote stützt sich auch MongoDB Atlas auf Indizes, um die Ausführung der Abfragen zu beschleunigen. Standardmäßig erstellt es einen Primärindex (d. h. einen eindeutigen Index auf „_id“-Feld), dabei können Benutzer zusätzliche Sekundärindizes (wie Verbund, Geodaten, Text usw.) für jedes beliebige Feld im Dokument erstellen. Dafür müssen sich jedoch die DataOps-Teams richtig ins Zeug legen, um Indizes für eine optimierte Abfrage zu erstellen und zu verwalten. Um z. B. Indizes (wie Einzelfeld, Verbund) zu definieren, müssen Benutzer alle Datenzugriffsmuster verstehen und wissen, wie Indexschnittpunkte von MongoDB zur Lösung von Abfragen verwendet werden. Im Gegensatz dazu ist die Indexverwaltung durch die integrierte Suche und den Universal-Index des MarkLogic Data Hub Service einfacher und effizienter.

Additionally, the text search feature in MongoDB Atlas is limited (e.g. no relevance ranking) to build high-performance search applications. To overcome this limitation, MongoDB released Atlas Search (based on Apache Lucene) as a separate service that provides advanced search capabilities using an aggregation pipeline operator. However, unlike MarkLogic Data Hub Service, Atlas Search indexes are eventually consistent. Hence, Atlas Search does not provide read-after-write consistency even for single document transactions. Moreover, Atlas Search does not auto-index, nor is it used to power all data access.

Schließlich unterstützt MongoDB Atlas keine branchenüblichen Abfragesprachen (wie SQL), sondern verwendet die JSON-Syntax zum Abfragen von Dokumenten.

Für die Integration von Daten aus Silos ist es von entscheidender Bedeutung, durch mehrere Linsen bei der Analyse mehrfach strukturierter Daten sehen zu können. Mit dem MarkLogic Data Hub Service können Benutzer SQL-Analysen, Abfragen von semantischen Graphen und Dokumentensuchen durchführen und diese sogar mithilfe von Optic API kombinieren, um verschiedene Use Cases und Nutzerpersönlichkeiten zu unterstützen. Da die Indizes zudem alle als Teil einer einheitlichen Plattform optimiert sind, bietet die Plattform eine konsistente Leistung und Skalierbarkeit.

Preisgestaltung: vorhersehbare und niedrige Kosten im Vergleich zu restriktiven und hohen Kosten

Der MarkLogic Data Hub Service bietet verbrauchsabhängige Preise auf der Grundlage von Cloud-Credits. Organisationen können im laufenden Betrieb bezahlen oder Einsparungen erzielen, indem sie Credits in großen Mengen im Voraus kaufen. Die Preisgestaltung ist all-inclusive (einschließlich Hardware, Software, Betrieb, Bereitstellung und 24/7 Support) und einfach – Organisationen zahlen für Berechnung, Speicherung und Bandbreite. Auch bei der Bewältigung von Nachfragespitzen aufgrund zeitlich veränderlicher (oder unvorhersehbarer) Workloads sind die Preise vorhersehbar.

Organisationen können bis zum Zwölffachen ihrer ungenutzten Rechenleistungs-Credits sammeln, die in Zeiten von Nachfragespitzen zum Bursting (oder zur automatischen Skalierung der Rechenleistung) ohne zusätzliche Kosten verwendet werden. Dies führt zu erheblichen Einsparungen, da die Organisationen keine Kapazitäten für Spitzenbelastungen bereitstellen müssen. Bei Nachfragespitzen vermeiden sie auch kostspielige Abrechnungen aufgrund der automatischen Skalierung. Weitere Einzelheiten zu den Preisen finden Sie auf der Seite Data Hub Service.

MongoDB Atlas bietet auch eine verbrauchsabhängige Preisgestaltung, allerdings zu höheren Gesamtkosten. Außerdem gibt es kein kostenloses automatisches Bursting zur Deckung von Nachfragespitzen.

Die Preisgestaltung für MongoDB Atlas ist restriktiver und teurer. Sie müssen Add-Ons für die LDAP-Integration, 24/7-Support, BI-Konnektor, Stitch (Anwendungsdienste für Atlas) und mehr kaufen. Demgegenüber sind die Preise für den MarkLogic Data Hub Service all-inclusive und vorhersehbar.

Eine transparente und vorhersehbare Abrechnung ist ein wichtiger Aspekt bei der Nutzung von Cloud-Diensten. Mit dem MarkLogic Data Hub Service können Unternehmen Datenintegrations-Workloads sowie betriebliche und analytische Anwendungen mit hoher Leistung und Zuverlässigkeit zu vorhersehbaren und niedrigen Kosten ausführen.

Allgemeine Use Cases für den MarkLogic Data Hub Service

Der MarkLogic Data Hub Service eignet sich ideal für komplexe Use Cases der Datenintegration – insbesondere, wenn Sie große Datensätze mit mehreren Datenmodellen haben. Immer dann, wenn sich Daten schnell ändern oder sich die geschäftlichen Anforderungen schnell weiterentwickeln, funktionieren sie besser in einem Data Hub mit einer Multi-Modell-Datenbank.

Unten finden Sie drei große Bereiche von Data Hub-Use-Cases:

  • 360-Grad-Ansicht von allem – Bringen Sie ERP-Daten zusammen und bauen Sie eine 360Ansicht auf Kunden, Mitarbeiter, Vermögenswerte usw. auf.
  • Search und Discovery – Erstellung einer reichhaltigen Wissensanwendung, in der Regel mit einer semantischen Komponente, zur gemeinsamen Nutzung von Informationen
  • Betriebsanalyse – Umfasst Use Cases wie die Echtzeit-Erkennung von Betrug oder die Sicherheitsüberwachung in Echtzeit in einem Park oder einer Produktionsanlage

Es gibt auch branchenspezifische Use Cases, wie die Konsolidierung von Finanzhandelsdaten oder die Erstellung einer universellen Stückliste für einen Hersteller.

Unten finden Sie einige Beispiele, bei denen Organisationen sich ausdrücklich für MarkLogic anstatt für MongoDB entschieden haben:

  • Eines der größten Versicherungsunternehmen der Welt – Aufbau einer kosteneffektiven Dokumentenmanagement-as-a-Service-Plattform zur Abdeckung mehrerer Geschäftseinheiten. MarkLogic, MongoDB, Couchbase, Cassandra und DynamoDB wurden ausgewählt, um eine Machbarkeitsstudie durchzuführen. Ziel war das Benchmarking der Software, um 500 Millionen Dokumente zu bearbeiten. Am Ende gewann MarkLogic, weil es die Skalierbarkeit hatte, um mit Millionen von Dokumenten und Benutzern fertig zu werden.
  • Ein Multi-Milliarden-Dollar-Finanzdienstleistungsunternehmen – Die Organisation entschied sich für MarkLogic und nicht für MongoDB, um bei der Bearbeitung von Wertpapieren und dem Clearing zu helfen. Dabei wurde MongoDB als nicht sicher genug für sensible Handelsdaten angesehen
  • Ein großer Anbieter staatlicher Gesundheits- und Personaldienstleistungen – Die Organisation entschied sich für MarkLogic und nicht für MongoDB, um die Genauigkeit und Geschwindigkeit der Medicaid-Berechtigung und der Antragsbearbeitung zu verbessern. MongoDB konnte nicht die erforderliche konsolidierte Echtzeit-Ansicht über Mainframe, Anwendungen und externe Daten hinweg liefern.
  • US-Militärorganisation – Bau einer neuen Plattform zur Verwaltung und gemeinsamen Nutzung von Daten, um die militärischen Forschungskapazitäten zu verbessern. MarkLogic wurde MongoDB vorgezogen, weil MongoDB nicht leistungsstark skalieren konnte.

Wann wäre MongoDB Atlas die bessere Lösung?

MongoDB Atlas wurde bei Entwicklern als Open-Source-Datenbank beliebt und ist eine gute Wahl für Organisationen, die eine Cloud-neutrale und einfach zu bedienende Dokumentendatenbank für neue, nicht transaktionale Anwendungen suchen.

Für Unternehmensorganisationen, die Daten integrieren und missionskritische Use Cases mit einer skalierbaren Multi-Modell-Datenbank versorgen möchten, ist der MarkLogic Data Hub Service die bessere Wahl.

Mehr erfahren

Erfahren Sie mehr über den MarkLogic Data Hub Service (DHS) und melden Sie sich für eine Produktdemo an.

Lesen Sie die Dokumentation zum MarkLogic Data Hub Service.

Anmeldung zu unserer Live-Demo

Erfahren Sie, wie MarkLogic Daten schneller integriert, Kosten reduziert und einen sicheren Datenaustausch ermöglicht.

Jetzt Registrieren

Auf dieser Website werden Cookies verwendet.

Mit der Nutzung dieser Webseite stimmen Sie der Verwendung von Cookies gemäß der MarkLogic Datenschutzrichtlinie zu.