Elsevier

Elsevier ist ein führender Verlag und Informationsdienstleister für Organisationen aus den Bereichen Medizin, Hochschulbildung und Gesundheitswesen. Elsevier stellt Kunden die Informationen bereit, die sie zur Durchführung von Forschungsaktivitäten und wissenschaftlichen Versuchen, zur Patietenversorgung und zur Erreichung ihrer Ziele benötigen.

Vollständigen Praxisbereicht herunterladen »


Die Herausforderung

Obwohl Elsevier beträchtliche Summen in Suchtechnologien investiert hat, empfanden die Nutzer das Extrahieren der Informationen aus den Unmengen an Daten zunehmend als zeitraubend. Elsevier sah sich mit vier großen Herausforderungen konfrontiert:

Kein zentrales Repository: Jeder Inhaltsträger befand sich in einer gesonderten Datenbank – entweder in Form einer relationalen Datenbank oder in einer eigenständigen. In jeder dieser Datenbanken waren mehrere Anwendungen installiert.

Viele verschiedene Dateiformate: Die Normalisierung der Inhalte war äußerst zeitaufwändig. In einem einzigen Anwendungsprojekt kamen 35 Dokumentformate zum Einsatz.

Hohe Kosten: Die Entwicklung neuer Funktionen stellte sich als zeitraubend und kostspielig heraus. Die komplexe Logik zur Dekonstruktion von Dokumenten und zur Analyse von Beziehungen zwischen Dokumenten musste für jede Anwendung einzeln aufgebaut werden.

Unmengen an Inhalten: Die Größe des finalen Content-Repository wurde auf über 5 Terabyte geschätzt. Es umfasste über fünf Millionen vollständige Artikel aus 1.800 Zeitungen und Zeitschriften, über 60 Millionen Zitate und Abstracts (von den Artikeln getrennt), 20.000 am Markt verfügbare Bücher, 9.000 nicht mehr erhältliche Bücher sowie mehrere tausend Informationsblätter.

Elsevier erkannte das Potenzial getaggter (markierter) Suchelemente und schaffte es so, mit der Entwicklung deskriptiver Signaturtechniken Schritt zu halten, da man in XML investierte. Bereits 2004 hatte Elsevier seine Produkte entsprechend den Internetdienst-Architekturen neu entwickelt. Dazu richtete das Verlagshaus ein XML-Repository ein, das den IT-Mitarbeitern zu mehr Effizienz verhalf und den Nutzern leistungsfähigere Funktionen bot. Doch durch die Abhängigkeit von relationalen Datenbanken musste das Unternehmen nach wie vor langwierige, kostspielige Produktentwicklungszyklen und eine suboptimale Performance hinnehmen.


Die Lösung

„Wir haben den Vertretern von Elsevier angeboten, ihnen zu zeigen, wie sich mit dem MarkLogic Server die XML-Investitionen richtig auszahlen und die Vision des Unternehmens realisieren lässt“, erinnert sich Paul Pedersen, Mitbegründer und Chief Technologist von MarkLogic. „Unser Versprechen war einfach. Gebt uns eine beliebige Datenmenge aus euren Archiven, und wir geben euch eine ganz neue Anwendung auf Basis dieser Inhalte zurück.“ Die Anwendung, die MarkLogic in wenigen Tagen bereitstellte, war flexibler als alles, was Elsevier seinerzeit in Betrieb hatte. Umso bemerkenswerter ist dies vor dem Hintergrund, dass die 0,5 Terabyte an Daten, die auf den MarkLogic Server geladen wurden, sich auf über 35 verschiedene Formate verteilten. Elsevier war beeindruckt. Folglich setzte man auf MarkLogic und MarkLogic Server, als es darum ging, alle Archive zu konsolidieren, in kürzester Zeit neue Anwendungen zu entwickeln und Mehrwertdienste auf der Grundlage des Repositorys zu erstellen.

Dank MarkLogic beschleunigt Elsevier nicht nur die Bereitstellung neuer, konkurrenzfähigerer Produkte, sondern ermöglicht auch seinen Nutzern, ihre Aufgaben durch Abrufen der passenden Daten 5- bis 9-mal schneller als zuvor zu erledigen. Elsevier muss Inhalte nicht mehr normalisieren, um sie anschließend in das Repository zu übertragen. Nun können die Mitarbeiter die Inhaltsvielfalt als unmittelbare Grundlage nutzen. Dadurch verkürzt sich die Zeit bis zur Verfügbarkeit um zwei Drittel. Laut David Marques liegt der entscheidende Vorteil für die Benutzer in der hervorragenden Granularität: „… Wenn ein Nutzer eine Frage hat, möchten wir die Anzahl der Suchergebnisse von 10 möglichen Dokumenten auf zwei präzise Abschnitte oder Absätze beschränken, damit wir exakt die Inhalte bieten können, die für den Nutzer relevant sind.“

Den Großteil unserer Projektzeit wenden wir für die Überlegung, wie die Inhalte genau genutzt werden sollen, und für die Vorbereitung dieses Contents für die Datenbank auf. Mit MarkLogic haben wir diesen Zeitaufwand halbiert.

David Marques, Chief Technology Officer, Elsevier

Fazit

MarkLogic hat die Bereitstellung der Produkte und Dienste von Elsevier erheblich beschleunigt und gleichzeitig die Kosten für das Laden und Design der Inhalte drastisch verringert. Dies machte sich in noch schnelleren Forschungszyklen und klinischen Diagnosen bemerkbar. Möglich wurde dies durch eine neue Generation von Lösungen, mit denen Fachleute stets genau die Informationen finden, die sie suchen.

Weitere Kundenberichte

ALM
American Psychological Association
American Society of Agronomy
Bowker
Broadridge
BSi Group
CABI
Codifyd
Condé Nast
CQ Roll Call
De Gruyter
EBCONT
Elsevier
Fairfax County, Virginia
Federal Aviation Administration
Gemeinnützige Organisation
Hannover Rück
Healthcare.gov
HEROLD.at
Informatics Corporation of America
Institute of Engineering and Technology
Institute of Physics
Investmentbank
Führende Investmentbank
Top-5-Investmentbank
JWG Group
Klopotek
Lagardère Active
M*Modal
Mitchell 1
MVB
National Archives & Records Administration
OECD Publishing
Oxford University Press
Press Association
Princeton Theological Seminary
Reed Business Information
Royal Society of Chemistry
RSuite CMS
Springer
Thieme
Triumph Learning
University of Virginia
Warrior Gateway
Wiley
Yell.com