American Psychological Association

Die APA zählt 150.000 Mitglieder und 54 Abteilungen in den verschiedenen Teildisziplinen der Psychologie. Zu den Hauptzielen des Verbands gehört der Austausch wissenschaftlicher Informationen. Zu diesem Zweck veröffentlicht das zur APA gehörige Office of Publications and Databases eine Reihe von Fachzeitschriften, mehrere Dutzend Bücher pro Jahr sowie verschiedene akademische Datenbanken, darunter PsycINFO und PsycARTICLES.

PDF dieses Praxisbeispieles herunterladen


Die Herausforderung

Die APA gilt als wichtigster Anbieter von Informationen im Fachbereich Psychologie. Ihre Website wird täglich mehr als eine Million Mal aufgerufen. 2008 migrierte die APA ihre gesamten Inhalte von einem Alt (Legacy)-System auf MarkLogic. In der zentralen Datenbank ist derzeit eine vielseitige Sammlung von Big Data gespeichert, darunter 160.000 vollständige Zeitschriftenartikel, 3  Millionen Abstracts und 54 Millionen Literaturzitate. Einige davon reichen bis ins späte 19. Jahrhundert zurück. Die größte Herausforderung bei der Nutzung dieser Inhalte besteht in ihrer Vielfältigkeit und Komplexität. Es gibt oft unklare Verbindungen zwischen den Texten, doch die Artikel müssen sinnvoll verknüpft werden, damit Forscher mit ihnen arbeiten können.

Die bisherige Lösung, Lucene, war bei der APA als beliebte Open-Source-Suchmaschine und gute Technologie durchaus anerkannt; doch die Nutzung gestaltete sich aus diversen Gründen schwierig. Es beginnt schon damit, dass Lucene die Architektur um eine weitere Ebene ergänzte. Das bedeutet zusätzlichen Code, einen Ausbau der Infrastruktur und weitere Implementierungsaufgaben. Bei einer Datenbank mit integrierten Suchfunktionen ist das alles nicht erforderlich. Zudem wurden die Suchergebnisse nicht immer gleich schnell bereitgestellt, und dies führte häufig zu einer enttäuschenden Nutzererfahrung. Das größte Problem lag jedoch in der zeitnahen Bereitstellung von Inhalten für die Nutzer der APA. Bei der Lucene-basierten Implementierung konnte es je nach Größe und Komplexität des Inhaltspakets bis zu 48 Stunden dauern, Inhalte vorzubereiten, zu liefern und auf APA Websites zu posten.

APA ist die wichtigste Quelle für Inhalte dieser Art, und eine schnelle Verfügbarkeit online ist unverzichtbar für die Autoren, Leser und Geschäftspartner, die diese Inhalte benötigen. Beverly Jamison, Leiterin der Abteilung IT Architecture and Publishing Solutions, konnte die Nachteile des alten Systems nicht mehr länger akzeptieren: „Die Suche ist ein entscheidender Faktor bei der Nutzung unserer digitalen Inhalte. Der geschäftliche Erfolg hängt oft davon ab, wie schnell ein Produkt auf den Markt gebracht werden kann.“


Die Lösung

Beverly Jamison brauchte eine Lösung, die schnell einsatzbereit war. Das Entwicklungsteam bei der APA hätte viel Zeit und Personal aufwenden müssen, um Lucene richtig einzustellen, zu testen und Feineinstellungen vorzunehmen. So hätte die Leistung zwar verbessert werden können, doch an MarkLogic hätte das System hinsichtlich des Funktionsangebots und der Nachhaltigkeit trotzdem nicht herangereicht.

Die APA musste sich nicht erst lange nach einer neuen Lösung umsehen. Die Schnelligkeit und Flexibilität von MarkLogic als Datenbank waren Beverly Jamison bereits ein Begriff. Zudem kannte sie verschiedene Unternehmen, die MarkLogic auch für die Suche und Analyse einsetzten. Darüber hinaus war sie beeindruckt von der Community, die hinter MarkLogic steht: „Die Unternehmenskultur war ein großes Plus. Ich habe bei MarkLogic noch nie einen schlechten Techniker erlebt.“

Schon früh zeigte sich, dass MarkLogic die Probleme bei APA schnell würde beheben können. Suchabfragen wurden in Tests konstant in unter einer Sekunde bearbeitet. Nicht einmal 4 Monate danach hatte APA die komplette Umstellung von Lucene auf MarkLogic ohne Ausfallzeiten vollzogen. Kunden loben bereits die kürzeren Reaktionszeiten. Die Indexverwaltung macht nun einen kleinen Teil der Arbeit einer einzigen Person aus. Dafür können sich zwei Entwickler statt auf die Pflege eines Altsystems ganz auf neue Funktionen und die Leistungsoptimierung konzentrieren. So konnte das Team bereits wenige Wochen nach Einführung der neuen Suchlösung den Nutzern Funktionen wie Rechtschreibvorschläge und automatische Textvervollständigung bieten. Zudem benötigte die APA statt zehn nur noch drei Server.

Den größten Vorteil bieten schlicht die schnelleren und zuverlässigeren Suchvorgänge. Da die APA 70 % ihrer Einnahmequellen durch die Veröffentlichung von Inhalten erschließt, ist die schnelle Verfügbarkeit von Informationen ein entscheidender Pluspunkt. Mit MarkLogic hat die APA die Dauer der Inhaltsbereitstellung von zwei Tagen auf wenige Minuten sowie die Antwortzeiten bei Suchen auf unter eine Sekunde verringert. Beverly Jamison meint dazu: „Die Markteinführungszeit spielt eine große Rolle in unseren Gesprächen mit potenziellen Kunden oder Geschäftspartnern. Mit MarkLogic dauert es eine Stunde, bis der Content bereitsteht, ein paar Minuten, bis er „live“ ist, und weniger als eine Sekunde, bis Abfragen und Analysen ausgeführt sind. Das ist ein Riesenerfolg für unser Unternehmen und unsere Technologie.“

Mit MarkLogic dauert es eine Stunde, bis der Content bereitsteht, ein paar Minuten, bis er ‚live‘ ist, und weniger als eine Sekunde, bis Abfragen und Analysen ausgeführt sind. Das ist ein Riesenerfolg für unser Unternehmen und unsere Technologie.

Beverly Jamison, Senior Director, IT Architecture and Publishing Solutions, American Psychological Association

Fazit

Beverly Jamison ist davon überzeugt, dass die Architektur von MarkLogic und die neue Infrastruktur bei der APA dauerhafte Vorteile bieten. Vor allem können die Mitglieder des Entwicklerteams nun innerhalb weniger Wochen neue Anwendungen und Front-End-Funktionen erstellen und prüfen. Die APA widmet sich jetzt gezielt neuen Semantikservices für Kunden sowie neuen Visualisierungsmöglichkeiten. Auch die Architektur wird kontinuierlich vereinfacht. So werden die Altsysteme zugunsten besserer Abläufe bei der Verarbeitung von Büchern und Zeitschriften nacheinander ausrangiert.

Durch die Umstellung der Suchlösung von Lucene auf MarkLogic konnte die APA ihr ursprüngliches Ziel – die schnellere Bereitstellung von Inhalten für Kunden – erreichen. Darüber hinaus wurden die Wartungs- und Hardwarekosten gesenkt, und die Reaktionszeit bei Suchabfragen liegt konstant unter einer Sekunde. Das Ergebnis: Vorteile im Wettbewerb um neue Geschäftsideen und eine anpassungsfähigere technische Infrastruktur, die mit der innovativen Tätigkeit der APA harmoniert.

Weitere Kundenberichte

ABN AMRO
ALM
American Psychological Association
American Society of Agronomy
Bowker
Broadridge
BSi Group
CABI
Codifyd
Condé Nast
CQ Roll Call
De Gruyter
EBCONT
Elsevier
Fairfax County, Virginia
Federal Aviation Administration
Gemeinnützige Organisation
Hannover Rück
Healthcare.gov
HEROLD.at
Informatics Corporation of America
Institute of Engineering and Technology
Institute of Physics
Investmentbank
Führende Investmentbank
Top-5-Investmentbank
JWG Group
Klopotek
Lagardère Active
M*Modal
Mitchell 1
MVB
National Archives & Records Administration
NBC Universal
OECD Publishing
Oxford University Press
Press Association
Princeton Theological Seminary
Reed Business Information
Royal Society of Chemistry
RSuite CMS
Springer
Thieme
Triumph Learning
University of Virginia
Warrior Gateway
Wiley
Yell.com