Bowker

R.R. Bowker ist eine ISBN-Agentur für die USA. Das Unternehmen erhält Datenfeeds von Verlagen, Großhändlern und Vertriebsfirmen. Die Bowker-Datenbank Global Books in Print enthält bibliografische Informationen zu mehreren Millionen Buchtiteln. So haben die Kunden, zu denen die gesamte Buchbranche zählt – von Verlegern und Bibliotheken bis hin zu Buchhändlern und Vertriebsgesellschaften – Zugang zu über 20 Millionen Dokumenten.

Vollständigen Praxisbereicht herunterladen »


Die Herausforderung

Es bestand eine starke Nachfrage nach den riesigen Mengen an Informationen, die sich in der Datenbank in Print befinden. Doch Bowkers Technologielösung, eine Kombination aus Verity-Suchfunktionen und Oracle-Datenbank, hielt dieser Nachfrage nicht stand. Das Unternehmen erkannte die Notwendigkeit einer neuen Suchlösung, mit der seine Kunden die relevanten Inhalte aus der gigantischen Datenbank abrufen können. „Mit Verity konnten wir unsere Kunden mit Inhalten versorgen, aber aufgrund der Verarbeitungsart und -menge waren wir immer sechs bis acht Tage im Rückstand, wenn ein bestimmtes Dokument hereinkam“, erklärt Mark Heinzelman, CIO von Bowker.

Jetzt kann ich den Zeitpunkt, zu dem die Inhalte an die Kunden gehen, selbst bestimmen. Wir sind nun einen Tag hintendran, aber das haben wir so entschieden. Das hat nichts mit dem Tool zu tun. Die Reaktionszeit bei einer Suche liegt im Millisekundenbereich. Bei Verity dauerte es zweieinhalb bis drei Sekunden, bis die Ergebnisse da waren.

Mark Heinzelman, Chief Information Officer, Bowker

Die Lösung

Der MarkLogic XML-Content-Server vereint im Wesentlichen die Volltextsuche mit der vom W3C spezifizierten Abfragesprache XQuery. Die Plattform dient zum Laden, Abfragen, Bearbeiten und Wiedergeben von Inhalten. Durch die Bereitstellung des MarkLogic Server konnte Bowker seine Suchfunktionen verbessern. Konkret dafür verantwortlich war eine Kombination aus XML-Elementabfrage, XML-Näherungssuche und Volltextsuche. Es dauerte nur ca. 4 bis 5 Monate, bis MarkLogic und Bowker die Lösung entwickelt und implementiert hatten.

Laut Heinzelman fällt es Bowker durch die Art der Datenspeicherung bei MarkLogic leichter, im Bedarfsfall die Dokumentstruktur zu ändern und neue Inhalte hinzuzufügen. „Es war sehr schwierig, andere Inhaltsarten in die Verity-Umgebung aufzunehmen“, so Heinzelman. „Wir mussten quasi zwangsläufig die gesamte Datenbank neu aufbauen, was 3 bis ca. 4 Wochen in Anspruch nahm. Jetzt können wir neue Dokumenttypen in kürzester Zeit einbinden.“

Doch MarkLogic trug nicht nur dazu bei, dass Bowker seinen unmittelbaren Bedarf nach einer besseren Suchmaschine erfüllen konnte. Die Lösung unterstützte das Unternehmen auch bei seinem langfristigen Ziel eines soliden, mitwachsenden Content-Repository. „Am Anfang betrachtete ich MarkLogic als reine Suchmaschine, nicht als Content-Repository“, berichtet Heinzelman. Zu dieser Zeit hatten wir eine leistungsstarke Oracle-Datenbank, in der wir unsere Inhalte speicherten. Seither sehen meine Zukunftspläne für 2008, 2009 und 2010 vor, dass unsere gesamten Inhalte auf MarkLogic als Content-Repository verlagert werden.“

Ein weiterer entscheidender Vorteil sind die Kosteneinsparungen, die Bowker infolge der Initiative erzielt hat. Allein für die Verwaltung von Verity benötigte Bowker einen Vollzeitmitarbeiter. Jetzt beschäftigt das Unternehmen einen Mitarbeiter, der höchstens ein Viertel seiner Arbeitszeit für die Verwaltung der aktuellen Infrastruktur aufwenden muss.


Fazit

Nach Aussage von Heinzelman denkt Bowker wegen der Flexibilität der MarkLogic Lösung bereits konkret über die nächsten Schritte nach. Ziel ist es unter anderem, die Inhalte von Büchern optimal zu nutzen. Das Unternehmen plant, die Technologie „als Werkzeug zur Extraktion der Inhalte und zur Erstellung von Tools für den Verkauf aussagekräftiger Informationen“ zu nutzen, so Heinzelman. „Wir möchten die Suchzeit verkürzen.“ Wir glauben, dass uns dies durch die Extraktion von Inhalten und den Verkauf von Informationen und Metadaten unter dem Aspekt der Relevanz gelingen wird; und mit den Verkaufsdaten, die uns vorliegen, können wir dies auch einbinden.“ Heinzelman zufolge bot die Verity-Plattform nicht die nötige Flexibilität für die Nutzung ganzer Buchinhalte. Solange Bowker solche Daten erfassen kann, kann der MarkLogic Server sie auch verarbeiten.

Weitere Kundenberichte

ALM
American Psychological Association
American Society of Agronomy
Bowker
Broadridge
BSi Group
CABI
Codifyd
Condé Nast
CQ Roll Call
De Gruyter
EBCONT
Elsevier
Fairfax County, Virginia
Federal Aviation Administration
Gemeinnützige Organisation
Hannover Rück
Healthcare.gov
HEROLD.at
Informatics Corporation of America
Institute of Engineering and Technology
Institute of Physics
Investmentbank
Führende Investmentbank
Top-5-Investmentbank
JWG Group
Klopotek
Lagardère Active
M*Modal
Mitchell 1
MVB
National Archives & Records Administration
OECD Publishing
Oxford University Press
Press Association
Princeton Theological Seminary
Reed Business Information
Royal Society of Chemistry
RSuite CMS
Springer
Thieme
Triumph Learning
University of Virginia
Warrior Gateway
Wiley
Yell.com