K10plus-Zentral ist eine moderne Suchmaschine für bibliographische Daten, die von der VZG entwickelt und betrieben wird. Als reines Backend-System bietet K10plus-Zentral größtmögliche Flexibilität bei der Integration in unterschiedliche Benutzeroberflächen.

Datenbestand

K10plus-Zentral verfügt über einen umfangreichen Datenbestand mit über 330 Millionen Datensätzen. Detaillierte Bestandsinformationen sind in maschinenlesbarer Form verfügbar:

Die Daten in K10plus-Zentral stammen aus dem Verbundsystem (CBS), in dem alle bibliographischen Metadaten im Format PICA+ gespeichert sind. Für die Verwendung in K10plus-Zentral werden die Metadaten in das Format MARC21 exportiert. Die genaue Abbildung von PICA+ auf MARC21 ist dokumentiert.

Kollektionen

  • ca. 88,7 Millionen digitale Objekte und bibliographischen Nachweise aus den Nationallizenzen (collection:NL)
  • ca. 63,6 Millionen Nachweise der Bestände aller GBV-Bibliotheken (der GBV Gesamtkatalog GVK) (collection:GVK)
  • ca. 58,9 Millionen Aufsätze aus über 24000 Zeitschriften aus den Online Contents Daten (OLC) mit Besitznachweisen aus der ZDB (collection:OLC)
  • ca. 39,9 Millionen Nachweise des Südwestdeutschen Bibliotheksverbundes (SWB(collection:SWB)
  • ca. 37,9 Millionen Aufsätze aus PubMed / Medline (collection:medline)
  • ca. 15,6 Millionen Datensätze aus Fachinformationsdiensten (collection:FID)
  • ca. 14,0 Mio. Nachweise aus JSTOR (collection:JSTOR)
  • ca. 9,8 Millionen Artikel und Zeitschriften aus dem Directory of Open Access Journals (DOAJ) unter einer Creative Commons BY-SA 4.0 Lizenz (collection:DOAJ)
  • ca. 6,4 Millionen Aufsätze aus Zeitschriften des Verlages Elsevier (collection:elsevier)
  • ca. 5,9 Millionen Aufsätze aus Springer E-Journals (collection:springer)
  • ca. 4,2 Millionen Nachweise der Bestände des Verbundkatalogs Öffentlicher Bibliotheken, ÖVK (collection:ÖVK)
  • ca. 2,5 Millionen Datensätze aus arXiv (collection:arXiv)
  • ca. 2,1  Millionen Aufsätze aus Zeitschriften des Verlages Wiley (collection:Wiley)
  • ca. 983.00 Millionen klinische Studien aus der Datenbank ClinicalTrials.gov (collection:CTG)
  • ca. 972.000  Aufsätze aus Zeitschriften des Verlages De Gruyter (collection:DeGruyter)
  • ca. 448.000 Datensätze (Aufsätze) aus OpenEdition (collection:OpenEdition)
  • ca. 387.000 Datensätze aus Research Square (collection:ResearchSquare)
  • ca. 326.000 Datensätze aus biorXiv (collection:biorXiv)
  • ca. 78.000 Datensätze aus preprints.org (collection:preprintsorg)
  • ca. 47.000 Datensätze aus chemrXiv (collection:chemrXiv)
  • ca. 9.100 Datensätze aus techrXiv (collection:techrXiv)
  • ca. 3.200 Datensätze aus engrXiv (collection:engrXiv)

Die meisten Kollektionen enthalten Besitznachweise von Bibliotheken.

Den Zeitpunkt des letzten Updates der Daten einer collection kann man unter https://findex.gbv.de/findex_updates/view/ einsehen.

Technische Basis

Die Suchmaschine basiert auf SolrCloud-Technologie und unterstützt die Integration mit verschiedenen Discovery-Systemen wie:

Nutzung

Der Zugang zu K10plus-Zentral ist ausschließlich registrierten Nutzern vorbehalten. Das integrierte Rechtemanagement gewährleistet die Einhaltung aller Nutzungsbedingungen. Die Datenzugriffe können flexibel gesteuert werden:

  • Inhaltliche Filterung nach verschiedenen Kriterien
  • Einschränkung nach Bibliotheksbeständen
  • Filterung nach Materialarten

Konfiguration der Suchmaschine

Die Suchmaschine basiert auf SolrCloud und ihre gesamte technische Konfiguration ist öffentlich verfügbar. Im Folgenden finden Sie die wichtigsten Informationen zur Konfiguration und Datenverarbeitung. Die vollständige technische Konfiguration kann auf GitHub eingesehen werden.

Schema und Suchfelder

Für Facetten können alle suchbaren Felder aus dem Schema der Suchmaschine verwendet werden. Diese sind als “field name” im Schema der Suchmaschine definiert.

Datenprozessierung

Die Befüllung der Felder kann im Detail im Index-Properties-File nachvollzogen werden. Dabei gibt es zwei Hauptmethoden der Wertzuweisung:

  1. Direkte Ableitung aus MARC21 Beispiel: Der Verlagswert (publisher) wird direkt aus dem MARC21-Feld 260b übernommen.
  2. Skript-basierte Verarbeitung Beispiel: Das Format wird durch ein separates Skript (format.bsh) ermittelt.

Alle verwendeten Verarbeitungsskripte sind ebenfalls öffentlich zugänglich.

Fair Use Policy

Mit einer Fair Use Policy ermöglichen wir für alle Anwendungen von K10plus-Zentral eine gerechte Nutzung der Suchmaschine und verhindern Beeinträchtigungen des stabilen Betriebs. 

Technische Maßnahmen können bei der Einhaltung der Fair Use Policy behilflich sein (siehe: Best Practices).

Ansprechpartner

Wenn Sie einen Zugang zu der Suchmaschine haben möchten, wenden Sie sich an Till Kinstler und Gerald Steilen