Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Inhalt

K10plus-Zentral

...

K10plus-Zentral ist eine moderne Suchmaschine für bibliographische Daten, die von der VZG in Kooperation mit dem BSZ betriebene Suchmaschine für bibliographische Daten. Diese Suchmaschine ist ein reines Back-End ohne eigene Oberfläche. K10plus-Zentral basiert auf SolrCloud und unterstützt alle Benutzeroberflächen, die Solr ansprechen können, z.B. Lukida, VuFind oder Blacklight. Der Zugriff auf K10plus-Zentral kann über Filter individuell nach unterschiedlichen Kriterien inhaltlich oder nach Bibliotheksbeständen/Materialarten eingeschränkt werden. Ein Rechte-Management sorgt für die Einhaltung sämtlicher Nutzungsbedingungen. Die Basis-URL der Suchmaschine beginnt http://findex.gbv.de und ist ausschließlich für registrierte Nutzer zugänglich.

Derzeit sind über 224 Millionen Datensätze in K10plus-Zentral enthalten. In csv-Dateien sind alle ISSNZeitschriftenamen und  ZDB-Ids mit der Anzahl der jeweiligen Datensätze enthalten.

Kollektionen

entwickelt und betrieben wird. Als reines Backend-System bietet K10plus-Zentral größtmögliche Flexibilität bei der Integration in unterschiedliche Benutzeroberflächen.

Datenbestand

K10plus-Zentral verfügt über einen umfangreichen Datenbestand mit über 330 Millionen Datensätzen. Detaillierte Bestandsinformationen sind in maschinenlesbarer Form verfügbar:

Die Daten in K10plus-Zentral stammen aus dem Verbundsystem (CBS), in dem alle bibliographischen Metadaten im Format PICA+ gespeichert sind. Für die Verwendung in K10plus-Zentral werden die Metadaten in das Format MARC21 exportiert. Die genaue Abbildung von PICA+ auf MARC21 ist dokumentiert.

Kollektionen

  • ca. 88,7 Millionen digitale Objekte und bibliographischen Nachweise aus den Nationallizenzen (collection:NL)
  • ca. 63,6 ca. 55,5 Millionen Nachweise der Bestände aller GBV-Bibliotheken (der GBV Gesamtkatalog GVK) (collection:GVK)
  • ca. 50 58,9 Millionen Aufsätze aus über 24000 Zeitschriften aus den Online Contents Daten (OLC) mit Besitznachweisen aus der ZDB (collection:OLC)
  • ca. 3339,7 9 Millionen Nachweise des des Südwestdeutschen Bibliotheksverbundes (SWB(collection:SWB)
  • ca. 3337,5 9 Millionen Aufsätze aus PubMed / Medline  (collection:medline)
  • ca. 2315,1 Millionen digitale Objekte und bibliographischen Nachweise aus den Nationallizenzen 6 Millionen Datensätze aus Fachinformationsdiensten (collection:NLFID)
  • ca. 1314,2 0 Mio. Nachweise aus JSTOR (collection:JSTOR)
  • ca. 7,2 Datensätze Datenbank TEMA® Technik und Management des WTI-Frankfurt eG (collection:WTI)ca. 6,7 9,8 Millionen Artikel und Zeitschriften aus dem Directory of Open Access Journals (DOAJ) unter einer Creative Commons BY-SA 4.0 Lizenz (collection:DOAJ)
  • ca. 56,3 4 Millionen Aufsätze aus Zeitschriften des Verlages Elsevier (collection:elsevier)
  • ca. 45,6 9 Millionen Aufsätze aus Springer E-Journals (collection:springer)
  • ca. 34,3 2 Millionen Nachweise der Bestände des Verbundkatalogs Öffentlicher Bibliotheken (, ÖVK (collection:ÖVK)
  • ca. 2,0 5 Millionen Datensätze aus aus arXiv (Collectioncollection:arXiv)
  • ca. 833.000 Datensätze aus dem Zentralen Nachweis für FID-Lizenzen (FIDELIO) (collection:2,1  Millionen Aufsätze aus Zeitschriften des Verlages Wiley (collection:Wiley)
  • ca. 983.00 Millionen klinische Studien aus der Datenbank ClinicalTrials.gov (collection:CTG)
  • ca. 972.000  Aufsätze aus Zeitschriften des Verlages De Gruyter (collection:DeGruyterKFL)
  • ca. 178448.000 Datensätze (Aufsätze) aus biorXiv OpenEdition (collection:biorXivOpenEdition)
  • ca. 166387.000 Datensätze aus Research Square (collection:ResearchSquareResearchSquare)
  • ca. 26326.000 Datensätze aus preprints.org biorXiv (collection:preprintsorgbiorXiv)
  • ca. 7678.000 klinische Studien aus der Datenbank ClinicalTrials.gov Datensätze aus preprints.org (collection:CTGpreprintsorg)
  • ca. 12.600 Datensätze aus 47.000 Datensätze aus chemrXiv (collection:chemrXiv)
  • ca. 39.100 Datensätze aus techrXiv (collection:techrXiv)
  • ca. 23.000 200 Datensätze aus engrXiv (collection:engrXiv)

Die meisten Kollektionen GVK und OLC enthalten Besitznachweise von Bibliotheken.

Den Zeitpunkt des letzten Updates der Daten einer collection kann man unter httphttps://findex.gbv.de/findex_updates/view/ einsehen.

Nationallizenzen

Einzelne Produkte der Nationallizenzen können gezielt ausgewählt werden (collection_details=Produktsigel). Die der Anzahl der jeweiligen Datensätze und ZDB-Ids stehen einer csv-Datei.

...

Technische Basis

Die Suchmaschine basiert auf SolrCloud-Technologie und unterstützt die Integration mit verschiedenen Discovery-Systemen wie:

Nutzung

Der Zugang zu K10plus-Zentral ist ausschließlich registrierten Nutzern vorbehalten. Das integrierte Rechtemanagement gewährleistet die Einhaltung aller Nutzungsbedingungen. Die Datenzugriffe können flexibel gesteuert werden:

  • Inhaltliche Filterung nach verschiedenen Kriterien
  • Einschränkung nach Bibliotheksbeständen
  • Filterung nach Materialarten

Konfiguration der Suchmaschine

Die Suchmaschine basiert auf SolrCloud und ihre gesamte technische Konfiguration ist öffentlich verfügbar. Im Folgenden finden Sie die wichtigsten Informationen zur Konfiguration und Datenverarbeitung. Die vollständige technische Konfiguration kann auf GitHub eingesehen werden.

Schema und Suchfelder

Für Facetten können alle suchbaren Felder aus dem Schema der Suchmaschine verwendet werden. Diese sind als “field name” im Schema der Suchmaschine definiert.

Datenprozessierung

Die Befüllung der Felder kann im Detail imIndex-Properties-File nachvollzogen werden. Dabei gibt es zwei Hauptmethoden der Wertzuweisung:

  1. Direkte Ableitung aus MARC21 Beispiel: Der Verlagswert (publisher) wird direkt aus dem MARC21-Feld 260b übernommen.
  2. Skript-basierte Verarbeitung Beispiel: Das Format wird durch ein separates Skript (format.bsh) ermittelt.

Alle verwendeten Verarbeitungsskripte sind ebenfalls öffentlich zugänglich.

...

Fachausschnitte aus Online Contents (OLC)

Einzelne Fachauschnitte können gezielt ausgewählt werden (collection_details=interne Bezeichnung).

...

Altertumswissenschaften

...

SSG-OLC-ALT

...

Anglistik

...

SSG-OLC-ANG

...

Architektur

...

SSG-OLC-ARC

...

Afrika südlich der Sahara

...

SSG-OLC-ASS

...

Astronomie

...

SSG-OLC-AST

...

Baltische Länder

...

SSG-OLC-BAL

...

Niederlande

...

SSG-OLC-BEL

...

Bildungsforschung

...

SSG-OLC-BIF

...

Informations-, Buch- und Bibliothekswesen

...

SSG-OLC-BUB

...

Chemie

...

SSG-OLC-CHE

...

Ethnologie

...

SSG-OLC-ETH

...

Forstwissenschaften

...

SSG-OLC-FOR

...

Frankreichkunde und Allgemeine Romanistik

...

SSG-OLC-FRK

...

Film und Theater

...

SSG-OLC-FTH

...

Geowissenschaften

...

SSG-OLC-GEO

...

Germanistik

...

SSG-OLC-GER

...

Kunst und Kunstwissenschaft

...

SSG-OLC-GWK

...

Geschichte

...

SSG-OLC-HIS

...

Hochschulwesen

...

SSG-OLC-HSW

...

Ibero-Amerika

...

SSG-OLC-IBA

...

Internationale Beziehungen und Länderkunde

...

SSG-OLC-IBL

...

Italienforschung

...

SSG-OLC-ITF

...

Recht

...

SSG-OLC-JUR

...

Klassische Philologie

...

SSG-OLC-KPH

...

Mathematik und Informatik

...

SSG-OLC-MAT

...

Asien und Nordafrika

...

SSG-OLC-MFO

...

Medien- und Kommunikationswissenschaft

...

SSG-OLC-MKW

...

Musikwissenschaft

...

SSG-OLC-MUS

...

Niederlande

...

SSG-OLC-NED

...

Ost- und Südostasien

...

SSG-OLC-OAS

...

Auswahl deutschsprachiger Zeitschriften

...

SSG-OLC-OEB

...

Osteuropa

...

SSG-OLC-OEU

...

Pharmazie

...

SSG-OLC-PHA

...

Philosophie

...

SSG-OLC-PHI

...

Physik

...

SSG-OLC-PHY

...

Politikwissenschaft und Friedensforschung

...

SSG-OLC-POL

...

Psychologie

...

SSG-OLC-PSY

...

Romanischer Kulturkreis

...

SSG-OLC-ROK

...

Südasien

...

SSG-OLC-SAS

...

Nordeuropa

...

SSG-OLC-SCA

...

Slavistik

...

SSG-OLC-SLA

...

Sozialwissenschaften

...

SSG-OLC-SOW

...

Sportwissenschaften

...

SSG-OLC-SPO

...

Spanien und Portugal

...

SSG-OLC-SPP

...

Technik

...

SSG-OLC-TEC

...

Technikgeschichte

...

SSG-OLC-TGE

...

Umwelt

...

SSG-OLC-UMW

...

Veterinärmedizin

...

SSG-OLC-VET

...

Vorderer Orient

...

SSG-OLC-VOR

...

Wirtschaftswissenschaften

...

SSG-OLC-WIW

...

Zeitgeschichte

...

SSG-OLC-ZGE

...

Fachkatalog

...

interne Bezeichnung

...

Anglo-American Culture

...

SSG-OPC-ANG

...

Astronomie

...

SSG-OPC-AST

...

Baltische Länder

...

SSG-OPC-BAL

...

Informations-, Buch- und Bibliothekswesen

...

SSG-OPC-BBI

...

Finnougristik

...

SSG-OPC-FIN

...

Forstwissenschaften

...

SSG-OPC-FOR

...

Fachkatalog Geophysik

...

SSG-OPC-GEO

...

Geowissenschaften

...

SSG-OPC-GGO

...

Mathematik

...

SSG-OPC-MAT

...

Pharmazie

...

SSG-OPC-PHA

...

Vorderer Orient

...

SSG-OPC-VOR

Konfiguration

Die aktuelle technische Konfiguration der Suchmaschine ist unter https://github.com/gbv/findex-config/tree/master/SolrCloud öffentlich einsehbar.

Grundsätzlich können alle suchbaren Felder aus dem Schema der Suchmaschinen für Facetten verwendet werden. Diese Felder werden im Schema der Suchmaschine als „field name“ ausgezeichnet (siehe: https://github.com/gbv/findex-config/blob/master/SolrCloud/solr_config/schema.xml).

Wie Felder gefüllt werden, kann auch via github nachvollzogen werden. Ausgangspunkt sollte immer sein: https://github.com/gbv/findex-config/blob/master/SolrCloud/solrmarc_config/VZG_KXP_index.properties

Hier sieht man, wie Werte direkt aus marc21 abgeleitet werden, wie z.B. publisher = 260b. Andere Felder wiederum führen zu einem Aufruf eines Skriptes, wie z.B. format = script(format.bsh).

Alle verwendeten Skripte sind öffentlich: https://github.com/gbv/findex-config/tree/master/SolrCloud/solrmarc_config/index_scripts

Alle Daten in K10plus-Zentral stammen aus dem Verbundsystem (CBS). Dort sind alle bibliographischen Metadaten Format PICA+ gespeichert. Für K10plus-Zentral werden die Metadaten aus dem CBS im Format MARC 21 exportiert. Die Abbildung von PICA+ auf MARC 21 ist öffentlich: https://wiki.k10plus.de/display/K10PLUS/Exportformate#Exportformate-MARC21

Fair Use Policy

Mit einer Fair Use Policy ermöglichen wir für alle Anwendungen von K10plus-Zentral eine gerechte Nutzung der Suchmaschine und verhindern Beeinträchtigungen des stabilen Betriebs

Technische Maßnahmen können bei der Einhaltung der Fair Use Policy behilflich sein (siehe: Best Practices).

Ansprechpartner

Wenn Sie einen Zugang zu der Suchmaschine haben möchten, wenden Sie sich an Till Kinstler und Gerald Steilen