Folgeveranstaltung des Workshops der FAG Erschließung und Informationsvermittlung auf der GBV Verbundkonferenz 2021 


Termin: 12. Mai 2022

Uhrzeit: 10.00 - 12.00 Uhr

Der Zugangslink: Die Veranstaltung fand per Zoom statt.


Präsentationsfolien zum Impulsvortrag: E-Book-Import in den K10plus oder „Von der Masse zur Klasse?“ / G. Ladisch (BSZ)


Um folgende Themen soll es in der 2. Diskussionsrunde gehen:

Aktivitäten der VZG in Bezug auf Datenimporte und Metadatenqualität

Datenimport allgemein

Viele Prozesse des Metadatenmanagements in Bibliotheken wurden gestaltet, als Bibliotheken die meisten Metadaten selbst generiert oder zumindest bearbeitet haben. Heutzutage sind allerdings die Mehrheit der Metadaten Fremddaten. Das erfordert einen Paradigmenwechsel. Wir wollen Fragen dazu diskutieren, z.B.:

  • Wie interagieren Prozesse des Metadatenmanagements in den einzelnen Häusern mit den Angeboten der VZG zu Datenimport und Metadatenpflege?
  • (Wie) kann die VZG Bibliotheken mehr Flexibilität und Selbständigkeit bei der Dateneinspielung ermöglichen?
  • Lässt sich der Datenimport (noch weiter) automatisieren?
  • Wie mit Fragen der Skalierbarkeit umgehen?

Verlage

Die Breite und Tiefe von Verlagsmetadaten reicht oft für die Zwecke von wissenschaftlichen Bibliotheken nicht aus. Hier soll erörtert werden, wie sowohl auf Verlagsseite die Qualität von Metadaten verbessert werden kann als auch, wie diese durch Bibliotheken flexibler und komfortabler nachbearbeitet werden können. Fragen:

  • In welchem Umfang müssen Verlagsmetadaten erfahrungsgemäß nachbearbeitet werden?
  • Wie sähen Möglichkeiten aus, Verlagsmetadaten für eine erleichterte und individualisierte Nachbearbeitung im Katalogisierungssystem zur Verfügung zu stellen?
  • Wie können Verlage, die große Datenpakete liefern, vertraglich motiviert werden, gute und vollständige Daten zu liefern?
    • Lassen sich diese Anforderungen beschreiben/normieren? Auch in Bezug auf Datenschemata und Formate, insbesondere im Hinblick auf automatisierte Einspielungen?
    • Wie sieht hier die aktuelle Praxis aus, was davon wird schon gemacht?
  • Wie können Bibliotheken den Überblick über Datenlieferungen und -updates von Verlagen behalten?

Nachnutzbarkeit und Mehrwerte hochqualitativer Metadaten

Den richtigen Punkt für einen Tradeoff zwischen Metadatenqualität und Machbarkeit zu finden bzw. herauszufinden, welche Qualitätsmängel und Lücken in sehr großen Datenmengen für bestimmte Anwendungszwecke überhaupt einen Unterschied machen und welche nicht, ist komplex.
Darüber hinaus entstehen durch den technologischen Fortschritt neue Anwendungsgebiete, für die manche Eigenschaften der Metadaten wichtiger sind als andere – zentral ist das Thema Maschinenlesbarkeit. Wir wollen ausloten, welche Mehrwerte für Bibliotheken interessant sind, welche Eigenschaften die Metadaten dafür erfüllen müssten, und wie wir sie entsprechend transformieren müssen.

  • Sowohl der Bereich Semantic Web als auch der Bereich Machine Learning erfordern andere Formate als die klassische Katalogisierung. Wenn Bibliotheken Verfahren aus diesen Bereichen zur Verbesserung des Retrievals anwenden wollen, müssen die Forschenden Zugang zu großen Mengen von Daten aus dem Katalog haben, und zwar in Formaten, die sie kennen und verstehen (RDF, JSON, ...).
    • Wie können Metadaten aus K10plus über eine API mit allen Details (die aktuelle RDF-Version enthält z.B. nicht alle Feldinhalte und Unterscheidungen) in passenden Formaten angeboten werden, um mit diesen in innovativen Anwendungen, etwa in Knowledge-Graph-Systemen, weiterarbeiten zu können?
  • Für solche Anwendungen ist z.B. eine wichtige Angabe eine Sprachangabe auf String-(~Feldinhalt-)Ebene. Wie bekommen wir diese an die Daten im GBV?
  • Semantic-Web-Anwendungen sind entitätenbasiert modelliert, also ist Normierung mit Hilfe von IDs ein wichtiges Thema. Wie kann der GBV bei der Sacherschließung bzgl. der standardisierten Daten unterstützen? Über welche Workflows und Tools kommen die Normdaten und die normierten Daten in den Katalog? Wie ist der Stand bei einsatzfähigen automatischen Verfahren zur Disambiguierung von Personen und Körperschaften?
  • No labels