Leider konnte ich an diesem Termin nicht mit dabei sein, weil es ein Nachholtermin war. Zum Glück wurde die Vorlesung aufgezeichnet, so konnte ich diese nachschauen. Gestartet hatte es mit einer Rückmelderunde zur DSpace Aufgabe. Was mich daran erinnerte meinen Blogbeitrag noch zu schreiben. Im Nachhinein hatte ich Glück, dass ich die Aufgabe erst am Sonntag gemacht habe, denn am Samstag ist anscheinend der Demo-Server ausgefallen. Nach dem die restlichen Fragen aus den Lerntagebüchern beantwortet waren, starteten wir mit dem Thema «Metadaten und Schnittstellen». Dazu folgte eine Erklärung zum heutigen Vorgehen anhand des Schaubildes. Ich denke, ich komme mit dem heutigen Unterricht der Beantwortung meiner anfänglichen Frage einen Schritt näher.

Austauschprotokolle für Metadaten (OAI-PHM, Z39.50, SRU)

Die wichtigsten Protokolle für den Metadatenaustausch haben über die letzten paar Lerneinheiten besser kennen gelernt und auch angewendet. Die Z39.50-Schnittstelle ist im zwar im Bibliotheksbereich oft verwendet, aber nicht mehr die neuste. Daher wird sie oft von SRU ergänzt. Der Vorteil an SRU und OAI-PMH ist, dass die Anfragen als Internetadresse zusammengestellt werden und ohne Zusatzsoftware über den Browser abrufbar sind.

Harvesten mit VuFindHarvest

Über die OAI-PMH-Schnittstelle bereitgestellten Daten können mit dem VuFindHarvest geerntet (harvesten) werden. Das in PHP geschriebenen Tool VuFindHarvest erlaubt den Zugriff auf die Systeme ohne Admin-Login und den Export der Metadaten auf den eigenen Rechner. Dies haben wir auch bei unseren Systemen angewendet. So haben wir über das Terminal in der VM den VuFindHarvest installiert und die Beispieldateien aus Koha, ArchivesSpace und DSpace geerntet. Anschliessend haben wir die Metadaten jeweils in einem separaten Ordner in den Formaten MARC21XML, EAD und DC gespeichert.

https://ibb.co/MpxmZtj

Crosswalks XSLT und MarcEdit7

Für mich ist Crosswalks ein Regelwerk zur Konvertierung von einem Metadatenstandart in einen anderen. Denn mittels Mapping wird festgelegt, welche Elemente und Werte wo zugeordnet werden. Meist geschieht das nicht ganz ohne Verlust, denn die Metadatenstandards haben alle ihre eigenen Spezialfelder. MARC21 ist der komplexeste Standard, daher werden wir die anderen Daten von DC und EAD in MARCXML tranformieren. Dies wird mittels der Programmiersprache XSLT bzw. der Software MarcEdit7 gemacht. Mit der guten Anleitung durch die Dozierenden (und der Pausen Funktion bei der Aufzeichnung) habe ich es geschafft die Stoplersteine zu beheben, den MarcEdit7 zu installieren und die Daten zu konvertieren. Für DSpace war das alles unproblematisch, da die Metadaten von DSpace in Dublin Core vorliegen. Aber ArchivesSpace verwendet das Datenaustauschformat EAD, weshalb zwei Konvertierungsschritte nötig sind, um am Schluss MARC21-Daten zu erhalten.

MarcEdit7

(Quelle: Eigener Screenshot von der MarcEdit7 Software)