Bis dato bestand das Findmittel der Zentralregistratur des Landeskirchenrats der Evangelischen Kirche der Pfalz aus zwei Serien Karteikarten – einer Stichwortkartei und einer klassisch nach Registraturplan geordneten Kartei. Auch die weitere Arbeit in der Zentralregistratur gestaltete sich noch weitestgehend analog.
Um ein zeitgemäßes Arbeiten und Recherchieren zu ermöglichen, aber auch, um die vorhandenen Metadaten archivisch nachnutzen zu können, war ein digitaler Shift innerhalb der Arbeitsprozesse der Zentralregistratur unumgänglich und überfällig.
Ein grundlegender erster Schritt zur Überarbeitung der Arbeitsprozesse war folglich, eine digitale Arbeitsgrundlage zu schaffen. Klassischerweise hätte zunächst das manuelle Übertragen der Metadaten von den Karteikarten in die Datenbank angestanden. Im Fall der Karteikarten des Registraturfindmittels hat sich das Zentralarchiv Speyer dazu entschieden, stattdessen ein KI-gestütztes Kleinprojekt zu realisieren.
Die Gründe hierzu sind vielfältig. An dieser Stelle seien nur einige Aspekte genannt.
Zunächst wurden in Eigenleistung des Archivs die Karteikarten nach Vorgaben des Dienstleisters eingescannt. Hierzu reicht bereits ein kleiner, leicht zu bedienender Tischscanner für Dokumente, der diese Arbeit durch einen automatischen Einzug recht schnell erledigte. Etwas mehr Zeit bedurfte das Heraussuchen von „schwierigen Sonderfällen“ innerhalb der Karteikarten, die recht stark vom gängigen Muster abwichen und u.a. als Testdateien dienten.
Die Datei mit insgesamt 3096 Scans von 1548 DIN A5 Karteikarten sollte die Grundlage für die KI-gestützte Überführung der maschinenschriftlichen Karteikarten mit handschriftlichen Ergänzungen in eine Excel-Datei bilden.
Archipanion bereitete die Scans durch paarweises Zuordnen der Vorder- und Rückseiten auf, bewerkstelligte die Auslesung der Felder durch LLM und nahm eine Vereinheitlichung der Formate vor. Nach wenigen Testläufen gelang dies in vielen Fällen von Karten, die nicht bis wenig von der Grundstruktur abwichen, erfolgreich.
Bei Karteikarten, deren Struktur erheblich abwichen, geriet die KI verständlicherweise an ihre Grenzen. Eine semantische Interpretation von handschriftlichen Nachträgen und die Zuordnung von Notizen auf der Karte blieben letztlich Handarbeit. Um möglichst alle Informationen der analogen Karten auch in der digitalisierten Version abzubilden, fiel die Entscheidung auf eine sehr engmaschige Qualitätssicherung, bei der jeder Scan mit den daraus generierten Metadaten der Tabelle abgeglichen wurde.
Um dies auf eine sehr komfortable Weise zu gestalten, stellte Archipanion zum direkten Vergleich der Scans mit den generierten Einträgen ein Web-Frontend zur Verfügung, in das auch direkt die Korrekturen eingepflegt werden konnten. So konnte auch die recht aufwändige Qualitätssicherung durch IT-gestützte Verbesserungen auf einem sehr hohen Niveau zeitgemäß und in einem überschaubaren Zeitraum geleistet werden. Fehlende oder falsch zugeordnete Angaben konnten schnell und einfach ergänzt werden und zugleich auch auf ihre fachliche Plausibilität geprüft werden. Die Qualitätssicherung konnte durch die bearbeitende Registratorin innerhalb von sechs Wochen umgesetzt werden.
Kennzahl | Wert |
---|---|
Karten verarbeitet | 1548 |
Exakt erkannt (kein Fehler) | 481 Karten (31 %) |
Nur wenige Korrekturen (≤ 5 % CER) | 926 Karten (60 %) |
Durchschnittliche Fehlerrate (CER) | 7,27 % |
Exakt erkannte Felder | 89 % |
Zeit für QS | ca. 6 Wochen |
Hinweis zur Fehlerrate: Die Messung ist konservativ. Während der Qualitätssicherung wurden zusätzlich Fehler im ursprünglichen Findmittel korrigiert oder aktualisiert (z. B. Schreibweisen, Klassifikationen). Diese Verbesserungen werden nicht separat berechnet und tauchen daher in der CER-Statistik auf, sodass die tatsächliche Datenqualität höher liegt.
Der Pilot zeigt deutlich: KI überzeugt dort, wo sie Fleißarbeit übernimmt und mehr Zeit für Facharbeit generiert. Aus 1548 Karteikarten wurden in wenigen Wochen recherchierbare Datensätze – ohne den Anspruch, menschliche Expertise zu ersetzen. Für die Projektleitung ist das ein Schritt hin zu einem modern und digital arbeitenden Archiv, das die modernen Möglichkeiten der Datenaufbereitung archivfachlich nutzbar macht.
Ihr 30-minütiges „Status-&-Ziel-Briefing“ bringt Klarheit:
Ergebnis: Ein klares Bild Ihrer Situation sowie eine realistische Ersteinschätzung: Was ist möglich? Welche nächsten Schritte – z. B. ein vertiefender Workshop oder ein Pilot – lohnen sich?