Zu Content springen

Vom Karteikasten zum Datenbestand – Evangelische Kirche der Pfalz

Markus Stauffiger
Markus Stauffiger |

Wie das Zentralarchiv der Evangelischen Kirche der Pfalz das Findmittel der Zentralregistratur in wenigen Wochen digital nutzbar machte

pfalz-registraturkarten-1Web-Oberfläche zum direkten Vergleich zwischen Scan und Daten und rascher Bearbeitung. 

Bis dato bestand das Findmittel der Zentralregistratur des Landeskirchenrats der Evangelischen Kirche der Pfalz aus zwei Serien Karteikarten – einer Stichwortkartei und einer klassisch nach Registraturplan geordneten Kartei. Auch die weitere Arbeit in der Zentralregistratur gestaltete sich noch weitestgehend analog.

Um ein zeitgemäßes Arbeiten und Recherchieren zu ermöglichen, aber auch, um die vorhandenen Metadaten archivisch nachnutzen zu können, war ein digitaler Shift innerhalb der Arbeitsprozesse der Zentralregistratur unumgänglich und überfällig.

Ein grundlegender erster Schritt zur Überarbeitung der Arbeitsprozesse war folglich, eine digitale Arbeitsgrundlage zu schaffen. Klassischerweise hätte zunächst das manuelle Übertragen der Metadaten von den Karteikarten in die Datenbank angestanden. Im Fall der Karteikarten des Registraturfindmittels hat sich das Zentralarchiv Speyer dazu entschieden, stattdessen ein KI-gestütztes Kleinprojekt zu realisieren.

Die Gründe hierzu sind vielfältig. An dieser Stelle seien nur einige Aspekte genannt.

  • Zeitgemäßer Umgang mit alten Findmitteln, ohne abschreckende, veraltete Tätigkeiten für neue Mitarbeitende.
  • Erprobungsraum für Ideen zur optimierten Nutzung von Synergieeffekten durch die Digitalisierung.
  • Neugier auf das, was KI-gestützt möglich ist – und was nicht; Erfahrungsgewinn innerhalb eines überschaubaren Projekts.

Ausgangslage und Ziel:

Zunächst wurden in Eigenleistung des Archivs die Karteikarten nach Vorgaben des Dienstleisters eingescannt. Hierzu reicht bereits ein kleiner, leicht zu bedienender Tischscanner für Dokumente, der diese Arbeit durch einen automatischen Einzug recht schnell erledigte. Etwas mehr Zeit bedurfte das Heraussuchen von „schwierigen Sonderfällen“ innerhalb der Karteikarten, die recht stark vom gängigen Muster abwichen und u.a. als Testdateien dienten.

Die Datei mit insgesamt 3096 Scans von 1548 DIN A5 Karteikarten sollte die Grundlage für die KI-gestützte Überführung der maschinenschriftlichen Karteikarten mit handschriftlichen Ergänzungen in eine Excel-Datei bilden. 

Die Entscheidungsformel: Mensch UND Maschine

Archipanion bereitete die Scans durch paarweises Zuordnen der Vorder- und Rückseiten auf, bewerkstelligte die Auslesung der Felder durch LLM und nahm eine Vereinheitlichung der Formate vor. Nach wenigen Testläufen gelang dies in vielen Fällen von Karten, die nicht bis wenig von der Grundstruktur abwichen, erfolgreich.

Bei Karteikarten, deren Struktur erheblich abwichen, geriet die KI verständlicherweise an ihre Grenzen. Eine semantische Interpretation von handschriftlichen Nachträgen und die Zuordnung von Notizen auf der Karte blieben letztlich Handarbeit. Um möglichst alle Informationen der analogen Karten auch in der digitalisierten Version abzubilden, fiel die Entscheidung auf eine sehr engmaschige Qualitätssicherung, bei der jeder Scan mit den daraus generierten Metadaten der Tabelle abgeglichen wurde.

Um dies auf eine sehr komfortable Weise zu gestalten, stellte Archipanion zum direkten Vergleich der Scans mit den generierten Einträgen ein Web-Frontend zur Verfügung, in das auch direkt die Korrekturen eingepflegt werden konnten. So konnte auch die recht aufwändige Qualitätssicherung durch IT-gestützte Verbesserungen auf einem sehr hohen Niveau zeitgemäß und in einem überschaubaren Zeitraum geleistet werden. Fehlende oder falsch zugeordnete Angaben konnten schnell und einfach ergänzt werden und zugleich auch auf ihre fachliche Plausibilität geprüft werden. Die Qualitätssicherung konnte durch die bearbeitende Registratorin innerhalb von sechs Wochen umgesetzt werden. 

Eckdaten des Projektvolumens und der Bearbeitung

Kennzahl Wert
Karten verarbeitet 1548
Exakt erkannt (kein Fehler) 481 Karten (31 %)
Nur wenige Korrekturen (≤ 5 % CER) 926 Karten (60 %)
Durchschnittliche Fehlerrate (CER) 7,27 %
Exakt erkannte Felder 89 %
Zeit für QS ca. 6 Wochen

Hinweis zur Fehlerrate: Die Messung ist konservativ. Während der Qualitätssicherung wurden zusätzlich Fehler im ursprünglichen Findmittel korrigiert oder aktualisiert (z. B. Schreibweisen, Klassifikationen). Diese Verbesserungen werden nicht separat berechnet und tauchen daher in der CER-Statistik auf, sodass die tatsächliche Datenqualität höher liegt.

Beispiele

pfalz-registraturkarten-2Karten wie diese wurden komplett korrekt erkannt. 

pfalz-registraturkarten-3Bei solchen Karten ist die menschliche Intelligenz gefragt. Nicht unbedingt zur Erkennung der Zeichen, aber hier muss interpretiert und entschieden werden, welche Informationen man wie übernimmt. 

pfalz-registraturkarten-4Auch bei abweichenden Layouts können unvorhergesehene Felder manuell ergänzt werden. 

Vier zentrale Lerneffekte

  • Struktur gewinnt
    Karten, die dem Layout folgen, sind gut erkennbar oder mit wenigen Korrekturen korrekt. Handschriftliche Ergänzungen und Abweichungen bleiben herausfordernd, diese sind allerdings in Altbeständen üblich und die notwendige QS muss mitgedacht werden.

  • Benutzerfreundlichkeit macht den Unterschied
    Die integrierte Kontrolloberfläche ersparte den Teammitgliedern den „Excel-Digitalisat-Ping-Pong“ – ein klarer Komfort- und Zeitgewinn gegenüber herkömmlichen Qualitätsprüfungen.

  • KI ist ein Prozess, kein Produkt
    „Wir wissen jetzt, was wir realistischerweise erwarten können – und wo fachliches Urteilsvermögen unverzichtbar bleibt“, fasst die Projektleiterin zusammen. Automatisierung deckt Fleißarbeit ab und hilft dabei, archivische Bearbeitungsprozesse zeitgemäß zu gestalten. Die manuelle Arbeit fokussiert sich zunehmend auf die fachlich zu erbringende Leistung.

  • Erheblich weniger Zeitaufwand trotz Fehlern
    Durch die Vorarbeit der KI traten Fehler, die allerdings ebenso bei einer manuellen Verarbeitung der Fall wären. Die Art der Fehler ist aber anders: überschaubarer und in der Varianz reduziert. Ebenso ist der Zeitgewinn durch eine maschinelle Verarbeitung unschlagbar. Die Fehlerrate kann somit durch die anschließende QS mit erheblich weniger Zeitaufwand weiter verringert werden.

Das Ergebnis

  • Excel-Datei im Zielformat liegt vor.
  • Daten können mit gutem Gefühl genutzt werden, weil die fachliche Qualität deutlich gestiegen ist.
  • Das Team hat ein praxisnahes Verständnis dafür gewonnen, wie KI und Fachexpertise zusammenspielen.

Der Nutzen – in wenigen Wochen

  • Recherchierbarkeit
    Analoge Register werden zur digital durchsuchbaren Datenbank.
  • Qualitätssprung
    Inkorrekte oder veraltete Einträge lassen sich direkt korrigieren.
  • Wissensaufbau
    Mitarbeitende gewinnen Routine im Zusammenspiel von KI + Archivpraxis.

Fazit

Der Pilot zeigt deutlich: KI überzeugt dort, wo sie Fleißarbeit übernimmt und mehr Zeit für Facharbeit generiert. Aus 1548 Karteikarten wurden in wenigen Wochen recherchierbare Datensätze – ohne den Anspruch, menschliche Expertise zu ersetzen. Für die Projektleitung ist das ein Schritt hin zu einem modern und digital arbeitenden Archiv, das die modernen Möglichkeiten der Datenaufbereitung archivfachlich nutzbar macht.

Wie können Sie starten?

Ihr 30-minütiges „Status-&-Ziel-Briefing“ bringt Klarheit:

  • Ausgangslage analysieren – Welche analogen Bestände & Findmittel liegen vor?
  • Ziele priorisieren – Welche Work-Flow-Verbesserungen wünscht Ihr Team?
  • Potenziale bewerten – Wo können KI-gestützte Verfahren konkret unterstützen?

Ergebnis: Ein klares Bild Ihrer Situation sowie eine realistische Ersteinschätzung: Was ist möglich? Welche nächsten Schritte – z. B. ein vertiefender Workshop oder ein Pilot – lohnen sich?

Diesen Beitrag teilen