Die Fotos für „Stuttgart 1942“ liegen als Kontaktabzüge vor. In der Bildergalerie erhalten Sie weitere Einblicke ins Entstehen des Projekts. Foto: Jan Georg Plavec /Stadtarchiv Stuttgart

Für das Projekt „Stuttgart 1942“ haben wir 12 000 Fotos aus dem Stadtarchiv verwertet. Dafür brauchte es viel Geduld – und einen selbst programmierten Algorithmus.

Stuttgart - Der Kern von „Stuttgart 1942“, unserem Gemeinschaftsprojekt mit dem Stadtarchiv Stuttgart, ist ein Bilderschatz mit rund 12 000 Motiven. 1942 ließ die Stuttgarter Stadtverwaltung fast das gesamte Stadtgebiet fotografieren. Der Fotobestand überlebte den Zweiten Weltkrieg und kam ins Stadtarchiv. Vor einigen Jahren ließ das Archiv die Bilder – fast ausschließlich sogenannte Kontaktabzüge – digitalisieren und sortierte den Bestand unter der Nummer 101 in seinem Findbuch nach bestimmten, 1942 von der Verwaltung eingeteilten Bezirken.

Seither können Benutzer die Bilder im Lesesaal des Stadtarchiv am Bellingweg durchsuchen. Für jeden Bezirk existieren maschinengeschriebene Listen, die jedes einzelne Bild recht genau verorten. Jedes Bild hat eine eindeutige Nummer, und die Listen enthalten für jede dieser Nummern die Information, was auf dem Foto zu sehen ist. Wegen der Menge des Materials brauchen ungeübte Nutzer trotzdem mehrere Minuten, um beispielsweise die Bilder einer bestimmten Straße zu finden. Dazu kommt das Problem, dass etliche Straßen in mehreren Listen auftauchen. Die Suche nach bestimmten Motiven ist also sehr mühsam.

Alles für die eine Tabelle

Um es den Nutzern leichter zu machen, haben wir uns moderner Methoden bedient. Die Grundidee: Wenn jedes Bild eine eigene, eindeutige Nummer hat und es zu jeder Nummer in den Schreibmaschinenlisten eine Information gibt, was dieses Bild zeigt – dann muss man das nicht händisch zusammenfügen, sondern kann das den Computer erledigen lassen.

Dafür mussten wir zunächst einen Algorithmus schreiben, der den Text in den Schreibmaschinenlisten ausliest. Zwar gibt es Programme zur Texterkennung (sogenannte OCR) schon lange. Weil die Listen aber in Tabellenform angelegt sind und das 1942 zudem nicht ganz einheitlich geschah, mussten wir dem Rechner ein wenig Künstliche Intelligenz beibringen, um trotzdem das Meiste richtig zu erkennen.

Das Ergebnis der Rechnerei war eine einzige Tabelle mit rund 12 000 Zeilen, die den Inhalt der Schreibmaschinenliste zusammenfasste. Um Rechtschreibfehler zu korrigieren, ließen wir einen weiteren Algorithmus über diese Liste laufen, den wir mit der korrekten Schreibweise der Straßennamen und, wo nötig, den heutigen Straßennamen gefüttert hatten – schließlich wurden seit 1942 viele Straßen umbenannt, und zwar nicht nur jene, die nach Adolf Hitler benannt waren. Die so korrigierte Liste kontrollierten wir schließlich händisch nach. Schließlich muss bei jedem einzelnen Bild die Verortung stimmen.

Man kann das auch studieren

Die korrigierte Liste und den kompletten Fotobestand luden unsere Webentwickler schließlich auf den Server. Dank der eindeutigen Bildnummern sind damit die Bilder im Volltext durchsuchbar – eine wesentliche Erleichterung gegenüber dem bisherigen Zustand.

Wir haben uns diese Methode nicht ganz von allein ausgedacht. Die Studienrichtung „Digital Humanities“, die man an der Uni Stuttgart auf Master studieren kann, verbinden Geisteswissenschaften und Informatik. Forscher aus diesem Gebiet haben Werkzeuge entwickelt, mit denen Texte aus der Zeit vor der Digitalisierung erfasst und nutzbar gemacht werden – etwa Programmhefte zu alten Theatervorführungen. Gleichwohl gab es kein Patentrezept, das wir einfach nur hätten kopieren können. Wir mussten den Code zur Erfassung der Schreibmaschinenlisten vollständig neu verfassen. Was sich im Ergebnis spielerisch anfühlt, braucht Tausende Zeilen Programmiercode – und sehr viel Genauigkeit beim Kontrollieren der Ergebnisse.

Hat Ihnen der Artikel gefallen? Jetzt teilen: