Een enorme schat aan middeleeuwse Joodse documenten wordt dankzij
AI toegankelijker en biedt nieuwe kansen om het verleden te ontrafelen. Onderzoekers in Israël zijn bezig met het project MiDRASH, dat een enorme collectie manuscripten uit de Cairo Geniza bewerkt. Deze collectie bevat naar schatting meer dan 400.000 documenten, geschreven in het Hebreeuws, Arabisch, Aramees en Jiddisch. Het grootste deel was tot nu toe ondoorgrondelijk, volgens
Reuters.
Van stapel papier naar doorzoekbare gegevens
De brouwerij waarin de documenten bewaard werden, is al eerder gedigitaliseerd. Foto's van de manuscripten online gezet door de National Library of Israel. Toch bleef het grootste deel ongetranscribeerd: alleen zo’n 10 procent had een leesbare transcriptie. Vele documenten zijn fragmenten, soms ondersteboven of door elkaar, of onvolledig.
Met hulp van
AI hoeven onderzoekers niet langer elk stuk handmatig te decoderen. Het door MiDRASH gebruikte AI-model is getraind om de oude handschriften te herkennen, ongeacht of de tekst in Hebreeuws, Arabisch, Aramees of Jiddisch is, en kan woorden, namen en zinnen transcriberen. Zo kunnen zelfs fragmenten weer samengevoegd worden tot complete documenten.
Nieuwe vondsten uit de schaduw
Het proces heeft al tastbare resultaten opgeleverd. Een opmerkelijke vondst is een brief uit de zestiende eeuw, geschreven in het Jiddisch door een weduwe in Jeruzalem aan haar zoon in Caïro, die terugschreef in de marge over zijn overleving tijdens een pestepidemie. Zo’n brief was tot nu toe waarschijnlijk onleesbaar gebleven.
Voor historici betekent dit een enorme stap vooruit. Dankzij de AI-transcriptie wordt het mogelijk om oude documenten te lezen die niet alleen religieus of juridisch van aard zijn, maar soms zeer persoonlijke verhalen bevatten. Ook namen, plaatsen en datums worden nu beter te koppelen. Dat helpt om een beeld te krijgen van het dagelijks leven van Joodse gemeenschappen in het Midden-Oosten door de eeuwen heen.
Betere toegankelijkheid voor iedereen
Een ander belangrijk aspect van MiDRASH is de toegankelijkheid. Tot nu toe was de kennis over de Geniza grotendeels voorbehouden aan specialisten. Wie de oude handschriften kon lezen, had de sleutel. Dankzij de AI-transcripties kunnen documenten begrijpelijk worden gemaakt voor een veel breder publiek: historici, onderzoekers, maar ook geïnteresseerden zonder specifieke taalkennis. Volgens een van de onderzoekers wordt duidelijk dat het nu mogelijk is om “het verleden als het ware te reconstrueren, alsof je een middeleeuws Facebook zou kunnen maken.”
Wat staat er te gebeuren?
Het project wordt mede gefinancierd door de European Research Council en brengt onderzoekers samen uit meerdere landen en instituten. Ze werken aan het verbeteren van de AI-herkenning en aan mogelijkheden om de output te vertalen en publiek beschikbaar te maken. De hoop is dat binnen afzienbare tijd de meerderheid van de Geniza-transcripties leesbaar en doorzoekbaar is.