Google heeft een neuraal netwerk ontwikkeld dat verloren fragmenten van Latijnse inscripties herstelt

Via: Viktor Tsyrfa | gisteren, 01:52
Een historische weergave van Latijns schrift: geen spaties tussen woorden Een voorbeeld van Latijns schrift. Door ruimtegebrek waren er vaak geen spaties tussen woorden. Bron: Getty Images

Google DeepMind heeft een open neuraal netwerk ontwikkeld genaamd Aeneas dat kan helpen bij het herstellen van verouderde beschadigde Latijnse inscripties. De oude Romeinen hebben veel schriftelijke monumenten achtergelaten, maar niet allemaal zijn ze in perfecte staat bewaard gebleven. Velen van hen zijn beschadigd, en de meesten zijn ons alleen in de vorm van fragmenten overgeleverd. Aeneas helpt om de verloren delen van de tekst te herstellen.

Bronzen militaire diploma uit Sardinië hersteld
Een hersteld bronzen militaire diploma uit Sardinië, toegekend door keizer Trajanus aan een matroos op een oorlogsschip. Illustratie: predictingthepast.com/aeneas

Houd je scepsis in bedwang

Ja, neurale netwerken kunnen fouten maken en dingen uitvinden die niet bestaan. Maar Google heeft de taak wetenschappelijk benaderd - om de tekst te herstellen, heeft het neuronale netwerk context nodig. Door te weten tot welke periode de vondst behoort en de plaats van ontdekking, analyseert het neurale netwerk de woordenschat die op de gevonden monumenten van die tijd is aangetroffen, evenals relevante gebeurtenissen uit die tijd, om de verloren woorden zo nauwkeurig mogelijk te raden. Geeft dit de garantie dat Aeneas de oorspronkelijke inscriptie foutloos zal reproduceren? Natuurlijk niet, dat is onmogelijk. Maar het zal echt goed werk leveren, gebaseerd op een wetenschappelijke benadering en de krachtige mogelijkheden van moderne technologie. Deze taak is vooral moeilijk voor monumenten waarbij zelfs de lengte van het verloren fragment onbekend is. Dus ja, het biedt geen 100% garantie van authenticiteit. Maar voor monumenten die onherstelbaar beschadigd zijn, zullen we geen beter resultaat kunnen bereiken. Tenminste tot de uitvinding van een tijdmachine.

Technische details van Aeneas

  • Het model begrijpt zowel tekst als afbeeldingen
  • Getraind op ~176.000 Latijnse karakters, in totaal 16 miljoen karakters
  • Vernoemd naar een mythische held uit de Trojaanse epiek
  • Gezamenlijk gemaakt door DeepMind en onderzoekers van de universiteiten van Nottingham, Warwick, Oxford en Athene
  • Attribuering: bepaalt waar (afhankelijk van een van de 62 provincies) en wanneer (nauwkeurig tot ~13 jaar) de inscriptie is gemaakt
  • Efficiëntie: met tot 10% van de karakters beschadigd, is de juiste optie 73% van de tijd; zelfs zonder te weten hoe lang het is - 58%
  • Zoeken naar analogieën: vindt parallellen in stijl, vorm en context

Een interactieve versie van Aeneas is beschikbaar op predictingthepast.com, en de code en database zijn open voor onderzoekers.

Waarom het ertoe doet

Neurale netwerken zijn erg goed in het vinden van patronen in grote hoeveelheden informatie, waarin het voor mensen heel moeilijk is relaties te identificeren. Daarom zal deze benadering helpen om een beetje meer historische informatie te herstellen. Zelfs als je een fout maakt in specifieke woorden, kan Aeneas de belangrijkste boodschap van de tekst suggereren.

Bron: www.engadget.com