Quand l’IA permet d’arracher des textes en judéo-allemand, jargon pour ainsi dire anéantie par les nazis

Rescapé du ghetto israélite de Vilnius en Lituanie, Avrom Sutzkever (1913-2010) est vénérable même l’un des surtout grands poètes judéo-allemand. Appelé à soutenir lorsque du combat de Nuremberg en février 1946, il souhaite s’narrer entre sa jargon, celle-ci des israélites d’Europe usine et orientale. “Je veux parler la langue du peuple que les accusés ont tenté d’exterminer, avec leur propre langue. Qu’ils entendent notre langue maternelle ! Qu’ils entendent notre langue, et puisse Alfred Rosenberg [un idéologue nazi, condamné à mort lors du procès de Nuremberg, NDLR] en être stupéfait ! Puisse ma langue triompher à Nuremberg, symbole de sa force inébranlable !”, écrit-il entre son certificat nombreux jours précocement son appareillage avec l’Allemagne.

Mais cette interpellation ne lui est pas harmonieuse. Pour des raisons techniques, les procureurs soviétiques lui demandent d’appliquer le russe, l’une des langues officielles de ce combat inoubliable. Le judéo-allemand ne résonne pas entre le tribunal de équité de Nuremberg.

Quatre-vingts ans surtout tard, le bilan est le même. Cette jargon, dérivée de l’tudesque formel au Moyen-Âge, n’est surtout entendue. À la insomnie de la Seconde Guerre mondiale, il est estimé que 10,6 millions de créatures parlent cette jargon, la grand nombre en Europe au néné de la corporation juive ashkénaze. Aujourd’hui, ils ne sont surtout qu’comme ci comme ça un million de locuteurs. Seule une clef de chercheurs sont capables de anéantir le judéo-allemand, surtout moins en thème manuscrite.

À anéantir pareillementProcès de Nuremberg : un brochure dernier exhumé des archives révèle les coulisses d’une équité pionnière

“Un processus long et fastidieux”

Pour polir à elles parturition, une meute du Centre d’ouvrages sur le judaïté d’Europe orientale de la conception d’article de l’externat de Vilnius, en Lituanie, a mis au partie le modèle Vilne-Yiddish, un complément de ronde d’alphabet manuscrite en jargon judéo-allemand. “Il existe de nombreux styles d’écriture différents”, explique l’librettiste Sergii Gurbych, qui a fixe cet complément. “Ils varient selon l’époque, la région et même le milieu social. Actuellement, les chercheurs qui travaillent sur des textes yiddish transcrivent manuellement des dizaines de pages d’autobiographies, de journaux intimes et de lettres – un processus long et fastidieux.”

Petit-fils d’un hors de la Shoah qui a conquis à s’éclipser du ghetto de Lodz en Pologne, ce versé s’est épris depuis hétérogènes années avec cette jargon. “Comme pour tout document manuscrit, certains textes sont d’une clarté remarquable, presque calligraphiques, tandis que d’autres sont très difficiles à déchiffrer”, décrit Sergii Gurbych. Les science en judéo-allemand ne sont pourquoi pas infiniment écrites de la même recherché et les orthographes sont exceptionnellement changeantes disciple le partenaire.

Pour pousser le parturition des chercheurs, l’librettiste a enregistré l’crédit des outils digitaux. Pour établir son sympathie artificielle, son meute a exploité des manuscrits écrits entre les années 1930 parfois redécouverts entre les archives de la Bibliothèque nationale de Lituanie. Ces autobiographies avaient été envoyées à l’Institut avec la apprêt juive, public au-dessous l’poursuivre Yivo, aujourd’hui placé à New York, malheureusement posé en 1925 à Vilnius, donc surnommée “la Jérusalem de Lituanie”, l’un des noyaux culturels israélites les surtout parfaits de l’date : “Parmi eux figuraient des mémoires personnels rédigés par des juifs originaires de villes de Pologne de l’entre-deux-guerres, décrivant leurs expériences durant la Première Guerre mondiale. Ces documents sont tout à fait exceptionnels.”

À absenter de ces flots manuscrites, Sergii Gurbych a imaginé un choix de occurrence qui a accord au modèle d’opiner la assemblage de l’alphabet manuscrite judéo-allemand. L’outil rejoint une talent d’comme ci comme ça 95 %. “Une précision de 100 % est impossible à atteindre. Certaines lettres de l’alphabet yiddish se ressemblent beaucoup, ce qui rend les erreurs inévitables. Chaque page doit donc être corrigée manuellement après la reconnaissance. On ne peut pas simplement télécharger un manuscrit et obtenir un texte parfait en retour ; le traitement de chaque page prend tout de même 15 à 20 minutes. Mais c’est beaucoup plus rapide que de tout faire manuellement”, ouverte le versé lituanien.

Fondé à Vilnius en 1925, le centre Yivo s'est installé à New York en 1940 face à l'avancée nazie. Lors d'une exposition en octobre 2017, l'institut a dévoilé des documents juifs disparus.
Fondé à Vilnius en 1925, le coeur Yivo s’est installé à New York en 1940 extérieur à l’loggia nazie. Lors d’une commentaire en octobre 2017, l’université a glabre des histoires israélites disparus, que l’on croyait détruits ballant la Shoah, laquelle des écrits en judéo-allemand. Thos Robinson, Getty Images via AFP

À anéantir pareillementLes esprits des collaborateurs des nazis hantent les rues de Vilnius

Un complément en affranchi avance

À des milliers de kilomètres de Vilnius, la navigatrice française de l’EHESS Cécile Rousselet avis déjà son exaltation avec cette journal IA. Jusqu’actuellement, lui-même utilisait, avec l’concourir entre ses lectures, le modèle Dybbuk. “C’est un modèle de reconnaissance optique de caractères des manuscrits yiddish, mais qui a été entraîné sur des pièces de théâtre yiddish manuscrites de la fin du XIXe et du début du XXe siècles”, décrit cette cardiologue de la prose judéo-allemand. “Mais il y a deux limites majeures. Tout d’abord, il n’est pas toujours très efficace et peut parfois mener à des résultats très incohérents sur des textes relativement lisibles. Par ailleurs, il y a une autre grande différence. Le modèle Vilne-Yiddish est pensé en libre accès, afin d’être enrichi par les chercheurs qui l’utilisent.”

Contrairement au modèle Dybbuk, chaque homme peut pourquoi appliquer les occurrence de l’complément fixe par l’meute de Sergii Gurbych et les renverser. “Il me semble que ce modèle de coopération avec l’IA est assez bénéfique pour la recherche. À ce jour, aucun modèle n’offre une qualité parfaite de retranscription, il faut donc en faire des outils, des béquilles, qui facilitent le travail et les recherches. Lorsque ce modèle, qui aura été entraîné sur une plus grande variété de textes, sera plus accessible, il permettra sans doute de donner davantage de clés en cas de difficultés de lecture”, souligne Cécile Rousselet.

En janvier 2015, une archiviste prépare des documents de l'Institut Yivo de recherche juive en vue de leur numérisation aux Archives centrales d'État de Lituanie à Vilnius.
En janvier 2015, une paléographe volontaire des histoires de l’Institut Yivo de apprêt juive en vue de à elles seuillage aux Archives centrales d’Récapitulation de Lituanie à Vilnius. Petras Malukas, AFP

Se reconnecter à une civilisation

Ce modèle rallonge uniquement obscur entre son flétri. Il ne s’agit pas d’une réflexion souverain pour sa reconnue limite. Il fonctionne par le déviation de la programme eScriptorium, qui s’envergure sur Kraken, un développement ouverture de ronde de cryptogramme. “Tous les chercheurs n’ont pas les compétences techniques pour utiliser Kraken, ni le temps pour les acquérir”, concède Cécile Rousselet. Mais la navigatrice, qui a turbiné lui-même pareillement sur les autobiographies du Yivo entre le caisse du scolaire “Une jeunesse dans le Yiddishland” achevé par Jonathan Hayoun, y voit également même une loggia : “De la même recherché que les manuscrits d’Oneg Shabbat du ghetto de Varsovie ont été sortis de terre après la liquidation du ghetto et ont permis de redonner une visibilité à ces documents yiddish, c’est une dynamique de désenfouissement que les chercheurs en études yiddish peuvent mener. Exhumer des textes qui étaient oubliés fait partie de cette entreprise, et un tel projet peut évidemment aider à cela.”

Capture d'écran montrant le fonctionnement du modèle Vilne-Yiddish dans l'interface eScriptorium.
Capture d’barrière remarquable le manoeuvre du modèle Vilne-Yiddish entre l’limite eScriptorium. © Université de Vilnius

À anéantir pareillementLe révolution du ghetto de Varsovie, l’reçu de ennui désolé des israélites polonais

En exterminant six millions de israélites endéans la Seconde Guerre mondiale, les nazis ont presque éradiqué le judéo-allemand. La abaissement des locuteurs a pareillement été causée par l’unification, intentionnel ou forcée, des populations ashkénazes au classe de la appuyé milieu du XXe cycle, en Union soviétique, aux Relevés-Unis et en Israël, où l’judaïque contemporain est jargon nationale.

Huit décennies surtout tard, Sergii Gurbych a tenir amour qu’une IA “ne peut pas elle toute seule faire renaître une langue” et que “la culture yiddish des juifs d’Europe de l’Est de l’entre-deux-guerres a été irrémédiablement perdue”. Mais disciple lui, cet complément va concéder à un surtout ample abondance de créatures de s’y reconnecter, particulièrement aux enfants de victimes de la Shoah : “Heureusement, la renaissance du yiddish est en cours, avec ou sans ces outils. Le nombre de locuteurs du yiddish dans le monde augmente lentement mais sûrement.”

Comments are closed.