Analyse automatique de documents patrimoniaux
par intelligence artificielle
Pipeline hybride combinant un traitement modulaire de pointe et un modèle de vision-langage de 72 milliards de paramètres, adossé à une base de connaissances muséale de 454 000+ œuvres et 40 000+ codes de classification iconographique.
Chaque document traverse deux chemins d'analyse complémentaires. Leurs résultats sont confrontés pour garantir la fiabilité.
Des modèles d'IA spécialisés se relaient, chacun expert dans sa tâche. Cette approche offre une granularité fine et des métadonnées riches.
Simultanément, un modèle de vision-langage de 72 milliards de paramètres regarde la page entière et la comprend comme le ferait un être humain.
Les deux lectures sont comparées. Quand elles concordent, la confiance est maximale. Quand elles divergent, le document est signalé pour vérification humaine. Cette approche duale est unique — aucune autre solution ne combine la précision d'un pipeline spécialisé avec la compréhension d'un modèle de vision-langage de cette envergure.
Lisa s'appuie sur une base de connaissances construite à partir des données ouvertes des plus grands musées et du système de classification iconographique international.
Enrichissement automatique de catalogues, identification d'oeuvres, recherche par similarite visuelle dans les collections.
Transcription de registres paroissiaux, d'actes notaries et de correspondances. Indexation semantique de fonds entiers.
Transcription automatisee de manuscrits anciens par OCR avance, enrichissement de metadonnees, recherche plein texte sur les fonds numerises.
Humanites numeriques, etudes iconographiques computationnelles, analyse de corpus a grande echelle.
Accédez à la plateforme pour naviguer 454 000+ œuvres, identifier des documents et explorer la classification Iconclass.