Ce jeu de données propose des publicités illustrées parues dans des périodiques du XXe siècle (quotidiens, revues et magazines).
Ce jeu de données contient des pages corrigées ("vérité terrain") de documents numérisés de collections de presse traités avec une reconnaissance des articles (OLR, optical layout recognition
Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.
Ce jeu de données contient le texte des collections de presse traitées durant le projet européen Europeana Newpapers.
Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.
Ce jeu de données liste les imprimés de la collection numérique de Gallica proposant des tables et index transcrits.
Ce jeu de données est dédié à l'analyse des contenus iconographiques d’ouvrages anciens.
Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques de collections de presse traités avec de l'OCR (optical characters recognition).