Jean-Baptiste Pressac

Jean-Baptiste Pressac

Jean-Baptiste Pressac

Traitement et analyse de bases de données
Production et diffusion de corpus numériques
(ITA)
jean-baptiste.pressac AT univ-brest.fr
33 (0).298.016.895
  • Structuration, traitement et analyse des bases de données ou d’enquêtes.
  • Création et administration des dispositifs de diffusion et de traitement de l’information, notamment la bibliothèque numérique, le carnet Hypothèses de l'UMS et le site Web du CRBC.
  • Gestion des ressources documentaires du CRBC, notamment les données numériques de la recherche (documentation aux normes OAI-PMH).
  • Formation et diffusion des connaissances des traitements et des bases de données auprès des utilisateurs, des enseignants-chercheurs, des jeunes chercheurs et des partenaires scientifiques.
  • Formalisation et participation à la valorisation des résultats auprès de différents publics.
  • Correspondant communication de l'UMS (Animation du compte Twitter du CRBC / Création et organisation des Méridiennes du CRBC).
  • Membre du comité d'organisation du séminaire Les Outils du Quanti en Sciences Humaines et Sociales.
  • Membre du comité de pilotage du réseau métier Bases de données.

Bibliothèque numérique du CRBC

Conception et administration de la bibliothèque numérique du CRBC développé avec Omeka et hébergée par Huma-Num. Mise en place de la chaine de numérisation et de conservation des fonds. Moissonnage des fonds hébergés par les partenaires du CRBC. Valorisation des fonds auprès des partenaires du CRBC (moissonnage par le portail Bretania).

Le point de vue périphérique - Projet de recherche en littérature bretonne (depuis septembre 2012, avec Mannaig Thomas et Nelly Blanchard)

Pour le projet Le point de vue périphérique, mise en place d'une base de données prosopographique (PRELIB). La base contient des informations biographiques sur les acteurs de la littérature bretonne, leur production littéraire ainsi que leur participation à des lieux de sociabilité (associations, sociétés savantes, mouvements politiques et religieux, etc.). Les deux principales sources d'informations sont la thèse de Yves Le Berre et l'Anthologie de la littérature bretonne au XXe siècle de Francis Favereau.

La première phase du projet a consisté à trouver un framework logiciel pour la mise en place d'une interface de saisie avec gestion des authentifications. Après un premier essai avec CodeIgniter (basé sur PHP), le choix s'est porté sur le framework Django (basé sur Python).

Pour l'instant, les données collectées sont stockées dans une base de données mySQL. Cependant, le modèle relationnel s'avère trop rigide pour la saisie de données biographiques qui ont besoin d'être contextualisées (par exemple, on se marie avc quelqu'un à un certain endroit à une date donnée) et rattachées à la source de l'information. De plus, la réparttion des données dans des tables intermédiaires (notamment les données liées à la production littéraire) complexifie les requêtes.

D'autre part, certaines informations saisies sont déjà disponibles librement ou sont en passe de le devenir. C'est notamment le cas pour la production littéraire qui peut être extraite (de manière incomplète) du SPARQL endpoint de data.bnf.fr disponible depuis l'été 2014. Se pose donc la question de la réutilisation de ces données tierces soit pour les intégrer dans notre base soit pour les confronter ou les compléter avec nos propres données lors de leur analyse.

Dans un premier temps interessé par le modèle de données RDF et les frameworks de type "Linked Data" comme Callimachus, je m'interesse pour l'instant au projet Wikidata et à son modèle de déclaration de données factuelles permettant la saisie des sources et de qualifier les déclarations (voir par exemple la déclaration des employeurs du compositeur Jean-Sébastien Bach).

La base de données est hébergée par la TGIR Huma-Num. Les données qu'elle contient seront mises à disposition selon les principes de l'Open Data.

Numérisation du Barzaz Bro-Leon (2014-2018 avec Eva Guillorel)

Coordination de la numérisation, de la documentation et de la mise en ligne du fonds Barzaz Bro-Léon. Ce fonds privé, constitué en partie de réponses à un concours de chansons en breton du Léon a été entièrement numérisé et documenté au CRBC entre mai 2014 et juin 2018. Ce fonds a servit de modèle pour les procédures de numérisation et de mise en ligne sur la bibliothèque numérique du CRBC.

Base de données des bagnards de Brest (depuis septembre 2014 avec Philippe Jarnoux)

Le service historique de la défense conserve les registres du bagne de Brest, en activité de 1749 à 1858. Phlippe Jarnoux a entrepris au début des années 2000 de reporter les fiches des bagnards dans un fichier Excel. Ce fichier doit me permet de calculer les effectifs du bagne. J'utilise pour cela la librairie Python Pandas.

Les méridiennes du CRBC

Les méridiennes du CRBC sont des rencontres sur la pause méridienne pour favoriser les échanges entre les membres du CRBC (ITA, enseignants-chercheurs, doctorants) et les usagers de la bibliothèque de recherche (élèves et personnels de l'UBO, grand public). L'idée étant de présenter la recherche telle qu'elle se fait sur le terrain et parfois hors des sentiers battus. C'est aussi l'occasion pour les membres du CRBC de découvrir les projets et les multiples facettes de leurs collègues. Voir la page dédiée à l'événement.

  • 5 avril 2019, Nanterre - Atelier « Présentation d'Open Refine : nettoyer et enrichir ses données ». Ateliers méthodologiques de l'Institut des Sciences sociales du Politique (consulter le tutoriel)
  • 6 novembre 2018, Sète - Atelier OpenRefine avec Chloé Martin lors de l'action nationale de formation « Sciences des données : un nouveau challenge pour les métiers liés aux bases de données » (télécharger la présentation)