Science ouverte et principes FAIR dans un projet de bioinformatique

Comment rendre un projet bioinformatique plus reproductible

Description

L’Institut Français de Bioinformatique (IFB) organise en partenariat avec l’Institut de Biologie Intégrative de la Cellule (I2BC) une formation à destination des bioinformaticiens et biostatisticiens souhaitant mettre en oeuvre les principes “FAIR” (Facile à trouver, Accessible, Interopérable, Réutilisable) dans leurs projets d’analyse et de développement. Les concepts FAIR, initialement définis dans le contexte d’ouverture des données de la recherche, seront ici adaptés pour cadrer avec un projet type de développement et/ou analyse bioinformatique/biostatistique. Ainsi, la formation n’abordera pas les aspects “FAIR” spécifiques aux données mais introduira plusieurs outils permettant d’améliorer la reproductibilité des analyses.

Objectifs pédagogiques

A la fin de cette formation, les participants pourront mettre en oeuvre les principes de la science reproductible : encapsuler un environnement de travail, concevoir et exécuter des workflows, gérer des versions de code, passer à l’échelle sur un cluster de calcul, gérer des environnements logiciels et assurer la traçabilité de leur analyse à l’aide de Notebooks.

La formation organisée en deux temps

La formartion s’organise en deux temps :

Prérequis

Linux, programmation shell, notions de R et Python

Tarifs

Important

Le nombre de participants est limité à 15 personnes maximum . Il est possible d’assister uniquement aux deux premiers jours de la formation, merci de nous indiquer cette information dans le formulaire d’inscription.

Vous devrez vous munir de votre ordinateur portable avec installation préalable de docker pour pouvoir participer à la formation

Organisateurs

Inscription

Les inscriptions sont limitées à 15 participants. Pour vous inscrire, veuillez remplir le formulaire suivant avec le 21 mai 2021 : formulaire

Programme et slides

Jour 1

Créneaux Titre Intervenants Slides
9h30 - 10h00 Accueil café
10h00 - 10h30 Présentation de la formation. Hélène Chiapello & Jacques van Helden
10h30-11h30 Introduction à la reproductibilité Claire Toffano-Nioche
11h30-12h00 Sauvegarde du code (git, GitHub) Claire Toffano-Nioche
12h00-13h00 TP1.1 - Git Claire Toffano-Nioche & Thomas Denecker
13h00-14h00 Repas
14h00-14h30 TP1.2 - GitHub Céline Hernandez & Thomas Denecker
14h30-15h30 Contrôler son environnement de développement (Docker + Conda) Céline Hernandez & Claire Toffano-Nioche
15h30-16h00 TP2 - Conda Claire Toffano-Nioche & Thomas Denecker
16h00-16h30 Pause
16h30-17h00 TP3.1 - Usage d'une image Docker Céline Hernandez & Claire Toffano-Nioche & Thomas Denecker
17h00-17h30 TP3.2 - Adapter son image Céline Hernandez & Claire Toffano-Nioche & Thomas Denecker
17h30-18h00 TP3.3 - Exporter son image Céline Hernandez & Claire Toffano-Nioche & Thomas Denecker

Jour 2

Créneaux Titre Intervenants Slides
09h00-09h30 Gestion de pipelines (snakemake) Claire Toffano-Nioche
09h30-10h30 TP 4 - Ecriture d’un workflow Snakemake Claire Toffano-Nioche & Thomas Denecker
10h30-11h00 Pause
11h00-11h30 Les usages sur un cluster HPC (IFB Core Cluster) : Conda, Singularit Gildas Le Corguillé & Julien Seiler
11h30-12h30 TP 5 - Déploiement d’un workflow sur l’IFB Core Cluster Gildas Le Corguillé & Julien Seiler
12h30-13h30 Repas
13h30-14h30 Traçabilité et partage (notebook) Céline Hernandez
14h30-15h30 TP 6 - Markdown Céline Hernandez & Thomas Denecker
15h30-16h00 Pause
16h00-17h00 Exposer son projet Thomas Denecker & Céline Hernandez
17h00-17h30 Conclusion Thomas Denecker & Céline Hernandez

Jour 3

Créneaux Titre
09h00-10h00 Bilan des évaluations des participants et discussions sur les points d'amélioration.
10h00-12h00 Travail sur le matériel de cours (diapos, exercices)
12h00-13h00 Pause déjeuner
13h00-15h00 Travail sur le matériel de cours (diapos, exercices)
15h00-16h00 Restitution et conclusion

Informations pratiques

La formation aura lieu du lundi 28 juin 2021 - 10:00 (accueil café à 9:30) au mercredi 30 juin 2021 - 16:00

Les déjeuners et pauses des 3 jours sont pris en charge par l’IFB. Les frais de déplacement et logement sont à la charge des participants.

Suggestion d’hôtels

Localisation

Institut des Systèmes Complexes
113 rue Nationale 75013
Paris

Métros : Olympiades (L14) ou Nationale (L6)

Station Vélib : place Nationale.