FAIR bioinfo

Comment rendre un projet bioinformatique plus reproductible

Description

L’Institut Français de Bioinformatique (IFB) organise en partenariat avec l’Institut de Biologie Intégrative de la Cellule (I2BC) une formation à destination des bioinformaticiens et biostatisticiens souhaitant mettre en oeuvre les principes “FAIR” (Facile à trouver, Accessible, Interopérable, Réutilisable) dans leurs projets d’analyse et de développement. Les concepts FAIR, initialement définis dans le contexte d’ouverture des données de la recherche, seront ici adaptés pour cadrer avec un projet type de développement et/ou analyse bioinformatique/biostatistique. Ainsi, la formation n’abordera pas les aspects “FAIR” spécifiques aux données mais introduira plusieurs outils permettant d’améliorer la reproductibilité des analyses.

Objectifs pédagogiques

A la fin de cette formation, les participants pourront mettre en oeuvre les principes de la science reproductible : encapsuler un environnement de travail, concevoir et exécuter des workflows, gérer des versions de code, passer à l’échelle sur un cluster de calcul, gérer des environnements logiciels et assurer la traçabilité de leur analyse à l’aide de Notebooks.

La formation organisée en deux temps

La formartion s’organise en deux temps :

Prérequis

Linux, programmation shell, notions de R et Python

Tarifs

Académique : 120 € pour 2 jours et 180 € pour 3 jours Non-académique : 600 € pour 2 jours ou 900 € pour 3 jours

Important

Le nombre de participants est limité à 15 personnes maximum . Il est possible d’assister uniquement aux deux premiers jours de la formation, merci de nous indiquer cette information dans le formulaire d’inscription.

Vous devrez vous munir de votre ordinateur portable avec installation préalable de docker pour pouvoir participer à la formation

Organisateurs

Programme et slides

Jour 1

Créneaux Titre Intervenants Slides
9h30 - 10h00 Accueil café
10h00 - 10h30 Tour de table, présentation de la formation. Hélène Chiapello & Jacques van Helden Lien
10h30-11h30 Introduction à la reproductibilité Claire Toffano-Nioche Lien
11h30-12h00 Encapsulation (docker) Céline Hernandez Lien
12h00-12h30 TP1 Céline Hernandez & Thomas Denecker Lien
12h30-13h00 TP2 Céline Hernandez & Thomas Denecker Lien
Fichier BAM
Fichier SAM
13h00-14h00 Repas
14h00-14h30 Workflows (snakemake) Claire Toffano-Nioche Lien
Ficher yml
14h30-15h00 TP1 Claire Toffano-Nioche & Thomas Denecker Lien
15h00-15h30 TP2 Claire Toffano-Nioche & Thomas Denecker Lien
Tous les scripts yml
15h30-16h00 Pause
16h00-16h30 Présentation de l’infrastructure IFB (cluster/slurm) Julien Seiler & Gildas Le Corguillé Lien
16h30-17h00 TP1 - Snakemake over Slurm Julien Seiler & Gildas Le Corguillé Lien
17h00-17h30 TP2 - Docker 2 Singularity Julien Seiler & Gildas Le Corguillé Lien

Jour 2

Créneaux Titre Intervenants Slides
09h00-09h30 Gestion de l’historique Claire Toffano-Nioche Lien
09h30-10h00 TP1 Claire Toffano-Nioche & Thomas Denecker Lien
10h00-10h30 TP2 Claire Toffano-Nioche & Thomas Denecker Lien
10h30-11h00 Pause
11h00-11h30 TP3 Claire Toffano-Nioche & Thomas Denecker Lien
11h30-12h00 Gestion des environnements logiciels Claire Toffano-Nioche Lien
12h00-12h30 TP1 Claire Toffano-Nioche & Thomas Denecker Lien
12h30-14h00 Repas
14h00-14h30 Traçabilité avec les Notebooks Céline Hernandez Lien
14h30-15h30 TP Markdown Céline Hernandez & Thomas Denecker Lien
15h30-16h00 Pause
16h00-17h00 Partage et diffusion Thomas Denecker & Céline Hernandez Lien
17h00-17h30 Conclusion Thomas Denecker & Céline Hernandez Lien

Jour 3

Créneaux Titre
09h00-10h00 Bilan des évaluations des participants et discussions sur les points d'amélioration.
10h00-12h00 Travail sur le matériel de cours (diapos, exercices)
12h00-13h00 Pause déjeuner
13h00-15h00 Travail sur le matériel de cours (diapos, exercices)
15h00-16h00 Restitution et conclusion

L'ensemble des slides est disponibles au format .tex sur ici.

Informations pratiques

La formation aura lieu du lundi 31 août 2020 - 10:00 (accueil café à 9:30) au mercredi 2 septembre 2020 - 16:00

Les déjeuners et pauses des 3 jours sont pris en charge par l’IFB. Les frais de déplacement et logement sont à la charge des participants.

Suggestion d’hôtels

Localisation

Institut des Systèmes Complexes
113 rue Nationale 75013
Paris

Métros : Olympiades (L14) ou Nationale (L6)

Station Vélib : place Nationale.

Inscription

Les inscriptions ont lieux sur le site suivant : ici