Journée MaDICS-ReproVirtuFlow 2017
12 décembre 2017
Amphithéatre du bâtiment 21, Campus CNRS, Gif-sur-Yvette
Contexte
L’objectif de cette journée est de présenter les activités de l’action ReproVirtuFlow, fondée et soutenue par le GDR MaDICS, qui s’intéresse à la problématique de reproductibilité computationnelle.
Face aux masses de données disponibles, à la multitude d’outils existants et à la complexité des analyse de données scientifiques, reproduire une expérience in-silico est une tâche particulièrement difficile. ReProVirtuFlow vise à faire un état des lieux (besoins et solutions) et à expérimenter les approches existantes, tirant partie de retours d’expérience multiples pour tendre vers la définition de bonnes pratiques. Notre consortium regroupe des experts en Base de Données, Développement Logiciel et Environnements Virtuels, ayant une longue expérience dans l’analyse de données à grande échelle. Il comporte aussi des responsables et utilisateurs de plateformes produisant et exploitant des données de diverses natures.
Les activités que nous avons menées durant les deux premières années de cette action nous ont permis de comprendre le paysage de la reproductibilité computationnelle en particulier lorsque les traitements de données sont effectués à l’aide de systèmes de workflows scientifiques.
La journée du 12 décembre 2017 présentera l’état de l’art que nous avons effectué des différents éléments de solutions disponibles à la communauté bioinformatique pour tendre vers une meilleure reproductibilité des analyses de données bioinformatiques. Elle comportera des retours d’expériences d’utilisateurs d’outils aidant à la reproductibilité computationnelle. En particulier, nous présenterons les résultats que nous avons obtenus au premier ReproHackathon organisé par notre groupe dans lequel plusieurs équipes ont cherché à reproduire les résultats d’une publication scientifique (voir le site du premier ReproHackathon). Notre journée comportera enfin des présentations sur les approches émergentes dans le domaine de la reproductibilité.
Programme
-
9h30 : Café de Bienvenue
-
10h00 : Sarah Cohen-Boulakia : Présentation de l’Action et Bilan.
- 10h30 : Retour sur le ReproHackathon
- Frédéric Lemoine : Présentation du pipeline d’analyse et des données, tâches à effectuer par les participants et synthèse des résultats obtenus.
- Christophe Blanchet : Le Cloud de l’IFB comme support du ReproHackathon, et les environnements virtuels mis à disposition.
- Philippe Veber : Reproduction de l’analyse RNA-seq avec bistro, une bibliothèque OCaml pour le développement de pipelines bioinformatiques.
-
12h00 : Repas
- 13h30 : Approches émergentes
- Christophe Pradal : La reproductibilité des expériences en phénotypage haut-débit des plantes.
- Konrad Hinsen : La reproductibilité des calculs numériques en HPC : problèmes et solutions existantes.
- Alban Gaignard : Harmonisation de traces de provenance (ESWC workshop).
-
15h00 : Pause
- 15h30 : Discussion
- S. Cohen-Boulakia, C. Blanchet : présentation des futures actions du groupe, appel à participation.
- 16h30 : Clôture de la journée
Inscription
L’inscription est gratuite mais obligatoire et doit être effectuée avant le 8 décembre. Pour vous inscrire il convient de vous inscrire d’abord au GDR MaDICS (merci de suivre les instructions sur le site).
La journée ReproVirtuFlow 2017 est soutenue par le GDR MaDICS, par le groupe Psay CompBio de l’Université Paris-Saclay et par l’Institut Français de Bioinformatique.