Formation IFB science ouverte & PGD

Comment gérer des jeux de données haut-débit en sciences de la vie et de la santé

Présentation et application des principes FAIR de gestion des données dans un projet bioinformatique.

L’Institut Français de Bioinformatique (IFB) organise une formation à destination de bioinformaticiens, biologistes et médecins impliqués dans des projets d’analyse bioinformatique de jeux de données omiques et souhaitant mettre en œuvre les principes “FAIR” (Facile à trouver, Accessible, Interopérable, Réutilisable) tout au long du déroulement du projet. La formation abordera les différents points fondamentaux (théoriques, pratiques, juridiques) en lien avec la politique nationale d’ouverture des données de la recherche et présentera sous forme de séances pratiques les ressources nationales accessibles à la communauté scientifique ainsi que les solutions proposées par l’IFB pour gérer les données d’un projet de recherche.

Objectifs pédagogiques

A la fin de cette formation, les participants connaîtront et pourront mettre en œuvre les principes de la science ouverte pour gérer leurs jeux de données dans un projet :

Prérequis : nous demandons à chaque participant (formateur et apprenant)

1. De vous créer un compte personnel sur les outils listés dans le tableau ci-dessous pour vous permettre de les utiliser pendant la formation :

Outil Fonction Site Commentaire
Opidor Rédaction et partage de PGD https://dmp.opidor.fr Recommandations : (1) Le faire quelques jours avant le démarrage du cours : il se peut que la validation du compte ne soit pas immédiate et (2) Utiliser une « identification institutionnelle » plutôt qu’une identification par nom et mot de passe.
OSF Création d’un espace partagé pour gérer les documents /fichiers d’un projet https://osf.io/ Il est recommandé d’utiliser son ORCID si on en a un. Lors du renseignement du profil, bien veiller à choisir le lieu de stockage comme étant Frankfurt / Allemagne
ENA Ressource européenne pour l’archivage des données de séquences (nous travaillerons sur l’instance de test) https://wwwdev.ebi.ac.uk/ena/submit/webin/accountInfo A la fin de la procédure, vous devez recevoir un nom d’utilisateur du type ‘Webin-xxx’

2. D’installer docker

Docker est un outil de gestion de containers (utilisation comme solution de secours pour le TP de la session 3 métadonnées).

  1. Aller sur le site https://docs.docker.com/get-docker/
  2. A la fin de l’installation, pour vérifier que l’installation est correcte,
    • Lancer docker (comme indiqué dans la page d’installation) ;
    • Ouvrir un terminal ;
    • Lancer docker run hello-world. Si le retour est : Hello from Docker! C’est que l’installation est correcte ;
    • Dans ce cas : lancer la commande docker pull tdenecker/omicsbroker. Une fois le téléchargement terminé, vous êtes prêt pour le TP.

3. De choisir et déposer sur un espace partagé OSF une photo d’un lieu ou objet de votre choix que les autres participants devront deviner

  1. Nommer ce fichier avec votre nom
  2. Déposer le fichier sur le site https://osf.io/ : utiliser pour cela le lien confirmant l’ouverture de l’accès au projet et transférer la photo sur Formation IFB science ouverte & PGD

Modalités pratiques

5 modules de 3 heures en distanciel synchrone de 9h00 à 12h00. L’outil utilisé pour cette formation est Zoom. Il est important de vérifier avant les sessions que :

Des travaux ponctuels seront à effectuer entre les modules.

Formateurs

Hélène Chiapello Hélène Chiapello
thomasdenecker Thomas Denecker
dufayard Jean-François Dufayard
Paulette Lieby Paulette Lieby
Lionel Maurel Lionel Maurel
gsarah Gautier Sarah
julozi Julien Seiler
Frédéric de Lamotte Frédéric de Lamotte
jvanheld Jacques van Helden

Programme

Module Séquences Date Formateurs
Les données de la Recherche et leur centralité dans le processus de recherche
  1. Activité Brise Glace (cours)
  2. Crise de reproductibilité (cours)
  3. Vers FAIR (cours)
  4. Cycle de vie des données (cours)
  5. Le plan de gestion des données (cours)
  6. Opidor (autre)
15-03-2021 09:00
La vie des données pendant le projet : Principe et outils pour organiser, nommer, versionner, stocker, archiver, mes données
  1. Introduction (TP)
  2. Le nommage des fichiers (cours)
  3. Format de fichier (cours)
  4. Stockage et accès (cours)
  5. Outils et solution (cours)
16-03-2021 09:00
Les Métadonnées : les standards du domaine des données omiques en biologie et séances pratiques d’annotations de jeux de données
  1. Introduction aux métadonnées (cours)
  2. Life science standards and ENA submission (cours)
  3. Choix des métadonnées et soumission à l'EBI (TP)
17-03-2021 09:00
Partager et diffuser les données. Le cadre juridique, les entrepôts et les licences sur les données
  1. Cadre Juridique (cours)
  2. Les licences sur les données (cours)
18-03-2021 09:00
Le PGD : suite et fin.
  1. Fin du PGD (autre)
  2. Débrief de la formation (autre)
  3. Quizz (autre)
  4. Questionnaire (autre)
19-03-2021 09:00

Les mots clés de la formation

Ce nuage de mots a été construit automatiquement à partir du contenu de toutes les séquences.