Journée IA pour le développement logiciel et l’analyse des données biologiques – 2ème édition
Edition 2026, le 12 juin, sur le campus des Grands Moulins, 75013 Paris.
Exposés du matin
| Intervenant |
Titre |
Diaporama |
| Bertrand Cosson et Jacques van Helden |
Introduction à la journée |
pdf |
| Pierre Poulain |
Science ouverte, données et IA : automatiser l’annotation scientifique |
pdf |
| Guillaume Gautreau |
Hands-on workshop on genomic language models |
pdf |
| Romuald Marin |
VeromeCh\@t |
|
| Approches émergentes : API, IA agentique, écosystèmes de développement |
Baptiste Rousseau |
pdf |
| Thomas Denecker |
Démonstration en mode RetEx |
|
| Jacques van Helden, Bertand Cosson et Thomas Denecker |
Présentation des travaux pratiques de l’après-midi |
pdf |
Vidéos de la matinée: (à ajouter)
Organisation
Programme et inscription
Dépôt du code sur github
Retour d’expérience
Ateliers pratiques de l’après-midi
Phase 1 — Conceptualisation avec l’IA (≈ 45 min)
L’IA comme consultant : elle analyse le problème et propose une approche avant toute programmation.
Ce que vous demandez à l’IA :
- Soumettez la figure heatmap et la table de comptage
- Demandez-lui de proposer une approche d’analyse pour produire ce type de figure à partir de ces données
- Demandez-lui de produire un flowchart (organigramme) de la procédure proposée
- Demandez-lui de décomposer en étapes et de détailler pour chaque étape les paramètres importants et les choix possibles
- Discutez en groupe : les choix proposés vous semblent-ils biologiquement pertinents ?
Questions guides :
- Quelle normalisation est proposée, et pourquoi ?
- Comment les gènes sont-ils ordonnés ?
- Quels paramètres de visualisation sont suggérés ?
- Y a-t-il des alternatives proposées ? Lesquelles choisissez-vous et pourquoi ?
Notez les paramètres retenus
- ils constituent votre cahier des charges pour la Phase 2.
Phase 2 — Implémentation (≈ 60 min)
L’IA comme assistant programmeur : elle code ce que vous lui dictez, étape par étape.
- Validez collectivement le plan issu de la Phase 1 avant de demander le code
- Demandez le code étape par étape, en précisant à chaque fois :
- Le langage (R ou Python)
- Les paramètres retenus en Phase 1
- Vos exigences : documentation, gestion des erreurs
- Exécutez sur l’instance RStudio de la salle ou sur l’ordinateur de votre choix
- Itérez jusqu’à obtenir une figure satisfaisante
- Comparez visuellement votre figure à la cible
Conseil : ne demandez pas tout le code en un seul prompt — avancez étape par étape et validez chaque bloc avant de passer au suivant.
Phase 3a — Contrôle négatif (≈ 15 min)
Le pipeline détecte-t-il de la périodicité là où il n’y en a pas ?
- Téléchargez le fichier oscillating-genes_1705_normalized-profiles_row-wise-permuted.tsv
- Ouvrez-le et explorez son contenu
- Ce fichier contient les mêmes gènes et les mêmes valeurs d’expression que le fichier original, mais les 50 points temporels ont été permutés aléatoirement (seed = 42) — la périodicité temporelle est donc détruite
- Dans votre script, remplacez uniquement le nom du fichier d’entrée par le fichier permuté — ne modifiez rien d’autre
- Relancez le script et observez la figure produite
- Si la figure présente encore des patterns de périodicité → votre pipeline génère des illusions. Si elle est plate/aléatoire → il est robuste.
- Demandez à l’IA d’interpréter le résultat : que signifie biologiquement la présence ou l’absence de structure sur données permutées ?
Phase 3b — Qualité du code (≈ 15 min)
- Demander à une IA d’améliorer la qualité globale du code et garantir sa maintenabilité
Phase 4 — Révélation et comparaison (≈ 30 min)
L’article est distribué — l’IA compare votre approche avec celle des auteurs.
- Recevez l’article complet + matériel supplémentaire (Kelliher et al., PLoS Genet 2016)
- Soumettez-les à l’IA avec votre script et votre flowchart
- Demandez-lui de comparer les deux approches :
- Points communs entre votre procédure et celle de l’article
- Différences et leurs conséquences sur le résultat
- Avantages et limites de chaque approche
- Préparez 2-3 points clés à partager en mise en commun
Atelier 1 : Reproductibilité et FAIRisation
Atelier 2 : Développement logiciel pour la biologie
Contributions
Institutions
- Institut Français de Bioinformatique (IFB)
- Université Paris Cité (plateforme iPOP-UP et DU omiques)
- Réseau métier en bioinformatique (MERIT)
Comité scientifique et de programmation
Encadrants 2026
Autres contributions
Conception de l’atelier 2025 et préparation du jeu de données sur le cycle cellulaire de la levure.
Previous edition
| Edition |
Date |
Release |
DOI |
| 2026 |
12 June 2026 |
v2026.0 |
(to come) |
| 2025 |
11 June 2025 |
v2025.2 |
 |
| |
|
|
|
Licence


Funding
L’Institut Français de Bioinformatique (IFB) a été fondé par les Programme d’Investissements d’Avenir subventionné par l’Agence Nationale de la Recherche (RENABI-IFB, ANR-11-INBS-0013) et par le programme France 2030 relatifs aux équipements structurants pour la recherche / EQUIPEX+ (MUDIS4LS, ANR-21-ESRE-0048).
Maintained by Jacques van Helden 