AI for bioscripting

A hands-on exercise to explore the use of generative AI for writing scripts to analyze biological datasets.

View the Project on GitHub IFB-ElixirFr/AI-bioscripting-workshop

iPOP-up Université Paris-Cité IFB ELIXIR-FR MERIT

Journée IA pour le développement logiciel et l’analyse des données biologiques – 2ème édition

Edition 2026, le 12 juin, sur le campus des Grands Moulins, 75013 Paris.

Exposés du matin

Intervenant Titre Diaporama
Bertrand Cosson et Jacques van Helden Introduction à la journée pdf
Pierre Poulain Science ouverte, données et IA : automatiser l’annotation scientifique pdf
Guillaume Gautreau Hands-on workshop on genomic language models pdf
Romuald Marin VeromeCh\@t  
Approches émergentes : API, IA agentique, écosystèmes de développement Baptiste Rousseau pdf
Thomas Denecker Démonstration en mode RetEx  
Jacques van Helden, Bertand Cosson et Thomas Denecker Présentation des travaux pratiques de l’après-midi pdf

Vidéos de la matinée: (à ajouter)

Organisation

Programme et inscription

Dépôt du code sur github

Retour d’expérience

Ateliers pratiques de l’après-midi

Phase 1 — Conceptualisation avec l’IA (≈ 45 min)

L’IA comme consultant : elle analyse le problème et propose une approche avant toute programmation.

Ce que vous demandez à l’IA :

Questions guides :

Notez les paramètres retenus

Phase 2 — Implémentation (≈ 60 min)

L’IA comme assistant programmeur : elle code ce que vous lui dictez, étape par étape.

  1. Validez collectivement le plan issu de la Phase 1 avant de demander le code
  2. Demandez le code étape par étape, en précisant à chaque fois :
    • Le langage (R ou Python)
    • Les paramètres retenus en Phase 1
    • Vos exigences : documentation, gestion des erreurs
  3. Exécutez sur l’instance RStudio de la salle ou sur l’ordinateur de votre choix
  4. Itérez jusqu’à obtenir une figure satisfaisante
  5. Comparez visuellement votre figure à la cible

Conseil : ne demandez pas tout le code en un seul prompt — avancez étape par étape et validez chaque bloc avant de passer au suivant.

Phase 3a — Contrôle négatif (≈ 15 min)

Le pipeline détecte-t-il de la périodicité là où il n’y en a pas ?

Phase 3b — Qualité du code (≈ 15 min)

Phase 4 — Révélation et comparaison (≈ 30 min)

L’article est distribué — l’IA compare votre approche avec celle des auteurs.

  1. Recevez l’article complet + matériel supplémentaire (Kelliher et al., PLoS Genet 2016)
  2. Soumettez-les à l’IA avec votre script et votre flowchart
  3. Demandez-lui de comparer les deux approches :
    • Points communs entre votre procédure et celle de l’article
    • Différences et leurs conséquences sur le résultat
    • Avantages et limites de chaque approche
  4. Préparez 2-3 points clés à partager en mise en commun

Atelier 1 : Reproductibilité et FAIRisation

Atelier 2 : Développement logiciel pour la biologie


Contributions

Institutions

Comité scientifique et de programmation

Encadrants 2026

Autres contributions

Conception de l’atelier 2025 et préparation du jeu de données sur le cycle cellulaire de la levure.


Previous edition

Edition Date Release DOI
2026 12 June 2026 v2026.0 (to come)
2025 11 June 2025 v2025.2 DOI
       

Licence

CC BY-SA 4.0

CC BY-SA 4.0

Funding

L’Institut Français de Bioinformatique (IFB) a été fondé par les Programme d’Investissements d’Avenir subventionné par l’Agence Nationale de la Recherche (RENABI-IFB, ANR-11-INBS-0013) et par le programme France 2030 relatifs aux équipements structurants pour la recherche / EQUIPEX+ (MUDIS4LS, ANR-21-ESRE-0048).


Maintained by Jacques van Helden ORCID