Plans d'expérience - 23 et 24 octobre 2006 - INRA MIA Jouy-en-Josas

Plans d'expérience - 23 et 24 octobre 2006 - INRA MIA Jouy-en-Josas hrichard
Lundi 23 octobre

11h-13h Informations sur le réseau depuis juin

  • point sur l'ordre du jour
  • infos générales sur la vie du réseau: projet page d'accueil, groupe
  • de travail "Structuration des données"
  • autres infos à partager (stages, thèses, autres réseaux, etc.)

12h45-14h15 Repas

14h15-18h00 Session Plans d'expériences (Les collègues de MIA Jouy sont invités à assister aux exposés).

  • 14h15 Stéphanie Mahévas : Plans d'expériences pour l'analyse de sensibilité applications à l'IFREMER
  • 14h55 André Kobilinsky : Introduction aux plans d'expériences factoriels fractionnaires
  • 15h35 Hervé Monod : Plans d'expériences et d'échantillonnage pour l'analyse de sensibilité*16h15 Pause
  • 16h40 Frédéric Amblard : Algorithme pour l'exploration séquentielle de l'espace des paramètres
  • 17h20 Claude Bruchou : Echantillonnage pour l'analyse de sensibilité globale
Mardi 24 octobre
  • 8h30-9h45 Retour sur la session Plans d'expériences : suites à donner
  • 9h45-10h15 Pause
  • 10h15-11h45 Vie du réseau
    • relations avec d'autres réseaux
    • projet d'école-chercheur et autres animations vers l'extérieur du groupe
  • 11h45-13h Repas
  • 13h--14h30 Vie du réseau (suite)
    • décisions pour la suite (prochaine réunion, groupes de travail,, etc.)
le compte rendu
Participants
  • Isabelle Alvarez Cemagref-LISC Clermont-Fermand
  • Frédéric Amblard Université Toulouse I
  • Franck Aries INRA, MIA Avignon
  • Claude Bruchou INRA, MIA Avignon
  • Guillaume Déffuant Cemagref-LISC Clermont-Ferrand
  • Raphaël Duboz IRD – Séte
  • Nicolas Dumoulin Cemagref-LISC Clermond-Ferrand
  • Gaël Dur Université des Sciences et Technologies de Lille
  • Robert Faivre INRA, MIA Toulouse
  • Thierry Faure Cemagref-LISC Clermond-Ferrand
  • Vincent Ginot, INRA MIA Avignon
  • Stéphanie Mahevas IFREMER Nantes
  • David Makowski INRA E&A, Grignon et MIA Jouy
  • Hervé Monod INRA, MIA Jouy
  • Éric Ramat Université du Littoral Lille
  • Hervé Richard INRA, MIA Avignon
  • Jean-Christophe Soulié Université du Littoral Lille

Lundi 23 octobre

Préambule

11h30 rapide tour de table pour présentation des participants

Informations Générales
  • exploration du paquet RXML

(format d'échange de données ; Hervé R.): package intéressant mais nécessite un peu de connaissance sur la programmation de R. Des tests sont en cours pour lire des gros volumes de données issues de simulations et formatés avec une grammaire XML. Il s'agit de voir comment se manipulent les grosses quantités de données.

    • Remarque d'Eric et de Raphaël : il faut absolument avancer sur ce thème => Construire un groupe de travail sur la structuration des données.
    • Thierry propose de voir « Trac », un outil de gestion de projet (mini G-Forge)
  • le Site web
    • Offrir rapidement un minimum
    • Il nous faut rapidement une visibilité du réseau
  • Le point sur le GIS "systèmes complexes" en cours de montage (Vincent)

GIS pour l'instant INRA/INSERM/CNRS mais auquel les autres EPST pourraient participer. On en est à la mise en place d'une feuille de route. Pour cela, les chercheurs de tous horizons sont librement invités à proposer des champs thématiques, des projets, ou des grands défis. Nous avons proposé la thématique computer experiments et inscrit le réseau dans la liste des projets en cours. La prochaine étape sera Les entretiens de Cargèse du 20 au 25 novembre où seront débattus les grands thèmes proposés. Nous serons en principe représentés par Robert, Guillaume et Vincent. Il est d'ors et déjà possible d'ouvrir les débats sur les forum associés à ces grands champs. http://complexsystems.lri.fr/RNSC/tiki-index.php?page=Cargese

Nom du réseau
  • RENMAN Réseau Expérimentation Numérique des Modèles pour leur Analyse et leur Nutilisation (suggestionRF)
  • ENAURM Expérimentation Numérique pour l'Analyse et l'Utilisation Raisonnée des Modèles (RF).
  • OSIRIX Outils Statistiques et Informatiques pour l'exploRatIon des modèles compleXes (DM).
  • PLAISIR
  • REX
  • RELOOC Reseau expLoration mOdèles ...
  • REMARC
  • AMI
  • REMIX
  • MENM Méthodes d'exploration numériques des modèles
  • AXIOM Analyse et exploration numérique des modèles complexes
  • MEXICO Méthode pour l'EXploration Informatique des modèles COmplexes
  • ENAMO Exploration numérique et analyse des modèles
Mots clès

exploration réseau numérique plan d'expérience modèles indicateur analyse méthode

le nom du réseau In Fine
après une nouvelle discussion et vote le mardi AM le nom de MEXICO est retenu ! Il présente 
 cependant l'inconvénient de ne pas contenir le mot modèle. On pourrait imaginer le tordre en 
 MEXmICO par exemple, mais on s'éloigne de la sonorité originale.
 Il faut maintenant trouver un logo !
Exposés de l'après-midi

Cf programme. Sauf contre-indication de l'orateur, les transparents seront en principe stockés sur le site, et accessibles aux membres du réseau (à faire).



Fin de la première journée



Mardi 24 octobre

Les plans d'expérience: la suite à donner

L'idée est toujours d'identifier les verrous méthodologiques et d'aller vers de l'opérationnel.

Aspects méthodos
  • Remarque de Guillaume : Il y a différentes utilisations des plans d'expérience. Il ne faut pas les dissocier de leurs objectifs (robustesse par rapport au modèle, robustesse par rapport aux objectifs). ==> le réseau peut (doit ?) proposer des indications par rapport à cette démarche.

Continuer de faire le point sur ce qui existe et sur les tests réalisés pour connaître l'état de l'art.

  • Robert : Faire un article synthétique = matière très vendable.
  • David : oui, mais trouver un axe original (revue logicielle par ex. ?) car il y a déjà beaucoup de choses faites.
  • Stéphanie : utilisation sur des cas concrets pour balayer plusieurs modèles et pouvoir proposer des démarches dans une synthèse.
  • David : regarder les numéros spéciaux de Sensibility Analisys of Models Output (RESS) pour voir ce qui existe ou pas.
  • Stéphanie : propose un thème style « la sensibilité à quoi cela sert ? ».

Idée soutenue par David qui a ce pb également dans les modèles agronomiques. Pb de seuil d'identifiablité qu'on ne détecte pas, pb du multivariable et sur quelles décisions pratiques cela débouche ? il y a un trou méthodo bloquant ...

  • Hervé M : D'accord pour commencer à échanger mais réticent sur la rédaction d'une revue (trop de boulot). Réunir la matière dans un premier temps. Faire un bilan des modèles.

==> nécessite de le préparer : Stéphanie prend en charge cet aspect

Conclusion méthodo  le groupe est d'accord pour continuer à creuser la biblio ainsi que la pratique 
 et aller à terme vers un article de synthèse. Stéphanie se charge de nous stimuler 
 sur ce thème (vers un groupe de travail Synthèse Biblio / outils.

Autre Q à instruire (Stéphanie) : selon les cas on peut faire ou non de nombreuses simulations. Si on est limité, comment fait-on, faut-il passer par un méta-modèle empirique ? Un thème donc à explorer : le méta-modèle ou émulateur de modèle. Pose au passage le pb de la calibration des modèles (autre défi)… Remarque de Robert : Faire un fond commun documentaire (citer les ressources)

Aspects opérationnels
  • Guillaume fait le point sur le développement de SimExplorer. Financement de 100 K€ pour sous-traiter le dev et lancer un post-doc sur le codage des Plan d'exp. Projet sur un an, qui sera suivi par un projet européen en bonne position actuellement.
  • Thierry propose de mettre en place une bibliothèque de plan d'exp et de modèle pour baliser les différents cas. L'idée est que les modules de plans soient indépendants, et puissent être utilisés par toutes les plates-formes de simulation qui le souhaitent, à commencer bien sûr par celles développées par les membres du réseau. Problème du langage de la plateforme. Pour la stat il vaut mieux utiliser R quand c'est possible.

Ce qui impliquerait un format d'échange. Dans SimExplorer, l'idée est de ne pas figer de syntaxe mais d'avoir des wrappers selon les besoins d'imports.

  • Éric : toute la chaîne existe dans VLE mais il faut une structuration XML, c'est-à-dire qu'on se donne un format (échéance d'un mois)

Visiblement deux approches : SimExplorer veut pouvoir recevoir tout les formats via un wrapper. VLE utilise un descriptif spécifique.

  • Thierry rappelle que l'important est moins le choix du support, que l'information sur la donnée (la méta-donnée). Concernant les méta-données voir EML (Ecological Modling Language) par ex.

Info (de Robert ?) : le module "CEA" d'analyses d'incertitudes sous R serait visiblement sorti. Il faudra voir ce qu'il a dans le ventre…

Conclusion opérationnelle décision de créer un groupe de Travail Format d'échange / méta-données
 avec Avignon (Hervé, Vincent), Calais (Jean-Christophe, Eric), Clermont (Thierry Nicolas)
 + un représentant de chez Stéphanie (Penjamin poussin Privé).
 Objectifs faire des propositions d'ici fin Novembre ; démarrer par les formats d'échanges 
 pour les plans d'expériences, à priori plus simples que les formats de sorties de simulations.
==> Première réunion le 17 novembre à l'INRA Paris (animation HR).

Opportunité de créer un groupe de travail spécifique sur la programmation des modules de plans
d'expérience ? (ce qui est plus large que juste la question des formats).

Les stages, le travail du réseau (à faire, en cours ou rêvé)
Éric et Jean-Christophe
  • 6 étudiants sur une approche service Web
  • outils aVLE, 4 étudiants qui bossent sur le dev (interface + R)
  • 2 étudiants intégration Grass (SIG domaine publique)
  • Commencer à intégrer les plans d'expérience dans VLE
  • Aspect « optimisation » (intégration de l'algo PBIL)
    • Remarque 1 : vous pouvez soumettre des propositions aux étudiants de Master Pro II. Ils disposent de 16 semaines en M1, 20 en M2. Début au 1er avril.
    • Remarque 2 : Gauthier est à la recherche d'un Post-doc
HervéR
  • poursuivre Format de donnée
  • ouverture du site web (ou :et wiki ou CMS)
David

3 projets en analyse de sensibilité

  • Thésard grignon. Filtrage d'un modèle de culture dynamique. Corriger les variables de modélisation en cours de culture. Thèse d'appli des méthodes stat. fin mi 2007.
  • Projet ANR PICSEL (appel d'offre jeune chercheur). Prise en Compte de l'incertitude dans la problématique de la sélection de modèles.
  • Thèse qui démarre (MIA/EA) en analyse de sensibilité pour des données spatio-temporelles. Lien avec la problématique de la calibration.
Gaël Dur

Cas d'application : thèse en cours sur la modélisation du comportement du copépode

Raphael Duboz

travail en cours d'un modèle de peuplement dans un estuaire, ainsi que sur l'albatros ?

  • Travail en cours de calibration par filtration Kalman (recrutement de Blaise Faugéras).
  • Cherche stagiaire (post-doc ?) pour construire des plans d'expérience.
Guillaume, Thierry et Nicolas
  • Ont un poste CR ouvert début 2007 : modélisation / émulation de modèles
  • Recherchent un Post doc profil exploration des modèles.
  • Ont des sous pour de la sous-traitance sur ce thème
  • Devraient beaucoup avancer sur le thème Sim-Explorer cette année !
  • 3 thèses en principe en 2007. Théorie de la viabilité (via les Supports Vecteurs Machine) avec IRD, modèle économique d'exploitation forestière à Madagascar.
Isabelle

propose un stage « Catégoriser des trajectoires »

Vincent
  • Stage M2 proposé sur l'utilisation d'un méta-modèle géostatistique (émulation) dans une optique de calibration.
  • En cours de négociation, accueil d'un CR (Olivier Martin) pour en principe au moins un an. Thème de recherche : comment traiter des sorties vectorielles (distributions) par une approche fonctionnelle ? Catégorisation, comparaisons.
  • Projet de thèse avec le département Santé Animale sur les épidémies de fièvre "Q" dans les élevages bovins. Questions d'AS et d'analyses d'incertitude mais également de choix de modèle dans le "continuum" IBM, markovien, matriciel, EDO.
  • Projet de thèse avec le département Santé Animale sur les épidémies de fièvre "Q" dans les élevages bovins. Questions d'AS et d'analyses d'incertitude mais également de choix de modèle dans le "continuum" IBM, markovien, matriciel, EDO.
  • Stages : module d'édition WISIWIG d'expressions mathématiques pour utilisation dans un environnement de construction de modèles (Mobidyc). Une version Java existe mais serait à améliorer. Une version Smalltalk est souhaitée.
Stéphanie
  • Stage 1 : faire de l'AS et du diagnostique pour une pêcherie pélagique sous ISIS-Fish
  • Stage 2 : calibration : estimer les paramètres d'accessibilité du poisson à différentes échelles spatiales et temporelles. Ont démarré par une approche simplex. Difficulté : coûts des simulations. A des sous, cherche de bons candidats.
  • projet thèse fin 2007 : Analyse sensibilité, exploration de l'espace de paramètres dans ISIS-Fish. Recherche co-tutelle statistique / méthodologie
Claude
Franck

Poursuite de ses travaux sur la géométrie algorithmique, en passant à des modèles comprenant 5 facteurs.

Robert
  • Biblio sur l'émulation de modèles (en particulier, travaux de O'Hagan)
  • Travailler sur les liaisons multidimensionnelles entre paramètres et sorties
Hervé M
  • En cours : Thèse AS pour des modèles flux de gènes dans les parcellaires (question du chgmt d'échelle)
  • Creuser les méthodes de construction de plans hybrides
Fred
  • Analyse de sensibilité sur modèle sur réseau
  • Cherche stagiaire pour poursuivre le travail sur les algo d'exploration de l'espace des paramètres par segmentation de l'espace.
Agenda

Prochaine réunion Fev 2007 à Toulouse autour du thème informatique / Opimisation / Contrôle optimal / Calibration

Actions de promotion

(à l'odj de la prochaine réunion)

  • École chercheurs ou formations
  • journées thématiques

propositions du CEMAGREF de se "greffer" sur leurs journées modélisations

Conclusions

La formule de fonctionnement choisie - 3 grosses ½ journées sur 2 jours, avec exposés autour d'une thématique - avec si possible implication des collègues du lieu d'accueil, puis discussions plus opérationnelles a été appréciée. Elle sera reprise Toulouse et a Clermont. Démarrage de Groupes de travail :

  • formats des données avec Thierry Faure,Nicolas Dumoulin, Benjamin Poussin (via Stéphanie), Éric Ramat, Jean-Christophe Soulié, Vincent Ginot Hervé Richard (animateur) 1er RV le 17 novembre.
  • Stéphanie nous stimule sur le thème de l'AS