réunion plénière 04/04/2003 p.1 e.dot - sous-projet 1 sous-projet 1 spécification d’un...
TRANSCRIPT
Réunion plénière 04/04/2003 p.1e.dot - Sous-projet 1
Sous-projet 1Spécification d’un entrepôt de données
pour la sécurité alimentaire
• La sécurité alimentaire
• L’existant
• Objectifs du sous-projet et réalisations
• Conclusion
Réunion plénière 04/04/2003 p.2e.dot - Sous-projet 1
L’analyse des risques• Création de l’OMC en 1994• Accords de Marrakech
– SPS agreement (mesures sanitaires et phytosanitaires)• commerce international de la nourriture, protection de la santé des humains• analyse des risques
• L ’analyse des risques nécessite des données de qualité – systèmes efficaces de collecte d’informations (n’existent pas)– données nécessaires : contaminations initiales de matières premières,
contaminations de produits finis, informations sur l’effet de facteurs, informations sur l’exposition du consommateur
• Le but est de pouvoir– réagir rapidement à une crise– prévenir une crise au lieu de simplement réagir
Réunion plénière 04/04/2003 p.3e.dot - Sous-projet 1
Les risques alimentaires
• Risques physico-chimiques– présence de métaux lourds (ou de dioxyne...) dans les
matières premières
• Risques microbiologiques– présence de bactéries pathogènes (ex. Listeria
monocytogenes)• dans les matières premières, les usines, le réfrigérateur du
consommateur
– facteurs qui influencent le comportement des bactéries• température, pH, aW (activité de l’eau)
Réunion plénière 04/04/2003 p.4e.dot - Sous-projet 1
Les bases de données existantes• En France
– bases sur les contaminations chimiques (DGCCRF) et les consommations (INSEE)
– bases microbiologiques• spécialisées (charcuterie/CTSCCV)• privées (viande/Bigard) • Dynacard (Danone, integré dans Sym’Previus)
• Dans le monde– bases européennes sur les contaminations (projets)– bases microbiologiques
• Grande-Bretagne (Combase) et Etats-Unis (PMP) : données de croissance sur des milieux de culture
• Nouvelle-Zélande, Australie et Danemark : dédiées à un type de produit (poisson...) ou une bactérie
Réunion plénière 04/04/2003 p.5e.dot - Sous-projet 1
Le projet Sym’Previus
• Début en novembre 99 / version 1 en 2004• Outil d’aide à l’expertise en hygiène et sécurité
alimentaire– pour les industriels de l’agro-alimentaire, les instituts
techniques, de recherche et les pouvoirs publics (DGAL)– originalité : résultats sur aliments
• Objectif : combiner– Base de données expérimentales sur aliment– Logiciel de simulation du développement des micro-
organismes
Réunion plénière 04/04/2003 p.6e.dot - Sous-projet 1
Les partenaires de Sym’Previus
ADRIAAERIALARILAITCTSCCVENV AlfortINRA/INAPGIP Lille
Laboratoires de recherche
et instituts techniques
BongrainDanoneFromarsac Pernod RicardFromageries BEL
ACTIAUNIR
Ministères RECHERCHEAGRICULTURE (DGAL)
Associationsprofessionnelles+
Pouvoirspublics+Industriels+
Consortium GIS
Réunion plénière 04/04/2003 p.7e.dot - Sous-projet 1
Les objectifs de Sym ’Previus• Constituer une base de connaissances qui contient
– des données bibliographiques validées et saisies par des experts
– des données expérimentales acquises dans le cadre du projet– des données industrielles (contamination initiales…)
• Créer des requêtes « consolidées », synthèses du comportement d’un micro-organisme
• Caler les modèles de simulation et confronter les résultats des simulations avec des données expérimentales
• Quel utilisateur : utilisation sous « contrôle » d’expert
Réunion plénière 04/04/2003 p.8e.dot - Sous-projet 1
Exemple de données de la base Sym’Previus
Evolution de Escherichia coli 0157:H7 sur matrice viande de boeuf
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
0 2 4 6 8 10
Temps (jours)
Po
pu
lati
on
(lo
g U
FC
/g)
4°C-Cabedo 1998- rep 1
4°C-Cabedo 1998- rep 2
4°C-Cabedo 1998- rep 3
4°C-Flores 1996- rep 1
4°C-Flores 1996- rep 2
4°C-Hathcox 1996
5°C-Abdul-Raouf 1993
8°C (Données ind)
12°C-Cabedo 1998- rep 1
12°C-Cabedo 1998- rep 2
12°C-Cabedo 1998- rep 3
12°C-Flores 1996- rep 1
12°C-Flores 1996- rep 2
12°C (Données ind)
15°C-Hathcox 1996
20°C-Flores 1996- rep 1
20°C-Flores 1996- rep 2
21°C-Abdul-Raouf 1993
21°C-Abdul-Raouf 1993 (3F) rep 1
21°C-Abdul-Raouf 1993 (3F) rep 2
30°C-Abdul-Raouf 1993
30°C-Abdul-Raouf 1993(3f) rep 1
30°C-Abdul-Raouf 1993(3f) rep 2
30°C-Abdul-Raouf 1993(3f) rep 3
30°C-Abdul-Raouf 1993(3f) rep 4
Réunion plénière 04/04/2003 p.9e.dot - Sous-projet 1
Caractéristiques de la base Sym’Previus
• 2 types d’information– niveaux de contamination d’aliments par des germes pathogènes
– impact de différents facteurs (température, process...) sur le comportement des germes (stabilité, croissance, décroissance)
• Sources– plus de 550 articles de la bibliographie internationale, sélectionnés par
des experts en microbiologie
– données industrielles anonymées
• Structure– schéma relationnel (environ 80 tables)
– complexité due à l’hétérogénéité des données • sources d ’information variées
• nombreuses requêtes des membres du groupe de travail qui a validé le schéma
Réunion plénière 04/04/2003 p.10e.dot - Sous-projet 1
Quelques caractéristiques des données
1) Données incomplètes
2) Données imprécises• [Zwietering 92] : On products with a low water activity, spore-forming microorganisms can be present (no growth)
• [Augustin 96] : Decimal reduction time of Listeria monocytogenes in skimmed milk at 63.3°C is between [25.8, 28.2] (in sec)
• [Rangasamy,1993] : Le niveau de contamination du lait cru par Bacillus cereus est inférieur à 10 CFU/ml
3) De nature très différentes ne « matchent » pas toujours avec la structure de la BDR
Réunion plénière 04/04/2003 p.11e.dot - Sous-projet 1
Stockage structuré en tables :Base de données relationnelle
Stockage faiblement structuré :Graphes conceptuels
Information correspondantà la structure de la BD
Information en margede la structure de la BD
Système d’interrogation unifiée : MIEL
Réunion plénière 04/04/2003 p.12e.dot - Sous-projet 1
• RequêteQ = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>}
• RéponseA = {<a1, v1>, …, <an, vn>}
Langage d’interrogation du MIEL
Réunion plénière 04/04/2003 p.13e.dot - Sous-projet 1
Données incomplètes et imprécises sous-ensembles flous
1) Interrogation élargie• par l’utilisateur : représentation de préférences pour
les critères de sélection• par le moteur d ’interrogation : relation de similarité
entre valeurs
Res(Whole egg, Egg + salt/sugar) = 0.33
2) Représentation de données imprécises
0
1
Egg yolk Whole egg
MyEggProductPreferences
0,5
Non-ordered discrete domain
60 64 65 70
0
1
Product Temperature
°C
Continuous domain
MIELDonnéesimprécises
Requêtefloue
Réunion plénière 04/04/2003 p.14e.dot - Sous-projet 1
Exemple de GC de la base
Réunion plénière 04/04/2003 p.15e.dot - Sous-projet 1
Base GC
Q = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>}
Génération de GC requêtes
A1 = {w1, …, wn} A2 = {x1, …, xn}A3 = {y1, …, yn}A4 = {z1, …, zn}
Projection
Interrogation de la base de GC
Réunion plénière 04/04/2003 p.16e.dot - Sous-projet 1
Objectifs du sous-projet 1
• Quelques questions auxquelles le sous-projet 1 doit répondre
– quels types de données utiles pour l’entrepôt trouve-t-on sur le Web ?– comment faire cohabiter données trouvées sur le Web et données déjà
stockées ?– quels traitement veut-on faire sur les données provenant du Web
(monitorage) ? Intégration explicite des données aux tables préexistantes ? Interrogation via un schéma global ?
– quelles connaissances relatives à la fiabilité des données ?
Réunion plénière 04/04/2003 p.17e.dot - Sous-projet 1
Objectifs du sous-projet 1
• Détail des réalisations– analyse des besoins
• détermination avec experts des manques prioritaires dans la base Sym’Previus• analyse du contenu d’autres bases• identification des éléments que l’on peut trouver sur le Web
– production• liste de spécifications• listes de mots-clés permettant de guider la recherche sur le Web
Réunion plénière 04/04/2003 p.18e.dot - Sous-projet 1
Réunion du 27 janvier 2003
• Présentation de l’existant– BD relationnelle– BK graphes conceptuels
• Ce que l’on peut trouver sur le Web– présentation de quelques sites intéressants
• Discussion sur la suite– caractériser les infos intéressantes, caractériser les sites ou pages
intéressants, réfléchir à l’extraction des informations intéressantes
• CR disponible sur le site e.dot
Réunion plénière 04/04/2003 p.19e.dot - Sous-projet 1
Réunion du 11 février 2003
présence de Benoît Leporq, IR INRA
• Point sur l’avancement du sous-projet 2• Informations que l’on aimerait ajouter dans l’entrepôt
– informations concernant le pH, l’aw et la teneur en acides gras des aliments
– informations extraites de sites bibliographiques
• Critères de choix ou de rejet d’une page– titre de revues, description du protocole expérimental, noms des
auteurs, noms des bactéries, mots-clés
• Critères de validité des infos– réputation de certains sites, présence de références
bibliographiques, redondance, confrontation
Réunion plénière 04/04/2003 p.20e.dot - Sous-projet 1
Documents produits
Liste d’auteurs(1107 noms)
Amaro-Lopez;M.Ammar;M.S.Ammendolia;M.G.Andersen;J.K.Anderson;J.G.
Hiérarchie de germes pathogènes(158 germes + 104 liens)
Lactobacillus>Lactobacillus plantarumListeria>Listeria innocuaListeria>Listeria monocytogenes
Hiérarchie de produits génériques(420 noms + traduction + 414 liens)
Fromage à pâte molle>CamembertPoisson fumé>Carpe fuméeFruits et légumes frais>Betterave
Liste de « synonymes »(604 synonymes)
Poulet: blanc et aile;blanc et aile de pouletFromage frais;Cottage cheeseFromage frais;Mozarella
Réunion plénière 04/04/2003 p.21e.dot - Sous-projet 1
Documents produits
Liste des produits
Liste des auteurs
Liste des germes
{"pH", "aw", "acide gras", "acides gras", "fatty acid"}
{cinétique, croissance, décroissance, survie, kinetic, growth, decrease, survival, inactivation}
Combinaisons recherchées
Réunion plénière 04/04/2003 p.22e.dot - Sous-projet 1
Conclusion
• Des documents permettant le crawling du Web ont été produits
• L’avis d’un expert français financé par l’INRA a pu être recueilli– afin de déterminer le type d’informations utiles pour l’entrepôt
• MAIS– la troisième réunion prévue le 2 avril a été annulée (impossibilité de financer
le déplacement et les honoraires d’un expert Hollandais)=> RETARD