statistiques et épidémiologieudsmed.u-strasbg.fr/labiostat/img/pdf/orthopsie_2008...fréquence de...
TRANSCRIPT
Capacité d'orthopsie 2008-2009 2
Plan
1. La variabilité
2. L'épidémiologie et les indicateurs
3. Les trois volets de l'épidémiologie
4. Plan d'étude et échantillonnage
5. Éléments de méthodologie
Capacité d'orthopsie 2008-2009 3
La variabilité
Capacité d'orthopsie 2008-2009 4
Un exemple
� Glycémie à jeun de plusieurs sujets4,2 4,8 4,8 6,44,2 5,8 6,3 4,53,8 5,7 4,9 5,24,9 4,8 3,5 5,04,2 5,5 6,7 4,7… … … ...
Capacité d'orthopsie 2008-2009 5
Définition
� Le résultat d’une mesure diffère d’un mesurage à l’autre� D’un sujet à l’autre
� D’un temps à l’autre chez un même sujet
� La variabilité est un phénomène naturel et inévitable
� La variabilité n’est pas l'imprécision ni l'erreur de mesure
Capacité d'orthopsie 2008-2009 6
Variabilité et incertitude
� Incertain = ce qu'on va observer et non pas ce que se passe réellement
� État biologique
� Suite particulière d'événements trop nombreux pour que l’on puisse les connaître exhaustivement
� Déterministe
Capacité d'orthopsie 2008-2009 7
Variabilité : phénomène naturel
• Les populations diffèrent• Cancer œsophage chine / Europe
• Les individus diffèrent• Même les jumeaux homozygotes
• Les cellules de même différenciation diffèrent
• L'expression génétique diffère• Élimination de protéines "mal conformées"
Capacité d'orthopsie 2008-2009 8
Variabilité : phénomène naturel
• La variabilité est indispensable à la vie et àl'évolution
• L'absence de variabilité est quasiment impossible en biologie
• La variabilité impose le recours àl'observation• Mesure de "constantes" biologiques
• Opposition avec la physique
Capacité d'orthopsie 2008-2009 9
Variabilité : inévitable
• Diminution par la standardisation• Mesures• Matériel• Individus
• Exemple de la mesure de la glycémie• Hommes non diabétiques• 8 heures du matin• Repas standard la veille• Coucher à 23 heures et 8 heures de sommeil• …
Capacité d'orthopsie 2008-2009 10
Variabilité n'est pas …
• Imprécision• Arrondir 19 et 22 cigarettes/jour à 1 paquet/jour
• Erreur de mesure• Difficultés de la mesure de la taille des nouveaux-
nés
Capacité d'orthopsie 2008-2009 11
Variabilité et aléa
• On espère avoir • Valeur mesurée = vrai valeur : Oi = Vi
• En pratique on a • Valeur mesurée = vrai valeur + variabilité :
Oi = Vi + ei
• On cherche à diminuer ei
• Contrôle des facteurs de variabilité
• Reste l'erreur résiduelle
Capacité d'orthopsie 2008-2009 12
Variabilité et aléa
• Pour l'analyse statistique• Valeur mesurée = valeur commune + erreur
résiduelle
Oi = V + ei
• Conséquences• La variabilité du groupe traduit les variabilités
individuelles
Capacité d'orthopsie 2008-2009 13
Exemple
• Comparaison de deux traitements A et B• Hypocholestérolémiant• Dosage du cholestérol HDL sanguin
• On admet• Effet moyen, fixe des traitements• Variabilité naturelle autour de cet effet
• Dosages de cholestérol• Sujets du groupe recevant A : Oi = VA + ei
• Sujets du groupe recevant B : Oi = VB + ei
Capacité d'orthopsie 2008-2009 14
Exemple
• Conséquences• Réponse à un facteur : propriété moyenne d'un
groupe• Pour un sujet
�Effet moyen du traitement�Erreur résiduelle
• Analyse statistique sur la comparaison entre VAet VB�Un traitement est meilleur en moyenne�L'effet du traitement est jugé au niveau du groupe
Capacité d'orthopsie 2008-2009 15
Variabilité et causalité
� Pour un sujet unique, on ne peut pas distinguer � L’effet d’un traitement
� D'une évolution spontanée
� Pas de conclusion de causalité au niveau individuel mais recherche de causalité au niveau d'un groupe � épidémiologie analytique
Capacité d'orthopsie 2008-2009 16
Variabilité et causalité
• "Le tabac multiplie par 2,3 le risque de cancer du poumon"• Le groupe des fumeurs a, en moyenne, un risque
2,3 plus élevé que le groupe des non-fumeurs
• Un individu, fumeur ou non-fumeur, aura ou n'aura pas un cancer du poumon
• Causalité probabiliste au niveau du groupe
Capacité d'orthopsie 2008-2009 17
L'épidémiologie
Capacité d'orthopsie 2008-2009 18
De l’épidémiologie descriptive
� Définition(s)� OMS (1968)
"Étude de la distribution et des déterminants des maladies chez l'homme"� Idem Mac Mahon (1970)
� Rumeau-Rouquette (1993)
" Étude de la distribution des maladies et indicateurs de santé"
Capacité d'orthopsie 2008-2009 19
� Recherche� Hypothèse à tester
� Vérification scientifique
� Généralisation
� Étiologie� Étude des causes et des facteurs de risque
� Choléra, Londres 1848
… vers …
Capacité d'orthopsie 2008-2009 20
l’épidémiologie analytique
� Retour à la définition de l'épidémiologie descriptive� Au mieux = variation parallèle maladie-facteur
� Études écologiques
� Corrélation
� Étape suivante = causalité
� Épidémiologie analytique
Capacité d'orthopsie 2008-2009 21
Épidémiologie évaluative
� Évaluer les actions de santé� Efficacité� Effets non prévus� Impact général� Couverture
� Les trois volets de l'évaluation (Donabedian)
Moyens
ProcéduresRésultats
Capacité d'orthopsie 2008-2009 22
Indicateurs
• Variables• Maladie
• Facteur de risque
• Autre facteur
� Sources ponctuelles = enquêtes ad hoc
� Sondages
� Enquêtes épidémiologiques
Capacité d'orthopsie 2008-2009 23
Indicateurs
� Sources en routine� Statistiques de mortalité (INSERM)
� Déclarations obligatoires
� Hôpitaux (PMSI), médecins sentinelles, médecins du travail
� Registres
� Statistiques sociodémographiques (INSEE, INED)
� Moyens, consommations (Ministères, DREES)
� ETC
Capacité d'orthopsie 2008-2009 24
Indicateurs
� Validité intrinsèque� Reproductibilité (temps, espace)
� Acceptabilité
� Fiabilité
� Utilité
Capacité d'orthopsie 2008-2009 25
Indicateurs de maladie
� Normal � anormal (pathologique)
G. Canguilhem. Le normal et le pathologique. PUF, 2ième édition, Paris, 1996.
� Types d'indicateurs� Mortalité� Morbidité� Handicap
Capacité d'orthopsie 2008-2009 26
Indicateurs de mortalité
� Nombre de cas
� Probabilité de décès
Nombre de décès sur la période
divisé par
Personnes présentes au début de la période
Capacité d'orthopsie 2008-2009 27
Indicateurs de mortalité
� Mieux que "personnes présentes au début de la période" = personnes à risque et durée d'exposition� Personne-temps (person-year)
� Taux de mortalité
Nombre de décès sur la période
divisé par
Personnes-temps pendant la période
Capacité d'orthopsie 2008-2009 28
Indicateurs de morbidité
� Maladies ou symptômes
� Nombreux indicateurs
� Prévalence� Nombre de cas à un instant donné parmi une
population
� Coupe transversale
Capacité d'orthopsie 2008-2009 29
Indicateurs de morbidité
� Incidence cumulée (cf. probabilité de décès)
Nombre de nouveaux cas sur la période
divisé par
Non malades au début de la période
� Incidence instantanée (cf. taux de mortalité)
Nombre de nouveaux cas sur la période
divisé par
Personnes-temps non malades pendant la période
Capacité d'orthopsie 2008-2009 30
Espérance de vie
� Espérance de vie à la naissance = moyenne des âges au décès d'une génération fictive soumise aux conditions de mortalité de l’année
� Résumé annuel de mortalité pour des sujets nés une même année
Capacité d'orthopsie 2008-2009 31
Indicateurs de handicaps
� � différentes situationsMaladie � déficience � incapacité � désavantage
(extériorisée) (objectivisée) (socialisée)
� Déficience = altération d'une fonction
� Incapacité = réduction de la capacité à accomplir une activité
� Désavantage = limitation d'un rôle normal
Capacité d'orthopsie 2008-2009 32
Indicateurs d'exposition
• Définir le recueil• Exposition qualitative
�Exposé vs non-exposé
• Exposition semi-qualitative�Peu vs moyen vs très
• Exposition quantitative�Mesures ponctuelles
�Dosimètres
�Durée d'exposition
Capacité d'orthopsie 2008-2009 33
Ce qu'il faut retenir
� La variabilité et son caractère inévitable (résiduelle) mais en partie contrôlable
� Les trois volets de l'épidémiologie
� L'utilisation d'indicateurs
� La notion de personnes-années
� La définition de l'incidence et la prévalence
Capacité d'orthopsie 2008-2009 34
Épidémiologie descriptive
Capacité d'orthopsie 2008-2009 35
Enquête transversale
� Objectif = mesurer la fréquence d'un phénomène ou la valeur d'un indicateur
� Unique = prévalence à l'instant t
� Répétée dans le temps� Évolution de prévalence
� (Évolution de l') incidence
� Avant-après
� Répétée dans l'espace� Comparaison de prévalence
� Ici-ailleurs
Capacité d'orthopsie 2008-2009 36
Études écologiques
� Épidémiologie descriptive� Au mieux = variation parallèle maladie-facteur
� Études écologiques (corrélation)
� Peu coûteuses
� Vérification d'hypothèse(s) avant …
� Étape suivante = causalité = épidémiologie analytique
Capacité d'orthopsie 2008-2009 37
Études écologiques
� Corrélation
� Prévisions
� MAIS PAS CAUSALITE
In S. Kono, M. Ikeda, M. Ogata.Salt and geographical mortality of gastric cancer and stroke in Japan.
J Epidemiol Community Health, 37:43-46, 1983
y = 21,655x - 73,989
R2 = 0,7205
200
250
300
350
400
12 14 16 18 20 22
sel/jour.personne (g)
Mor
talit
é A
VC
(p.100000
)
Capacité d'orthopsie 2008-2009 38
Épidémiologie analytique
Capacité d'orthopsie 2008-2009 39
Épidémiologie analytique
� Étude des causes� Basée sur l'observation
� Et non sur l'intervention (cf. épidémiologie évaluative)
� Mesure l'association entre "maladie" et "facteurs de risque " en tenant compte de ce qui pourrait brouiller cette association (facteurs de confusion)
Capacité d'orthopsie 2008-2009 40
Jugement de causalité
� Causalité = faisceau d'arguments� Critères internes
� Séquence dans le temps� Facteur � Latence � Maladie
� Force de l'association maladie-facteur� Relation dose-effet
� Fréquence de la maladie augmente si la dose de facteur augmente (ou sa durée)
� Cohérence dans les sous-populations� Homme-femme par exemple
Capacité d'orthopsie 2008-2009 41
Jugement de causalité
� Critères externes� Constances dans d'autres populations� Relation dose-effet entre études� Cohérence espace-temps
� Les variations de la maladie ou du facteur dans le temps ou dans l'espace entraîne des variations de l'autre
� Études expérimentales� Plausibilité biologique et physiopathologie� Connaissances générales
Capacité d'orthopsie 2008-2009 42
Types d'enquête
� Épidémiologie analytique basée sur l'observation de la maladie et des facteurs� Vers le futur = prospective
� Vers le passé = rétrospective
� Mixte
Capacité d'orthopsie 2008-2009 43
Types d'enquête
� Cas-témoin� Malades et non malades ("comparables")� Reconstitution rétrospective de leur exposition
� Cohorte (prospective)� Non malades� Suivis pour mesurer exposition et maladie
� Cohorte rétrospective� Idem� Reconstitution rétrospective de leur exposition
Capacité d'orthopsie 2008-2009 44
Je suis l'épidémiologiste
Passé Futur
Facteurs non
Facteurs oui
Non malades
Malades
Non maladesFacteurs non
Facteurs oui
Cohorte rétrospective
Facteurs non
Facteurs oui
Non malades
Malades
Non maladesCohorte
Non maladesMalades
Facteurs non
Facteurs oui
Cas-témoins
Capacité d'orthopsie 2008-2009 45
Études cas-témoins
� Mesures association = odds-ratio uniquement
� Nombre plus faible de sujets
� Maladie rare
� Délai long entre exposition et maladie
� Absence de suivi
� Reconstitution des facteurs
� Population hospitalière� Choix des témoins
Capacité d'orthopsie 2008-2009 46
Cohorte
� Mesures association = risque relatif ou odds-ratio
� Nombre élevé de sujets� Selon fréquence de la maladie
� Longueur du suivi� Moyens importants
� Perdus de vue
� Délai court entre exposition et maladie
� Milieux professionnels
� Pas les populations hospitalières
Capacité d'orthopsie 2008-2009 47
Cas particulier : l'essai thérapeutique
� Confins entre essais biologiques, épidémiologie analytique et évaluation
� Déterminer l’utilité d’un produit pour traiter une pathologie� Médicament
� Procédure thérapeutique
� Procédure diagnostique
� Quatre types chronologiques
Capacité d'orthopsie 2008-2009 48
Essai thérapeutique de phase I
� Étudier la tolérance (toxicité) et la pharmacocinétique d’une nouvelle substance
� Première étude chez l’homme
� Non comparatif
� Sujets sains (sauf cas particulier : anti-mitotiques)
� Effectifs faibles voir très faibles (5 à 50 patients)
� Administration successives, doses croissantes
Capacité d'orthopsie 2008-2009 49
Essai thérapeutique de phase II
� Étudie l’efficacité� Thérapeutique (relation effet dose) � Pharmacologique (critère de substitution)
� Effectifs faibles (20 à 100 sujets)� Sur sujets sains ou malades (selon les cas)� Recherche de la dose optimale� Parfois scindée en
� IIa détermination de l’activité� IIb recherche du taux de réponse (sur sujets malades)
� Parfois comparatif
Capacité d'orthopsie 2008-2009 50
Essai thérapeutique de phase III
� On compare deux produits� Nouveau produit vs placebo� Randomisé (tirage au sort des traitements pour les sujets)� Efficacité ou supériorité
� Il peut y avoir plus que 2 produits comparés� Étude exposés-non exposés particulière� Prospectif� Sur des sujets malades � Effectifs importants � � AMM
Capacité d'orthopsie 2008-2009 51
Essai thérapeutique de phase IV
� Essai ayant débuté après la mise sur le marché
� Étudie la sécurité, les indications et l’administration réelle du produit
� Effectifs très grands� Effets indésirables rares� Non comparatif en général� Prospectif (mieux) ou rétrospectif (moins
bien)
Capacité d'orthopsie 2008-2009 52
Étude pronostique
� Un groupe de sujets ayant une pathologie donnée
� Recherche de facteurs de risque de survenue d’un évènement particulier (complication, décès, rechute etc)
� Ces facteurs de risques sont appelés facteurs pronostiques
� Théoriquement c’est une étude prospective parfois rétrospective lorsqu’elle est construite à partir de dossier (déconseillé +++).
Capacité d'orthopsie 2008-2009 53
Association maladie-facteur s
� Facteurs supposés explicatifs
� Facteurs de confusion� Facteur lié à la maladie et à l'exposition et qui brouille la
mesure de l'association maladie-exposition
� Lutte contre la confusion� Appariement (échantillon)
� Ajustements (analyse)� Chi² Mantel-Haenszel
� Modèles régressifs multivariés
� Modèle de Cox
C
MF
Capacité d'orthopsie 2008-2009 54
Biais = erreur systématique
� Sélection (constitution de l'échantillon)� Non réponse, perdus de vue
� Non-comparabilité
� Autosélection dans les cas-témoins (survie sélective, décès précoces)
� Healthy worker effect des cohortes professionnelles
� Classement� Mesure d'exposition
� Mesure de la maladie
� Confusion
Capacité d'orthopsie 2008-2009 55
Épidémiologie évaluative
Capacité d'orthopsie 2008-2009 56
Définition
� Juger des effets (positifs et négatifs) d'une intervention en santé publique� Action destinée à améliorer l'état de santé d'un
groupe
� Prévention� Primaire : incidence de la maladie
� Exemple : évaluation d'une campagne de dépistage
� Secondaire : prévalence et évolution de la maladie
� Tertiaire : rechute, séquelles, dépendance
Capacité d'orthopsie 2008-2009 57
Indicateurs
� Nombreux, différents selon les cas
� Mesurer� Amélioration des connaissances
� Modification du comportement
� Modification de l'état de santé
� Modification des attitudes thérapeutiques
Capacité d'orthopsie 2008-2009 58
Qualité des indicateurs
� Sensibilité, spécificité
Malades Non maladesTest positifTest négatif
a bc d
ca
aésensibilit
+=
db
déspécificit
+=
Vrais positifs parmi les malades Vrais négatifs parmi les non malades
Capacité d'orthopsie 2008-2009 59
Types d'enquête
� Recueil sur un groupe = avant-après� Mêmes sujets
� Groupe globalement
� Recueil sur un groupe avec intervention et un groupe sans = ici-ailleurs� Sans contrôle des sujets
� Essais randomisés la plus rigoureuse
Capacité d'orthopsie 2008-2009 60
Bibliographie générale
� J. Bouyer, D. Hémon, S. Cordier et al. Épidémiologie : principes
et méthodes quantitative. Éditions INSERM, Paris, 1993.
� C. Rumeau-Rouquette, B. Blondel, M. Kaminski, G. Bréart.
Épidémiologie : méthodes et pratique. Médecine-Sciences,
Flammarion, Paris, 1993.
� NE. Breslow, NE. Day. Statistical methods in cancer research. IARC Scientific publication N°32 et N°82, Lyon, 1980 et 1987.
� M. Jenicek, R. Cléroux. Epidémiologie : principes, techniques,
applications. Edisem, Québec, 1987.
Capacité d'orthopsie 2008-2009 61
Ce qu'il faut retenir
� Les caractéristiques� Étude cas-témoins
� Étude de cohorte
� Essai thérapeutique (phase III)
� La notion de biais
� Les définitions de sensibilité et spécificité
Capacité d'orthopsie 2008-2009 62
Plan d'étude
Capacité d'orthopsie 2008-2009 63
Plan de tout étude
� Grandes phases1. Problématique
2. Choix du type d'enquête et traitement des non-réponses
3. Définition de la population
4. Investigations
5. Analyse
� Rédiger un protocole précis
Capacité d'orthopsie 2008-2009 64
(1) Problématique
� Études antérieures
� Définition des objectifs
� Moyens� Matériels
� Humains
� Juridiques et légaux (CNIL, Loi Huriet-Serusclat)
� De la formulation de la problématique dépend les étapes suivantes
Capacité d'orthopsie 2008-2009 65
(1) Problématique
� Variable(s) résultat (à expliquer)
� Variable(s) explicative(s)
� Variables continues ou discrètes
� Types de variables� Qualitatives (ordonnées ou non)
� Quantitatives (continues ou discrètes)
Capacité d'orthopsie 2008-2009 66
(2) Type d'enquête
� Choix du type d'enquête� Échantillon = phénomène fréquent
� Exhaustif = phénomène rare
� Du choix dépend les étapes suivantes� Exemple : incidence du cancer � enquête
exhaustive dans un registre
� Traitement des "non-réponses"
Capacité d'orthopsie 2008-2009 67
(3) Population d'étude
� Ensemble d'unités sur lesquelles on peut relever (mesurer) une caractéristique
� Peut être un groupe de personnes (famille, couple)
� Taille� Grande taille mais pas toujours
� En statistiques, supposée de taille infinie
� Exceptionnellement très petite : maladie génétique, intoxication
Capacité d'orthopsie 2008-2009 68
(3) Population d'étude
� Les questions que l'on se pose s'adressent toujours à la population (même si théorique)
� On ne peut pas travailler sur l'ensemble de la population � Pour des raisons pratiques (populations
mouvantes, de taille variable)
� Pour des raisons éthiques (traitement toxique)
� Technique d'échantillonnage
Capacité d'orthopsie 2008-2009 69
(3) Population d'étude
� Échantillon� Extrait de la population
� Apporte des informations sur la population
� Perte d'information
� Doit représenter au mieux la variabilité de la population� Sans en connaître toutes les caractéristiques
� Au mieux par tirage au sort� Nombre de sujets nécessaires (NSN)
Capacité d'orthopsie 2008-2009 70
(3) Population d'étude
� Population exhaustive� Disposer de la base exhaustive des unités
� Échantillon� Base exhaustive ou partielle
� Tirage au sort (théorie des sondages)
� Quotas
Capacité d'orthopsie 2008-2009 71
(3) Population d'étude
� Type de population� Territorial
� Professionnel
� Clientèle� Hôpital
� Organisme de remboursement
Capacité d'orthopsie 2008-2009 72
(3) Population d'étude
� Unités statistiques� Individu
� Ménage
� Évènement
� Actes médicaux
� …
Capacité d'orthopsie 2008-2009 73
(3) Population d'étude
� Critères d'inclusion-exclusion
� Critères d'exclusion� Peu contraignants et peu nombreux
� Résultats applicables à une large population
� Résultats pragmatiques
� Contraignants et nombreux� Résultats applicables à un sous groupe seulement
� Résultats explicatifs
Capacité d'orthopsie 2008-2009 74
(3) Échantillonnage
� Différents plans d'échantillonnage
� Sondage aléatoire simple� Unités tirées au sort dans la base de la population
� Nécessité d'une base exhaustive
� Plan de sondage de référence� Position des autres plans
� En terme de biais et dispersion
Capacité d'orthopsie 2008-2009 75
(3) Échantillonnage
� Notion d'estimateur� Population = vraies valeurs
� Échantillon = estimation de ces vraies valeurs
� Estimation = imprécision
Capacité d'orthopsie 2008-2009 76
(3) Échantillonnage� Deux écueils à corriger
� Biais = erreur systématique
� Le pire …
• Dispersion= erreur aléatoire= erreur aléatoire
Capacité d'orthopsie 2008-2009 77
(3) Échantillonnage
� Autres plans d'échantillonnage� Sondage stratifié
� Sous-groupes homogènes mais différents
� Sondage en grappe� Toutes les unités au sein de sous-groupes tirés au
sort
� Exemple� Tirage au sort d'immeubles� Interroger tous les habitants des immeubles retenus
� Plans complexes
Capacité d'orthopsie 2008-2009 78
(4) Investigations
Capacité d'orthopsie 2008-2009 79
(5) Analyse : cf. dernier chapitre
0.0
0.1
0.2
0.3
0.4
Capacité d'orthopsie 2008-2009 80
Ce qu'il faut retenir
� Les chapitres obligatoires d'un plan d'étude
� L'importance des critères d'inclusion et d'exclusion
� La notion d'échantillonnage et d'estimation
Capacité d'orthopsie 2008-2009 81
Méthodes statistiques
Enfin!
Capacité d'orthopsie 2008-2009 82
Plan de tout étude (rappel)
� Grandes phases1. Problématique
2. Choix du type d'enquête et traitement des non-réponses
3. Définition de la population
4. Investigations
5. Analyse
� Rédiger un protocole précis
Capacité d'orthopsie 2008-2009 83
Plan des analyses
A moduler selon les cas
1. Descriptif des variables� Graphes
� Tableaux
� Résumé
2. Analyse univariée
3. Analyse multivariée� Tests d'hypothèses
� Modélisation
Capacité d'orthopsie 2008-2009 84
Analyse descriptive
Capacité d'orthopsie 2008-2009 85
Représentation graphique
� De nombreux types� Histogramme
� Nuage de point
� Boîte-à-moustaches = box-plot
� Courbes de survie (Kaplan-Meier)
� Autres (nombre +++)
� Selon le type de variables
Capacité d'orthopsie 2008-2009 86
Types de variables
• Quantitative = mesurable sur une échelle• Continue = valeurs réelles
�Poids, âge
• Discrète = valeurs isolées�Dilution, nombre d'enfants
• Notion de continuité relative à l'échelle�Age : 10, 12, 14, 15, 16
�Mais pas 10, 10, 10, 15, 15
Capacité d'orthopsie 2008-2009 87
Types de variables
• Qualitative = non mesurable sur une échelle• Sans ordre (catégorielle)
�Sexe, localisation de cancer, groupe sanguin
• Avec ordre (semi-quantitative)�Stade d'un cancer, exposition faible/moyenne/élevée
�Transformation d'une variable quantitativeAge<25, [25-40[, [40-75[, [75 et plus� Perte d'information
Capacité d'orthopsie 2008-2009 88
Types de variables
• Semi-quantitative vs quantitative discrète• Équivalence sous des hypothèses de distances
entre valeurs�Stade de cancer I, II, III, IV (clinique)
�Stade de cancer 1, 2, 3, 4 � le stade IV est-il 2 fois plus grave que le stade 2?
Capacité d'orthopsie 2008-2009 89
Histogramme
Capacité d'orthopsie 2008-2009 90
Histogramme
� Étude choc septique et lactate
� Décès à 3 jours (oui/non)
� Sur l’axe vertical : fréquence
� 105 décès parmi 1278 patients
Capacité d'orthopsie 2008-2009 91
Nuage de points
Capacité d'orthopsie 2008-2009 92
Boîte à moustache
Médiane = p50
Q3 = p75
Q1 = p25
Donnée extrême
1,5 x (Q3 – Q1) = 1,5 x EIQ
Capacité d'orthopsie 2008-2009 93CECSMO 2008-2009
Box-plot et histogramme
� La box plot ne montre pas tous les détails d'un histogramme
Capacité d'orthopsie 2008-2009 94
Autres
Capacité d'orthopsie 2008-2009 95
Autres
Capacité d'orthopsie 2008-2009 96
Autres
Capacité d'orthopsie 2008-2009 97CECSMO 2008-2009
Autres
Capacité d'orthopsie 2008-2009 98CECSMO 2008-2009
Autres
Capacité d'orthopsie 2008-2009 99
Résumé d'une variable continue
• Indicateurs ponctuels de position• Moyenne µ
• Percentiles�Médiane=Q2=p50, Q1, Q3
�p2,5, p97,5
• Mode (valeur la plus fréquente)�Dépend du regroupement en classe
�Parfois non-unicité
NB : Distribution unimodale et symétrique � mode, moyenne et médiane confondues
Capacité d'orthopsie 2008-2009 100
Résumé d'une variable continue
• Moyenne
•• Manipulable
• Sensible aux extrêmes
• Médiane
• Partage distribution en 2
• Peu manipulable
• Peu sensible aux extrêmes
∑=
=n
iix
n 1
1µ
Capacité d'orthopsie 2008-2009 101
Résumé d'une variable continue
• Age de 5 étudiants : 19, 20, 20, 21, 22• Médiane
�19 : 1 étudiant
�19, 20 : 3 étudiants
�19 à 21 : 4 étudiants
�19 à 22 : 5 étudiants
• Moyenne�1/5(19+20+20+21+22)
Q2 = 20 ans
µ = 20,4 ans
Capacité d'orthopsie 2008-2009 102
Résumé d'une variable continue
• Age de 5 étudiants : 19, 20, 20, 21, 42• Médiane
�19 : 1 étudiant
�19, 20 : 3 étudiants
�19 à 21 : 4 étudiants
�19 à 42 : 5 étudiants
• Moyenne�1/5(19+20+20+21+42)
Q2 = 20 ans
µ = 24,4 ans
Capacité d'orthopsie 2008-2009 103
Résumé d'une variable continue
• Mesures de la variabilité• Écart interquartile : Q75-Q25
• Étendue : maximum - minimum• Variance
�Somme des écarts carrés autour de la moyenne�Divisée par l'effectif
• Écart-type = racine carrée de la variance• Coefficient de variation
( )
11
2
2
−
−=∑=
n
xn
ii µ
σ
µσ
Capacité d'orthopsie 2008-2009 104
Résumé d'une variable continue
• Age de 5 étudiants : 19, 20, 20, 21, 22• µ = 20,4 ans
• Écarts carrés�(19 - 20,4)² = 1,96
�(20 - 20,4)² = 0,16
�(21 - 20,4)² = 0,36
�(22 - 20,4)² = 2,56
• Somme divisée�5,2 / (5-1) = 1,3
Σ = 5,2
σ = 1,14 ans
Capacité d'orthopsie 2008-2009 105
Résumé d'une variable continue
• Age de 5 étudiants : 19, 20, 20, 21, 22
•
• Σx = 19 + 20 + 20 + 21 + 22 = 102
• Σx² = 19² + 20² + 20² + 21² + 22² = 2086
• σ² = ¼ (2086 – 102²/5) = 1,3
( )
−−
=−
−=
∑∑
∑=
=
=n
x
xnn
xn
in
i
n
ii
2
1
1
21
2
2
11
1
µσ
Capacité d'orthopsie 2008-2009 106
Loi normale
� Loi de Laplace-Gauss ou loi normale� Principale loi de probabilité
� Quasi-généralité dans bien des domaines.
� Peut être observée empiriquement
� Aspect typique� Forme en cloche
� Symétrique
� Moyenne, médiane et mode sont confondus
Capacité d'orthopsie 2008-2009 107
Un exemple
� Glycémie à jeun de plusieurs sujets4,2 4,8 4,8 6,44,2 5,8 6,3 4,53,8 5,7 4,9 5,24,9 4,8 3,5 5,04,2 5,5 6,7 4,7… … … ...
Capacité d'orthopsie 2008-2009 108
Loi normale
� Aire sous la courbe entre deux points
2,5%
2,5%
1,96
-1,96
ECH
IP
0.0
0.1
0.2
0.3
0.4
p(X
)
-3 -2 -1 0 1 2 3
X
Normal Densityµ = 0σ = 1
Moyenneet
écart-type
Capacité d'orthopsie 2008-2009 109
Loi normale
� Loi de Gauss centrée-réduite� µ=0 et σ=1
� 95% des valeurs sont situées entre 0±1,96
� La relation se généralise� µ et σ quelconques
� 95% des valeurs sont situées entre µ±1,96.σ
Capacité d'orthopsie 2008-2009 110
Résumé d'une variable continue
� Calcul d'estimateurs ponctuels et de leur variabilité � intervalle de confiance
σ+µσ−µ 22 ˆ96.1ˆ;ˆ96.1ˆ
∑=
=µn
1iix
n
1ˆ ( )∑
=µ−=σ
n
1i
2i
2 xn
1ˆ
Méthode dumaximum
devraisemblance
Capacité d'orthopsie 2008-2009 111
Retour à la population
• La probabilité que la "vraie" valeur moyenne µ soit comprise dans l’intervalle de confiance à 95% est de 0,95• Plus la taille d’échantillon est importante, plus
l’étendue de l’intervalle est faible
• Plus l’échantillon est hétérogène, plus l’étendue de l'intervalle est importante
Capacité d'orthopsie 2008-2009 112
Résumé d'une variable qualitative
Capacité d'orthopsie 2008-2009 113
Données de survie
� Pour chaque individu� Variables explicatives
� Couple de variables� Survenue de l'événement = censure
� Oui : décès, apparition de la maladie, d'une complication
� Non : perdu de vue ou fin de l'étude
� Délai avant censure
Capacité d'orthopsie 2008-2009 114
Courbe de survie : Kaplan-Meier
inclusion
inclusion Décès (ou évènement)
Censure (Perdu de vue, fin d’étude)
Capacité d'orthopsie 2008-2009 115
Courbe de survie : Kaplan-Meier
Capacité d'orthopsie 2008-2009 116
Courbe de survie : Kaplan-Meier
100%
Capacité d'orthopsie 2008-2009 117
Courbe de survie : Kaplan-Meier
100%
Capacité d'orthopsie 2008-2009 118
Courbe de survie : Kaplan-Meier
100%
Décès
Censure
Capacité d'orthopsie 2008-2009 119
Courbe de survie : Kaplan-Meier
� Trouver la médiane de survie� Temps pour lequel la survie passe sous la valeur
de 50 %
� Si la survie reste supérieure à 50 %, prendre troisième quartile de survie (75%) ou autre valeur
� Trouver la survie à un temps donné� Lecture opposée de la recherche de la médiane
Capacité d'orthopsie 2008-2009 120
Médiane 68 jours
Courbe de survie : Kaplan-Meier
Capacité d'orthopsie 2008-2009 121
Survie à 100 jours 33%
Courbe de survie : Kaplan-Meier
Capacité d'orthopsie 2008-2009 122
Ce qu'il faut retenir
� Les trois grandes étapes des analyses
� La multiplicité des représentations graphiques
� Les particularités des données de survie
� Le rôle de la loi normale
� Les résumés d'une variable� Moyenne
� Médiane
� Variance
Capacité d'orthopsie 2008-2009 123
Analyses univariées etmultivariées
Capacité d'orthopsie 2008-2009 124
Analyses uni- vs multivariées
� Analyse univariée � Analyse d’un seul facteur sur le résultat
� Effet d’un traitement sur la survie
� Analyse multivariée� Analyse de plusieurs facteurs simultanément sur
le résultat
� Effet d’un traitement et de l’âge sur la survie
� "Multivariate" = plusieurs variables résultat
Capacité d'orthopsie 2008-2009 125
Démarche générale
• Une variable résultat (à expliquer)
• Des variables explicatives
• Montrer la relation de cause à effet• Dans la population
• A partir des données d'échantillons
� Tests d'hypothèse
Capacité d'orthopsie 2008-2009 126
Tests d'hypothèses
• Exemple de l'efficacité d'un traitement sur un dosage sanguin• Constitution de deux groupes (échantillons)
�Groupe A reçoit le traitement (population A)
�Groupe B reçoit un placebo (population B)
• Hypothèse nulle�Les moyennes des dosages dans les 2 populations
sont les mêmes
H0 : µA=µB
Capacité d'orthopsie 2008-2009 127
Tests d'hypothèses
� En raison des aléas du tirage au sort, même si les effets sont identiques, les moyennes observées mAet mB sont différentes
� La différence mA-mB varie autour de 0
� Sous H0, on peut calculer la Pr(mA-mB>limite)
Capacité d'orthopsie 2008-2009 128
Tests d'hypothèses
� Formalisation• S'il n'y a pas de différence entre les deux
moyennes, l'événement mA-mB>1,96.σ est rare : Pr<0,05
• Ici σ est un estimateur de la variabilité de la différence (somme pondérée)
• S'il a été observé c'est que H0 est fausse et on retient son complémentaire H1 : µA≠µB
• Test d'hypothèse nulle
Capacité d'orthopsie 2008-2009 129
Tests d'hypothèses
� Si H0 est vraie, on la rejette (test significatif) avec un risque α
� Si H1 est vraie, on ne rejette pas H0 avec un risque β
� Si H1 est vraie, on rejette H0 avec un "risque" 1-β : la puissance
� Classiquement� α=5%
� 1-β=80 ou 90%
Capacité d'orthopsie 2008-2009 130
Tests d'hypothèses
� Forme générale� Fixer H0 et H1
� Calcul d'une statistique observée T
� Détermination d'une statistique limite L, telle que Pr(T > L) > α
� Si T > L, on rejette H0
� Si T < L, on ne rejette pas H0
� Règle de décision de Neyman-Pearson
Capacité d'orthopsie 2008-2009 131
Mesure de risque
� Risque dans un groupe� Risque absolu = fréquence de la maladie chez les
exposés ou chez les non exposés� a / (a+b)
� c / (c+d)
Malades Non maladesFacteur ouiFacteur non
a bc d
Capacité d'orthopsie 2008-2009 132
Association maladie-facteur
� Deux mesures très utilisées� Risque relatif = fréquence de la maladie chez les
exposés par rapport à la fréquence chez les non exposés (modèle multiplicatif)
Malades Non maladesFacteur ouiFacteur non
a bc d
dc
cba
a
RR .estim
+
+=Estimation donc erreur
Capacité d'orthopsie 2008-2009 133
Association maladie-facteur
� Deux mesures très utilisées� Odds ratio = rapport des cotes (turf)
� "cote" de la maladie chez exposés = rapport entre fréquence de la maladie chez exposés et 1-fréquence
� "cote" chez les non exposés
Malades Non maladesFacteur ouiFacteur non
a bc d
bc
adOR .estim =
Estimation donc erreur
Capacité d'orthopsie 2008-2009 134
Association maladie-facteur
� Des mesure plus rarement utilisées� Risque attribuable = proportion de malades évités
si le facteur était supprimé
� Excès de risque = différence de fréquence de la maladie entre exposés et non exposés (modèle additif)
� Fraction préventive
Malades Non maladesFacteur ouiFacteur non
a bc d
Capacité d'orthopsie 2008-2009 135
Association maladie-facteur
� Fraction étiologique chez les exposés� Proportion des cas que l’on peut attribuer au facteur de
risque
� Si p est la prévalence de l'exposition dans la population :
� Toutes ces mesures sont estimées et doivent donc être assorties d'un intervalle de confiance
Malades Non maladesFacteur ouiFacteur non
a bc d
11
1
+−−=)(
)(RRp
RRpFER
Capacité d'orthopsie 2008-2009 136
Association maladie-facteur
� Test de l'association� Le Chi² magique
� Test de l'OR ou du RR à 1
Malades Non maladesFacteur ouiFacteur non
a bc d
( ) ( )( )( )( )( )dbcadcba
dcbabcad 221 ++++
+++−=χ
Capacité d'orthopsie 2008-2009 137
Un exemple
• Comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques• Corticoïdes par infiltrations
• Placebo
• Critère de jugement : succès/échec à J20 par auto-évaluation du patient
• Planification de l’étude : inclusion prévue de 43 patients/groupe
Capacité d'orthopsie 2008-2009 138
Un exemple
• Au terme de l’étude• 85 patients inclus
• Résultats observés : �Corticoïdes : 22/43 (51,2%) de succès
�Placebo : 10/42 (23,8%) de succès
• Hypothèses• H0 : taux de succès identiques entre corticoïdes
et placebo
• H1 : taux de succès différents
Capacité d'orthopsie 2008-2009 139
Un exemple
• Risques• Erreur de première espèce α : conclure à une
différence d’efficacité entre corticoïdes et placebo alors que les taux de succès sont identiques
• Erreur de seconde espèce β : ne pas réussir àprouver une différence d’efficacité entre corticoïdes et placebo alors que cette différence existe
• Puissance 1-β : prouver une différence d’efficacité entre corticoïdes et placebo quand la différence existe
Capacité d'orthopsie 2008-2009 140
Un exemple
• Sous H0• Taux de succès attendus
�Sous corticoïdes�Sous placebo�(22 + 10) / (43 + 42) = 37,6 %
• Nombre de succès attendus�Sous corticoïdes : 43 x 0,376 = 16,19�Sous placebo : 42 x 0,376 = 15,81
Corticoïdes PlaceboSuccèsÉchec
22 1021 32
Capacité d'orthopsie 2008-2009 141
Un exemple
• Sous H0• Attendus
• Écarts carrés pondérés par les attendus (O-E)²/E
Corticoïdes PlaceboSuccèsÉchec
22 1021 32
Corticoïdes PlaceboSuccèsÉchec
16,19 15,8126,81 26,19
Corticoïdes PlaceboSuccèsÉchec
2,09 2,141,26 1,29
Capacité d'orthopsie 2008-2009 142
Un exemple
• La statistique = Chi2• Somme des écarts carrés pondérés
• Chi2 calculé = 6,77
• A comparer à une distribution théorique
( )∑
−=E
EO ²²χ
ddl 40% 30% 20% 10% 5% 1% 0,1%1 0,71 1,07 1,64 2,71 3,84 6,63 10,832 1,83 2,41 3,22 4,61 5,99 9,21 13,823 2,95 3,66 4,64 6,25 7,81 11,34 16,274 4,04 4,88 5,99 7,78 9,49 13,28 18,475 5,13 6,06 7,29 9,24 11,07 15,09 20,516 6,21 7,23 8,56 10,64 12,59 16,81 22,467 7,28 8,38 9,80 12,02 14,07 18,48 24,328 8,35 9,52 11,03 13,36 15,51 20,09 26,129 9,41 10,66 12,24 14,68 16,92 21,67 27,88
10 10,47 11,78 13,44 15,99 18,31 23,21 29,59
Table de la loi du Chi ²
Capacité d'orthopsie 2008-2009 143
Un exemple
• Conclusion
• Chi2 observé supérieur à la valeur théorique• Rejet de H0
• On met en évidence une différence de taux de succès
• Degré de signification : p = 0,009
Capacité d'orthopsie 2008-2009 144
Degré de signification
• Plus il est faible, moins les résultats observés sont en cohérence avec H0
• En aucun, importance de la différence entre groupes
• Valeur de p dépend• Différence observée entre les deux groupes• Taille d’échantillon• S’il existe une différence réelle, aussi infime soit-elle, entre
2 groupes, n’importe quel test statistique va aboutir à une valeur de p inférieure à 0,05, dès lors que le nombre de sujets étudiés sera important
Capacité d'orthopsie 2008-2009 145
Exemple (retour)
• 22/43 (51,2%) vs 10/42 (23,8%)• Différence d’efficacité = 27,4%• p = 0,009
• 14/22 (63,6%) vs 5/21 (23,8%)• Différence d’efficacité = 39,8%• p = 0,009
• 1104/4200 (26,3%) vs 1000/4200 (23,8%)• Différence d’efficacité = 2,5%• p = 0,009
Capacité d'orthopsie 2008-2009 146
Degré de signification
• Un résultat non statistiquement significatif• H0 est vraie (pas de différence entre les groupes)
• Puissance statistique insuffisante (NSN)
• Ne pas mettre en évidence de différence statistiquement significative entre deux groupes ne signifie pas qu’il n'y a pas de différence
Capacité d'orthopsie 2008-2009 147
Modélisation
•Buts de l'analyse statistique• Descriptif
• Explicatif
• Prédictif
•Besoin d'outils mathématiques• Traduction de la réalité
• Choix
• Perte d'information
Capacité d'orthopsie 2008-2009 148
Modélisation
• Forme générale : g(Y) = f(X) + Σ• Y = variable(s) à expliquer
• X = variable(s) explicative
• g et f = éventuelles fonctions de transformation
• Σ = matrice de variance-covariance
• Un cas des plus simples• Y = aX + b + ε• ε ~ N(0,σ²)
– Importance des tests d'adéquation
Capacité d'orthopsie 2008-2009 149
Modélisation
• Attention au modèle choisi• Lien entre le nombre d’heures de cours et la note
à un examen
• P<0,001
Capacité d'orthopsie 2008-2009 150
Modélisation
• Attention au modèle choisi• Lien entre le nombre d’heures de cours et la note
à un examen
• P<0,001• R²=0,33
Capacité d'orthopsie 2008-2009 151
Modélisation
• Modèles linéaires• Régression simple : Y = aX + b• Régression multiple : Y = a1X1 + a2X2 +…+ b
• Modèles logistiques• Y = dichotomique (1 vs 0)• g(Y) = logit(Pr(Y=1)) = a1X1 + a2X2 +…+ b• Les ai sont des odds ratios (exponentielle)
Capacité d'orthopsie 2008-2009 152
Modélisation
• Données de survie et modèle de Cox• h = risque instantané de décès• log(h(X,t)) = log(h0(t)) + a1X1 + a2X2 + …
• Nombreux autres modèles• Lissage• Modèles mixtes• …
Capacité d'orthopsie 2008-2009 153
Puissance
� La variabilité définit la puissance d'une étude et donc le nombre de sujets nécessaires� Si la variabilité est grande, plus difficile d'observer
de petites différences
� Le calcul du nombre de sujets nécessaires est donc fait en tenant compte de la variabilité attendue
Capacité d'orthopsie 2008-2009 154
Nombre de sujets nécessaires
� Détermine la puissance du test : probabilitéde mettre en évidence une différence quand elle existe
� Le nombre de sujet nécessaire se calcule àpartir de� α et β
� Différence entre les moyennes que l'on souhaite mettre en évidence� Plus la différence est petite, plus le NSN est grand
Capacité d'orthopsie 2008-2009 155
Exemple (retour)
• Hypothèse quantitative sous H1 a priori• 70% de succès sous corticoïdes
• 40% de succès sous placebo
• Risques d’erreur• Erreur de première espèce : α = 5%
• Erreur de seconde espèce : β = 20%
� 43 patients par groupe
Capacité d'orthopsie 2008-2009 156
Correction du risque α
� Pour comparer deux groupes : α = 5%
� Sur plusieurs comparaisons, la probabilité d’observer une différence entre les groupes (alors qu’il n’y a pas de différence : H0) doit rester de 5%
� Si on fait deux comparaisons, la probabilité de trouver au moins un test significatif n’est plus de 5%
� Il faut donc « corriger » le risque α
Capacité d'orthopsie 2008-2009 157
Correction du risque α
� Exemple de deux comparaisons
� Pr(Aucun significatif) = 0,9025 et pas 0,95
� donc probabilité d’avoir au moins un test significatif 0,0975
0,05
0,05
0,95 × 0,95 = 0,9025
Capacité d'orthopsie 2008-2009 158
Correction du risque α
� Exemple de deux comparaisons
� Pour avoir α = 0,95
� On doit prendre la signification de chaque test à 0,0253
0,0253
0,0253
0,975 × 0,975 = 0,951
Capacité d'orthopsie 2008-2009 159
Ce qu'il faut retenir
� Définition des analyses univariées vs multivariées
� Notion de tests d'hypothèse et leur forme générale
� Calcul d'un RR et d'un OR
� Les pièges du degré de signification
� Grandes classes de modèles
� La notion de NSN
Capacité d'orthopsie 2008-2009 160
Mon cher Watson, essayer de faire votre propre analyse. Vous connaissez mes méthodes, appliquez les !
S. Holmes, Le signe des 4.