structure of statistica 6 - statsoft.fr statistica.pdf · de la variable, est utilisé pour...

106
Initiation à Des logiciels Statistiques Performants 2, Rue Louis Pergaud 94700 Maisons-Alfort Tél : 01-45-185-999 Fax : 01-45-185-285 e-mail : [email protected] Web : www.statsoft.fr

Upload: others

Post on 12-Jul-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

Initiation à

Des logiciels Statistiques Performants

2, Rue Louis Pergaud 94700 Maisons-Alfort

Tél : 01-45-185-999 Fax : 01-45-185-285

e-mail : [email protected]

Web : www.statsoft.fr

Page 2: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format
Page 3: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

1

Sommaire

Prise en main ........................................................................................................................ 1

1. Interface-Utilisateur ................................................................................................. 1

2. Structure de STATISTICA ........................................................................................... 1

Sorties disponibles ............................................................................................................... 2

1. Les Classeurs (*.stw) ................................................................................................. 2

2. Les Rapports STATISTICA (*.str) et Microsoft Word ................................................... 4

3. Les Projets (*.spf) ..................................................................................................... 5

4. Les Fenêtres Individuelles ......................................................................................... 5

5. Navigateur Web ....................................................................................................... 5

Source de Données ............................................................................................................... 6

1. Spécifications des Variables et des Observations ...................................................... 7

2. Métadonnées pour les Observations et Variables ..................................................... 9

a. Métadonnées pour les Observations ..................................................................... 9

b. Métadonnées pour les Variables ......................................................................... 10

3. Opérations sur les Variables ................................................................................... 11

a. Types de Variable ................................................................................................ 11

b. Spécifications de Toutes les Variables ................................................................. 12

c. Valeurs-Texte ...................................................................................................... 12

d. Recodifier ............................................................................................................ 13

e. Trier .................................................................................................................... 13

4. Opérations sur les Observations ............................................................................. 14

a. Noms d’Observations .......................................................................................... 14

b. Gestionnaire de Noms d’Observations ................................................................ 14

5. Filtrage / Recodification des Données ..................................................................... 20

a. Filtrage des doublons .......................................................................................... 20

b. Filtrage des données éparses .............................................................................. 20

c. Traitement des variables invariantes ................................................................... 20

d. Recodification des Points Atypiques .................................................................... 20

e. Traitement des Valeurs Manquantes................................................................... 20

f. Interpolation des Valeurs Manquantes................................................................ 21

g. Remplacement des Valeurs Manquantes ............................................................ 21

6. Importer des Données ............................................................................................ 21

7. Fusionner des Données ........................................................................................... 23

Page 4: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

2

8. Échantillonnage Aléatoire ...................................................................................... 23

9. Options Empiler/Désempiler ................................................................................... 24

10. Statistica Query ...................................................................................................... 25

a. Qu’est-ce qu’un DSN ?......................................................................................... 25

b. Déclaration de la source de données ................................................................... 26

11. Exporter des Données ............................................................................................. 28

12. Options................................................................................................................... 28

Statistiques Descriptives .................................................................................................... 30

1. Sélection des Variables et des Statistiques .............................................................. 30

2. Statistiques et Graphiques 'Par Groupes' ................................................................ 31

3. Statistiques de Blocs ............................................................................................... 32

4. Test de Normalité ................................................................................................... 32

5. Etude des Corrélations ............................................................................................ 34

Les Statistiques de Tests ..................................................................................................... 36

1. Test T pour Éch. Indépendants, Par Groupes ........................................................... 36

2. Test T pour Éch. Indépendants Par Variables ......................................................... 38

3. Test T pour Échantillons Appariés ........................................................................... 38

4. Comparer une Moyenne à un Standard .................................................................. 39

Décompositions et Anova à 1 facteur ................................................................................. 41

Méthodes Non-Paramétriques ........................................................................................... 44

1. Descriptives & Centiles ........................................................................................... 44

2. Comparer Deux Échantillons (Groupes) ................................................................... 46

3. Comparer Deux Échantillons Appariés .................................................................... 47

4. Comparer Plusieurs Échantillons Indépendants ....................................................... 48

Tables de Fréquences / Tableaux Croisés ........................................................................... 50

1. Tables De Fréquences ............................................................................................. 50

2. Tableaux Croisés..................................................................................................... 52

Page 5: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

3

Graphiques ......................................................................................................................... 54

1. Approches Graphiques............................................................................................ 54

a. Graphiques 'Par Groupes' .................................................................................... 54

b. Graphiques Intégrés ............................................................................................ 55

c. Graphiques des Données d’Entrée ...................................................................... 55

d. Graphiques de Blocs ............................................................................................ 58

2. Graphiques du Menu Graphiques ........................................................................... 61

3. Graphiques Personnalisés ....................................................................................... 65

a. Mise à jour automatique des graphiques ............................................................ 68

b. Options Graphiques Générales ............................................................................ 71

c. Créer des graphiques Composés/Multiples a partir de graphiques existants ....... 71

d. Fusionner des graphiques pour rechercher un Optimum..................................... 74

e. Personnaliser les graphiques après création........................................................ 75

f. Ajouter/Editer des objets graphiques personnalisés ............................................ 75

g. Personnaliser les composantes d’un graphique ................................................... 78

h. Utiliser les styles graphiques pour les personnaliser ............................................ 84

4. Outils Graphiques Exploratoires.............................................................................. 85

a. Zoom ................................................................................................................... 85

b. Graphiques interactifs, Balayage/Habillage ......................................................... 87

c. Rotation des graphiques en 3D............................................................................ 90

STATISTICA Visual Basic ...................................................................................................... 91

1. Macros d’Analyse. .................................................................................................. 91

2. Filières d’Analyses. ................................................................................................. 92

3. Macros clavier. ....................................................................................................... 92

Personnaliser STATISTICA ................................................................................................... 93

Barre d’Outils ..................................................................................................................... 94

Obtenir de l’Aide ................................................................................................................ 94

Glossaire Statistique ........................................................................................................... 95

Page 6: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

4

Page 7: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

1

1.

A partir de la version 9, la navigation à l’intérieur de l’application est beaucoup plus simple

et intuitive grâce à l’ajout d’un « Ruban », comme dans Office 2007/2010. Les fonctionnali-

tés les plus fréquemment utilisées sont directement visibles, et il est très facile d’accéder aux

autres fonctionnalités. Remarque : les menus et barres d’outils classiques restent accessibles,

et vous pouvez passer d’une interface à l’autre à tout moment.

Pour afficher les menus et barres d’outils classiques, cliquez sur le bouton Menus dans la

barre d’outils d’Accès Rapide, dans l’angle supérieur gauche du ruban.

Pour afficher le ruban STATISTICA, sélectionnez la commande Ruban dans le menu Affi-

chage.

2.

STATISTICA se présente sous la forme de modules, chacun comportant un groupe de procé-

dures statistiques correspondantes. Utilisez le menu Statistiques pour sélectionner les diverses

analyses disponibles dans votre version de STATISTICA.

STATISTICA est multitâches, ce qui vous permet d’ouvrir plusieurs applications de STATIS-

TICA en même temps sur lesquelles vous pouvez exécuter des analyses identiques ou non. En

outre, dans une application STATISTICA, plusieurs analyses peuvent être ouvertes simulta-

nément. Elles peuvent être différentes ou du même type (par exemple, trois Régressions

Multiples et deux ANOVAs). Chacune d’entre elles peut être exécutée sur le même fichier ou

sur des fichiers différents (plusieurs fichiers de données d’entrées peuvent être ouverts simul-

tanément). Toutes les fonctionnalités de base (sur les fichiers de données, les procédures graphiques, et

automatisation) sont disponibles dans chacun des modules et quel que soit le stade de

l’analyse.

Page 8: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

2

Il y a quatre canaux élémentaires de sortie : les classeurs, les rapports, les projets et les fe-

nêtres individuelles.

1.

Les sorties sont par défaut envoyées dans les classeurs. Chaque sortie est stockée dans le

classeur sous forme d’onglet. Les éléments peuvent être organisés hiérarchiquement sous la

forme de dossiers et documents en utilisant un explorateur où les documents individuels et

dossiers ou branches entières de l’arborescence peuvent être manipulés très facilement.

Par exemple, des sélections de documents peuvent être envoyées (en utilisant la fonction co-

pier-déplacer) vers un rapport ou vers l’application pour les afficher sous forme de fenêtres

individuelles. Vous avez la possibilité de déplacer des branches entières vers d’autres clas-

seurs pour construire une organisation particulière de dossiers.

Les classeurs peuvent mettre à jour les gra-

phiques lorsqu’ils sont construits en Mode

Automatique.

De plus, vous pouvez réexécuter l’analyse

depuis le menu contextuel d’un élément du

classeur sans que le bouton d’Analyse ou Gra-

phique ne soit ouvert.

Page 9: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

3

Le classeur STATISTICA facilite l'enregistrement

des documents. Pour cette raison vous pouvez

ajouter divers type d'éléments dans un classeur

tels que des graphiques, des rapports, des ma-

cros, des feuilles de données et des analyses

statistiques de même que des documents Acti-

veX nouveaux ou enregistrés (c'est-à-dire des

documents MS Word ou MS Excel).

En insérant un document Excel, STATISTICA ouvre l’interface d’Excel et vous vous trouvez

dans Excel. Il vous suffit de basculer sur un autre élément du classeur pour se retrouver à

nouveau dans STATISTICA.

Les classeurs STATISTICA offrent un affichage de synthèse :

Une propriété par défaut dans les

classeurs vous permet d'afficher

l'aperçu des feuilles de données

et graphiques contenus dans le

dossier sélectionné ; ces élé-

ments sont affichés dans le volet

de visualisation et apparaissent

les uns à côté des autres.

Les classeurs permettent de vi-

sualiser et d'imprimer le contenu

d'un dossier du classeur dans une

interface conviviale.

Page 10: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

4

2.

Les rapports de STATISTICA et MICROSOFT WORD offrent un moyen plus traditionnel de

gérer les sorties, où chaque objet est affiché séquentiellement dans un document de style trai-

tement de texte. Ce format permet d’insérer des notes et des commentaires mais également de

conserver l’enchaînement de vos sorties, afin de les étudier.

La sortie Rapport inclut et préserve l’enregistrement d’informations supplémentaires, conte-

nant une série détaillée d’options spécifiées au cours des analyses.

Vous pouvez sauvegarder les rapports, feuilles de données et graphiques STATISTICA au

format PDF ( .) via le menu déroulant ou le bouton.

Intégration avec Microsoft Office

• Vous pouvez ouvrir et travailler directement sur des fichiers Microsoft Excel dans STATIS-

TICA (sans avoir à les importer préalablement au format STATISTICA).

• Les documents Microsoft Word constituent un nouveau format pour envoyer les résultats de

vos analyses et graphiques dans un rapport.

• Vous pouvez glisser-déplacer vos graphiques dans des documents STATISTICA ou dans des

documents externes tels que Microsoft Word ou PowerPoint.

Page 11: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

5

3.

Vous avez la possibilité de sauvegarder l'ensemble

de vos données source, de vos résultats (gra-

phiques, feuilles de données, etc...), vos analyses,

et les espaces de travail de STATISTICA Data Mi-

ner actuellement ouverts dans un même projet.

Lors de la prochaine ouverture de STATISTICA,

tous ces éléments seront restaurés exactement tels

qu'ils étaient au moment de l'enregistrement du

projet.

Lors de l'ouverture ultérieure du projet, vous pour-

rez réexécuter et modifier ces analyses.

4.

Enfin, les documents de sortie STATISTICA peuvent aussi être présentés sous forme d’une

liste de fenêtres individuelles pouvant facilement être disposées dans l’espace de travail de

STATISTICA. Cette fonctionnalité permet de créer des documents de référence afin de com-

parer les résultats entre eux.

5.

La Fenêtre du Navigateur STATISTI-

CA utilise la technologie de navigation

Web de StatSoft. Les Fenêtres du Na-

vigateur permettent d'afficher les

rapports HTML de STATISTICA En-

treprise, mais également des interfaces

Web personnalisées qui s'intègrent et

interagissent parfaitement avec STA-

TISTICA.

Page 12: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

6

Le nom du fichier de données s’affiche dans la barre de titre ainsi que le nombre de variables

et le nombre d’observations qu’il comporte. Ci-dessous, le titre du fichier de données est

Characteristics.sta, et il contient 12 variables et 100 observations. Vous remarquerez une pe-

tite étoile (*) à droite de l’extension de fichier “sta” signifiant que ce fichier a été modifié

mais non enregistré avec ces dernières modifications.

Sous la barre de titre, se trouve une ligne correspondant à l’en-tête du fichier, elle donne une

description courte du fichier de données. Double-cliquez dans l’en-tête pour spécifier un

commentaire dans ce champ.

Une information complémentaire sur les données peut être saisie dans la Boîte d’Info, située

dans l’angle supérieur gauche du fichier de données. La boîte d’info est accessible par un

double-clic. Dans le fichier précédent, elle contient les données du 25 décembre 2001.

Les fichiers de données STATISTICA sont organisés en variables et en observations. Les co-

lonnes constituent les variables (correspondant aux champs dans une base de données), et les

lignes constituent les observations (correspondant aux enregistrements dans une base de don-

nées).

Les noms des variables sont détaillés en haut du fichier de données, et les noms des observa-

tions (facultatifs) sont affichés dans la partie gauche du fichier de données. Dans le fichier de

données précédent, le premier nom de variable est SEXE et le premier nom d’observation est

Steve Mc Queen.

Page 13: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

7

1.

Les colonnes et les lignes peuvent subir plusieurs modifications : ajout de variables, dépla-

cement d’observations, recalcul de variables, etc. La plupart des options de modification des

variables et des observations sont accessibles depuis les menus des boutons Va-

riables et Observations de la barre d’outils.

Chaque variable possède un ensemble de propriétés ou spécifications intrinsèques. Cliquez

sur une variable et sélectionnez Spécifications de la Variable, dans le menu du bouton Va-

riables de la barre d’outils, pour afficher la boîte de dialogue de spécification de la Variable.

Le champ Nom contient le nom de la variable, affiché dans l’en-tête de colonne de la feuille

de données.

Le champ Type contient le type de données de la variable.

Le champ Code des VM est utilisé pour spécifier le code des valeurs manquantes pour les cel-

lules vierges ou valeurs spécifiques que vous souhaitez ignorer dans les calculs.

Le champ Longueur, disponible seulement si vous sélectionnez Texte comme type de données

de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-

riable.

Dans le Format d’Affichage, vous pouvez sélectionner un format pour la variable. Quand cer-

tains formats d’affichage sont choisis, une boîte à droite présente la liste des formats

disponibles et compatibles avec le format d’affichage.

Page 14: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

8

La boîte Décimales (disponible seulement lorsque vous sélectionnez Nombre, Scientifique,

Monnaie, ou Pourcentage en tant que format d’affichage) est utilisée pour spécifier le nombre

de décimales à afficher dans la feuille de données.

La boîte Description détaillée est utilisée pour donner une description longue de la variable,

que vous pouvez imprimer avec les résultats statistiques. Elle peut également être utilisée

pour définir une formule dans la feuille de données (à l’aide du Guide des fonctions).

Le filtre automatique (cliquez sur l’option du menu

Données afin d'activer le filtrage de la ou des variables sélectionnées dans votre jeu de don-

nées. Le filtrage constitue une manière simple et rapide d'afficher une partie spécifique des

données dans votre feuille de données sans avoir à trier les données ni créer de sous-

ensemble. Lorsque vous effectuez un filtrage sur une variable, seules les valeurs répondant

aux critères spécifiés apparaissent dans la feuille de données. Les observations qui ne répon-

dent pas aux critères sont masquées à l'affichage sans pour autant être éliminées de la feuille

de données. Bien qu'elles soient masquées, elles demeurent disponibles pour les analyses sta-

tistiques et graphiques.

Page 15: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

9

2.

Qu’est-ce qu’une métadonnées ? Il s’agit d’un ensemble structuré d'informations servant à

décrire une ressource. Décrire une ressource, qu'elle soit sous forme numérique (document

Web, photographie, fichier sonore, etc.) ou non (livre dans une bibliothèque, tableau dans une

galerie d'art, etc.) résulte en une série de données. On appelle "métadonnées" ces données dé-

crivant des données. Si on prend l'exemple d'un livre, il serait pertinent d'y associer des

métadonnées telles que le titre, le nom de l'auteur, le nom de l'éditeur, l'année de publication,

etc. Les métadonnées peuvent permettre d'organiser une collection de ressources (inventaire

interne) et de découvrir des ressources (moteur de recherche). Dans le cadre de recherches,

les métadonnées associées à une ressource peuvent aussi permettre aux utilisateurs de mieux

juger de la pertinence des résultats. En matière de standards de métadonnées sur le Web, on

citera le jeu du Dublin Core, de plus en plus largement utilisé....

Type de symbole : Définit la forme du symbole de point à utiliser pour représenter la

ou les observations respectives. Par exemple, vous pouvez représenter une observa-

tion particulière par une "étoile rouge", et la faire apparaître de cette manière dans

tous vos graphiques.

Couleur du symbole : Définit la couleur du symbole de point à utiliser pour repré-

senter la ou les observations respectives.

Exclure des calculs : Vous pouvez exclure une observation des calculs. Une observa-

tion exclue ne sera pas prise en compte dans les calculs, mais sera toujours

représentée dans les graphiques.

Exclure des graphiques : Vous pouvez exclure une observation des graphiques,

c'est-à-dire, que le point sera toujours utilisé dans les calculs, mais il ne sera plus vi-

sible dans les graphiques.

Étiqueter : Ce statut permet d'étiqueter les observations individuelles dans les gra-

phiques.

Page 16: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

10

Type de mesure (Automatique, Continue,

Catégorielle, Ordinale) : Permet une classifi-

cation automatique des variables dans les

analyses, et éventuellement, de n'afficher au-

tomatiquement que les variables appropriées

(c'est-à-dire, du bon type) dans les listes de

sélection des variables.

Exclure : Permet de ne pas afficher les va-

riables correspondantes (c'est-à-dire les

variables "exclues") dans les listes de sélec-

tion des variables.

Remarque : Dans les cas où certaines variables ne contiennent aucune valeur, ces cellules ap-

paraissent alors comme vierges dans la feuille de données. Ces données manquantes sont

affectées dans la feuille de données d'une valeur réservée (par défaut -999999998 ; cette va-

leur peut être modifiée indépendamment pour chacune des variables). Les valeurs d'une

variable pour laquelle on a affecté ces codes de données manquantes seront ignorées dans

toutes les analyses.

Libellés/Étiquettes : Vous pouvez définir une variable contenant des libellés. Les va-

leurs de cette variable serviront à étiqueter les points dans les graphiques appropriés.

Statut des observations : L'utilisateur peut sauvegarder le statut des observations

dans une variable spécifique.

Propriétés : Vous pouvez dorénavant créer et sauvegarder des champs personnalisés

pour les métadonnées (avec association texte-valeurs) à associer à une variable. Par

exemple, vous pouvez définir la propriété Limite de Contrôle Supérieure pour une va-

riable et lui affecter la valeur 2,6. Une macro STATISTICA Visual Basic (SVB) pourra

alors interroger (requêter) les propriétés de la variable, notamment la propriété Limite

de Contrôle Supérieure" ainsi définie, puis l'appliquer aux Cartes de Contrôle Qualité

basées sur cette variable. De cette manière, vous pouvez appliquer une même macro

SVB sur des données différentes tout en utilisant de façon dynamique les limites de

contrôle et les spécifications appropriées dans vos cartes de contrôle qualité.

Page 17: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

11

3.

Le menu déroulant du bouton Variables de la barre d’outils

contient les opérations de gestion des données les plus cou-

rantes. Chacune des commandes de ce menu par défaut agit

sur la ou les variables actuellement sélectionnées dans la

feuille de données STATISTICA.

Ces opérations comprennent des tâches simples telles que :

ajouter, supprimer, copier, et déplacer des groupes sélection-

nés de variables dans le fichier de données. D’autres

opérations comprennent des transformations des valeurs date,

le re-calcul des formules existantes dans la feuille de données,

le décalage d’une ou de plusieurs variables par rapport au reste

du fichier de données, le rangement des valeurs, la re-

codification d’une variable en utilisant des conditions de sélec-

tion logiques en fonction des autres variables du fichier de

données, et la création d’un sous-ensemble de données.

Note : Vous utilisez la fonction Copier à partir du menu du bouton Variables pour copier plu-

sieurs variables et insérer ces variables dans un autre emplacement du fichier de données.

Cette commande produit différents résultats si vous choisissez la fonctionnalité Copier dispo-

nible dans le menu Édition, qui copie le bloc de données mis en surbrillance vers le Presse-

Papiers. La première copie réalise les opérations sur les variables entières (unités) ; la deu-

xième copie (via le Presse-Papiers) agit seulement sur des blocs de données parmi les

variables. La même logique s’applique pour la commande Supprimer dans ce menu.

Vous pouvez spécifier le type de données de chaque variable dans la boîte de dialogue des

spécifications de la variable (accessible en sélectionnant Spécs de Toutes les Variables depuis

le menu Données). Les fichiers de données STATISTICA acceptent les quatre types de don-

nées élémentaires ci-dessous :

Double est le format par défaut pour stocker les valeurs numériques dans STATISTICA.

Chaque valeur numérique peut avoir une unique valeur-texte qui lui est attribuée. Quand

votre type de donnée est Double, chaque cellule accepte jusqu’à 8 octets de stockage (plus

l’étiquette de texte en option).

Entier est le type de donnée pour sélectionner tous les chiffres. Vous ne pouvez pas entrer de

valeurs numériques contenant des décimales dans une variable de ce type. Chaque valeur

numérique peut avoir une unique valeur-texte qui lui est attribuée. Quand votre type de don-

nées est Entier, chaque cellule supporte jusqu’à 4 octets de stockage (plus l’étiquette de texte

en option). Ainsi, ce type de données offre une façon plus économique de stocker les

nombres et est recommandé pour stocker les entiers des gros fichiers de données.

Octet est le type de données pour les entiers compris entre 0 et 255. Vous ne pouvez pas en-

trer de valeurs numériques contenant des décimales dans une variable de ce type. Chaque

valeur d’octet peut avoir une valeur-texte unique attachée. L’avantage de spécifier Octet

comme type de données est qu’il offre le stockage le plus économique pour des petites va-

Page 18: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

12

leurs entières, puisque chaque cellule accepte jusqu’à 1 octet de stockage seulement (plus la

valeur-texte en option).

Texte est optimisé pour stocker des séquences de caractères de toute longueur. La longueur

d’un champ réservé pour un type de variable texte n’est pas constante et peut être ajustée.

Les spécifications de toutes les variables peuvent être synthétisées ou éditées dans la boîte de

dialogue Spécifications de Toutes les Variables. Une feuille de données de style éditeur appa-

raît en sélectionnant Spécs de Toutes les Variables dans le menu du bouton Variables.

Cette feuille est utile pour compa-

rer ou éditer les spécifications de

plusieurs variables, tout particuliè-

rement lorsque vous souhaitez

utiliser le copier-coller entre les

variables ou mettre en place une

définition de format ou un code de

valeurs manquantes à partir d’une

variable voisine.

Un clic droit dans les Spécifications de Toutes les Variables vous permet d’accéder à un menu

contextuel contenant les commandes suivantes : Ajouter des Variables, Supprimer des Va-

riables, Couper, Copier, Coller, et Remplir/Copier vers le Bas.

c.

Dans de nombreuses applications statistiques, il est utile d’utiliser les valeurs-texte dans

l’aide à l’interprétation de leurs valeurs numériques respectives. Par exemple, dans le fichier

d’entrée, vous pouvez entrer les valeurs 1 et 2 dans la variable SEXE correspondant aux

hommes et aux femmes, respectivement. Ensuite, en utilisant l’Éditeur de Valeurs-Texte (ac-

cessible en sélectionnant Éditeur de Valeurs-Texte du menu Données), vous pouvez affecter à

HOMME la valeur de 1 et pour FEMME la valeur de 2. Quand vous cliquez sur le bouton

OK, tous les 1 de la variable SEXE se changeront automatiquement en HOMME, et tous les 2

en FEMME.

Ci-contre, vous trouverez les va-

leurs-texte de la variable Couleur

des Cheveux : châtains, roux, noirs,

et blonds.

Page 19: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

13

d.

Une manipulation courante des données consiste à recodifier les valeurs d’une variable. Vous

pouvez accomplir cette fonctionnalité facilement avec l’option Recodifier. Sélectionnez Re-

codifier depuis le menu du bouton Variables de la barre d’outils pour afficher la boîte de

dialogue Recodifier les Valeurs de la Variable.

Cette boîte de dialogue est utilisée pour définir les nouvelles valeurs de la variable sélection-

née en fonction des conditions spécifiques. Pour spécifier les conditions, suivez les

conventions de syntaxe standard. Les

conditions de recodification inscrites

ci-dessous “transformeront” les va-

leurs de Taille inférieure à 160 en 1,

les valeurs comprises entre 160 et

175 en 2. Notez que les autres va-

leurs (celles qui ne sont pas

comprises dans les deux conditions)

prennent la valeur 3, comme il est

spécifié par la sélection Valeur dans

le cadre Autre, situé dans l’angle in-

férieur droit de la boîte de dialogue.

Lorsque vous choisissez d'Inclure des observations, la valeur (ou l'intervalle de valeurs) cor-

respondant au(x) numéro(s) d'observation(s) indiqué(s) dans le champ d'édition Catégorie

sera remplacée par la valeur spécifiée dans le cadre Nouvelle Valeur pour la variable concer-

née (reportée dans la barre de titre de la boîte de dialogue). L'option Exclure des observations

permet de remplacer les valeurs initiales des observations qui ne sont pas reportées dans le

champ d'édition par la valeur spécifiée dans le groupe Nouvelle Valeur.

Lorsque vous choisissez l'option Inclure si et que la condition de recodification est vraie, les

valeurs initiales de la variable à recodifier sont remplacées par la Nouvelle Valeur spécifiée,

pour les observations remplissant la condition. L'option Exclure si va affecter la Nouvelle

Valeur aux valeurs initiales des observations ne remplissant pas la condition de recodifica-

tion spécifiée.

Notez que la fonction Recodifier est une opération exécutée une seule fois. Si les valeurs de

Mesure1 changent ou si de nouvelles valeurs sont ajoutées, les valeurs de Mesure2 ne seront

pas mises à jour automatiquement. Toutefois, vous pouvez enregistrer les conditions dans un

fichier *.ini en utilisant le bouton Enregistrer Sous, et ouvrir ce fichier dans le futur en utili-

sant le bouton Ouvrir.

e.

Sélectionner Trier dans le menu Don-

nées pour afficher la boîte de dialogue

des Options de Tri, où vous pouvez

spécifier jusqu’à 7 clés de tri pour trier

les observations du fichier de données.

Page 20: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

14

Le tri peut être réalisé à la fois sur du texte, sur des valeurs numériques, ainsi que sur les

noms d’observations, dans un ordre ascendant ou descendant. STATISTICA triera les observa-

tions selon la Clé 1, puis la Clé 2, etc.

4.

Les commandes du bouton Observations

sont utilisées pour ajouter des Symbole /

Couleur / Exclure des analyses / Exclure des

graphiques / Étiqueter les observations /

Marquer les observations et Réinitialiser

Tout sur des groupes d’observations sélec-

tionnés dans le fichier de données. Une

nouvelle fois, les commandes Copier et Sup-

primer ici sont très différentes des

commandes du même nom du menu Édition.

Les noms des observations peuvent être utilisés comme des identifiants uniques des observa-

tions dans la feuille de données. Ils sont aussi utilisés comme étiquettes par défaut dans de

nombreux graphiques.

Pour saisir des noms d’observations dans la feuille de données, double-cliquez une observa-

tion dans le fond grisé, et tapez le nom souhaité dans le champ. Appuyez sur Entrée de votre

clavier pour vous déplacer sur le nom d’observation suivant.

Le nombre maximum de caractères pour un nom d’observation et la largeur de ce champ

peuvent être ajustés dans la boîte de dialogue Gestionnaire de Noms d’Observations, acces-

sible en sélectionnant Gestionnaire de Noms d’Obs dans le menu du bouton Observations de

la barre d’outils.

De même, les noms d’observations peuvent être transférés depuis une variable particulière

vers les noms d’observations de la feuille de données.

Page 21: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

15

EXEMPLE 1

Commençons par créer un fichier de données. Nous allons saisir des informations pour 18

personnes. La feuille de données contiendra les variables Sexe, la Couleur des Yeux, la Cou-

leur des Cheveux, le Poids, la Taille, et l’Age de chaque personne.

1. Créez un nouveau fichier de données avec 6 va-

riables et 18 observations. Pour cela, sélectionnez

Nouveau dans le menu Fichier pour afficher la boîte de

dialogue Création d’un Nouveau Document. Dans

l’onglet Feuille de Données, saisir 6 dans la boîte

Nombre de variables et 18 dans la boîte Nombre

d’observations. Pour cet exemple, sélectionnez

l’option En fenêtre Indépendante, puis cliquez sur le

bouton OK.

2. Enregistrer la feuille de données. Sélectionnez Enregistrer Sous du menu Fichier pour

afficher une boîte de dialogue classique Enregistrer Sous, et nommez cette feuille de données

vide Information.sta. Cliquez sur le bouton Enregistrer.

3. Donnez aux 6 variables les noms appropriés figurant ci-dessus. Vous pouvez le faire de

plusieurs manières différentes, mais la plus facile serait de sélectionner Spécs de Toutes les

Variables depuis le bouton Variables de la barre d’outils pour afficher les Spécifications de

Toutes les Variables. Dans la colonne Nom, introduisez les 6 noms de variables. Pour vous

déplacer d’une variable à une autre, utilisez les flèches de votre clavier.

4. Changez le type de variable.

Les variables Sexe, Couleur des Yeux et

Couleur des Cheveux contiendront du texte

uniquement, nous pourrions donc utiliser le

type Texte. Cependant comme nous souhai-

tons avoir des valeurs aléatoires et utiliser

la fonction Valeurs-Texte, nous allons uti-

liser le type Double. Vous pouvez le faire

depuis les Spécifications de Toutes les Va-

riables. Cliquez sur le bouton adjacent à

Sexe, et sélectionnez Double dans la liste

déroulante ; faites de même pour la Cou-

leur des Yeux. A présent, cliquez sur le

bouton OK.

5. Saisie des données. Pour cet exemple, effectuons un tirage aléatoire suivant une loi uni-

forme pour obtenir la même probabilité d’obtenir un homme ou une femme. Vous pouvez

écrire la formule de calcul dans le champ Description détaillée de la variable Sexe:

=Trunc(rnd(2))+1. Cette formule génèrera les valeurs entières 1 ou 2.

Page 22: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

16

6. Saisie des modalités de Couleur des Yeux. Admettons que nous ayons observé des yeux

bleus, marrons, et verts. Entrez Bleus, Marrons, et Verts dans les trois premières cellules de la

variable Couleur des Yeux. Ensuite, introduisez la même formule que pour la variable Sexe

mais avec trois valeurs au lieu de deux. Faites de même pour les quatre couleurs de cheveux :

châtains, roux, noirs, et blonds.

7. Colorez les cellules de la variable Sexe. Spécifiez rose pour les cellules contenant les

Femmes et bleu pour les cellules contenant les Hommes. Pour cela, sélectionnez directement,

dans l’éditeur des valeurs-texte, la Couleur de Remplissage des Femmes et des hommes.

Vous pouvez également effectuer un clic droit sur la cellule sélectionnée et sélectionner For-

mat – Cellules à partir du menu contextuel pour afficher la boîte de dialogue Format des

Cellules. Dans l’onglet Police, cliquez sur la flèche sous Couleur du Fond pour afficher une

palette de couleurs, sélectionnez rose, et cliquez sur le bouton OK. Répétez la procédure pour

les cellules contenant les Hommes, en sélectionnant la couleur bleue.

8. Colorez le texte dans les cellules de la variable Couleur des Yeux. Spécifiez la couleur

verte pour le texte dans les cellules contenant le mot Vert. Pour cela, cliquez sur une des cel-

lules, et ensuite cliquez sur la flèche du bouton Couleur de Police de la barre d’outils.

Vous avez également la possibilité d’effectuer un clic droit sur une cellule et de sélectionner

Format – Cellules depuis le menu contextuel pour afficher la boîte de dialogue Format de Cel-

lules. Dans l’onglet Police, cliquez sur la flèche sous Couleur de Police pour afficher une

palette de couleur, sélectionnez la couleur verte, et cliquez sur le bouton OK. Répétez la pro-

cédure pour les autres cellules Vertes de la variable Couleur des Yeux. Vous pouvez

également maintenir la touche CTRL de votre clavier enfoncée tout en cliquant sur chaque

cellule contenant Vert, et ensuite leur appliquer le texte vert en une fois.

9. Enregistrez vos modifications. Même si nous n’avons pas encore terminé la saisie des

données, enregistrez vos changements sur ce fichier de données en sélectionnant Enregistrer

du menu Fichier.

Page 23: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

17

EXEMPLE 2

1. Ouvrir le fichier de données InfoTwo.sta. Notez que ce fichier de données est semblable

celui que vous venez de créer.

2. Entrez des valeurs pour la variable Couleur des Cheveux. Nous avons observé des che-

veux châtains, noirs, roux et blonds. Puisque le type de cette variable est double (par défaut),

les Valeurs-Texte seront affectées aux codes numériques Couleur des Cheveux. Par exemple,

saisissez aléatoirement les couleurs de cheveux dans les 18 cellules de cette variable. Pour

accélérer la saisie des données, vous pouvez utiliser la fonction glisser-déplacer sur une partie

de la variable ou juste copier-coller. Pour afficher les Valeurs-Texte automatiquement affec-

tées à cette variable une fois les données saisies, cliquez sur le titre de la variable une fois, et

ensuite sélectionnez Valeurs-Texte dans le menu du bouton Variables de la barre d’outils pour

afficher la boîte de dialogue Éditeur

de Valeurs-Texte. Par défaut, STA-

TISTICA attribuera le code

numérique 101 à la première valeur-

texte. (Vous pouvez changer ce pa-

ramètre par défaut dans les options

du programme.) Pour cet exemple,

changez ces codes numériques en 1,

2, 3, et 4. Pour cela, tapez simple-

ment un 1 à la place de 101 et

appuyez sur la touche ENTRÉE de

votre clavier. Répétez la procédure

pour les trois autres codes en utili-

sant 2, 3, et 4.

Une fois terminé, cliquez sur le bouton OK. Un message s’affichera vous demandant si les

anciennes valeurs doivent être recodées pour correspondre aux nouvelles valeurs. Cliquez sur

le bouton Oui. Pour afficher les codes numériques de la feuille de données, désélectionnez

Afficher/Masquer les Valeurs-Texte du menu Affichage. Vous pouvez aussi basculer entre

l’affichage des valeurs-texte ou celui des valeurs numériques associées en cliquant sur le bou-

ton Afficher/Masquer les Valeurs-Texte .

3. Créez une variable dynamique qui mettra à jour automatiquement les données dès qu’elles

changent.

Tout d’abord, ajoutez une nouvelle variable après la va-

riable SOMME var 4-6. Pour cela, sélectionnez Ajouter

dans le menu du bouton Variables pour afficher la boîte

de dialogue Ajouter des Variables. Dans la boîte Insérer

après la variable, entrez SOMME var 4-6 ou double-

cliquez dans cette boîte pour afficher la boîte de dia-

logue Sélectionnez la Variable, et sélectionnez la variable

après laquelle elle sera insérée. Dans la boîte Nom, en-

trez Somme Dynamique. Introduisez une formule dans le

champ Description détaillée situé dans le bas de la boîte

de dialogue Ajouter des Variables pour effectuer la

Page 24: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

18

somme des trois variables Taille, Poids, et Age. Toutes ces formules sont équivalentes :

= v4 + v5 + v6

= ‘Taille’ + ‘Poids’ + ‘Age’

= sum (v4:v6)

= sum (’Taille’:’Age’)

Cliquez sur le bouton OK. Changez la valeur 118 de la première observation de Poids en 120.

Remarquez que la valeur pour SOMME var 4-6 n’est pas modifiée, tandis que la valeur de

Somme Dynamique se met à jour. Si elle ne s’est pas changée en 327, sélectionnez Recalculer

dans le menu du bouton Variables de la barre d’outils pour afficher la boîte de dialogue Re-

calculer, et sélectionnez l’option Recalcul automatique des données.

4. Créez une nouvelle variable contenant les codes. Par exemple, si Somme Dynamique est

inférieure ou égale à 300, alors le code A lui est affecté. Si Somme Dynamique est supérieure

à 300, alors le code B lui est affecté. Pour cela, ajouter une nouvelle variable appelée Code à

la fin du fichier de données. Maintenant, sélectionnez Recodifier dans le menu du bouton Va-

riables de la barre d’outils pour afficher la boîte de dialogue Recodifier les Valeurs de la

Variable.

Dans la Catégorie 1, laissez par

défaut Inclure Si dans la première

boîte, et entrez v8 >270 and

v8<289 dans la seconde. Ou vous

pouvez remplacer v8 par ‘Somme

Dynamique’. Entrez A dans la

boîte adjacente à l’option valeur.

Dans la Catégorie 2, laissez par

défaut Inclure Si dans la première

boîte, et entrez v8 > 290 and

v8<300 dans la seconde. Spécifiez

la valeur sur B. Dans la Catégorie 3

notez v8>301 et entrez C dans la

boîte adjacente à l’option valeur.

Cliquez sur le bouton OK.

5. Triez le fichier de données. Arrangez le fichier de données de telle sorte que les femmes

soient présentées en premier et les hommes en second. A l’intérieur de ces deux groupes, triez

les observations de telle sorte que le code A apparaisse en premier, B en second...

Pour cela, sélectionnez Trier les Obser-

vations dans le menu du bouton Obser-

vations pour afficher la boîte de dia-

logue Options de Tri. Dans la Clé 1,

triez en ordre Ascendant Texte sur la

variable Sexe. Dans la Clé 2, triez en

ordre Ascendant Texte sur la variable

Code. Notez que vous pouvez double-

cliquer dans les boîtes Variable pour

sélectionner la variable à utiliser dans

cette clé. Cliquez sur le bouton OK.

Page 25: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

19

6. Réarrangez l’ordre des variables. Déplacez la variable

Code (avec ses informations) pour être en seconde position

dans le fichier de données pour avoir un aperçu plus proche

du choix de tri. Sélectionnez Déplacer dans le menu du

bouton Variables pour afficher la boîte de dialogue Dépla-

cer des Variables. Double-cliquez dans les cadres de cette

boîte de dialogue pour afficher la boîte de dialogue Sélec-

tionnez la Variable, qui vous permet de sélectionner la variable à déplacer. Insérez la variable

Code après Sexe. (Les options De la variable et A la variable vous permettent de déplacer une

étendue de variables en une seule fois).

7. Rangez les variables. Rangez les sujets en fonction de leur âge de 1 à 18 avec le sujet le

plus jeune ayant le rang le plus faible. Tout d’abord, ajoutez une nouvelle variable appelée

Rang après la variable Age. Ensuite, copiez les valeurs de la variable Age dans le Presse-

Papiers et collez-les dans la variable Rang. Sélectionnez Affecter des Rangs dans le menu du

bouton Variables pour afficher la boîte de dialogue Ranger des Valeurs. Cliquez sur le bouton

Variables et sélectionnez Affecter des Rangs. Dans Assigner le rang 1 à sélectionnez l’option

plus petite valeur (sujet le plus jeune). Conservez tout le reste par défaut et cliquez sur le bou-

ton OK. Maintenant vous pouvez comparer les rangs aux valeurs des données brutes qui se

trouvent toujours dans la variable Age. Le sujet le plus jeune est âgé de 20 ans.

8. Enregistrez les modifications. Sélectionnez Enregistrer dans le menu Fichier.

Page 26: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

20

5.

Il vous permet de sélectionner les variables servant à

distinguer les observations (c'est-à-dire les variables

utilisées comme critères de différentiation entre deux

lignes du fichier de données ou enregistrements d'une

base de données) et de déterminer le format de la

feuille de données produite (sans doublons). Remarque

: vous pouvez utiliser un nombre illimité de combinai-

sons de variables pour spécifier les doublons.

Les options de cette boîte de dialogue vous permettent

de spécifier les critères pour déterminer les variables

et/ou les observations éparses (% de données man-

quantes toléré par colonne ou ligne).

Les options de cette boîte de dialogue vous permettent

de spécifier les critères pour déterminer les variables

qui sont invariantes tel que l'écart-type relatif (Écart-

type/X-barre) minimum à utiliser pour déterminer les

variables invariantes.

Les options de cette boîte de dialogue vous permet-

tent de détecter et remplacer les points atypiques

dans la feuille de données d'entrée.

Les options de cette boîte de dialogue vous permet-

tent de définir les valeurs manquantes des variables

sélectionnées et de leur affecter de nouvelles va-

leurs.

Page 27: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

21

Les options de cette boîte de dialogue vous permettent

de spécifier les paramètres de l'algorithme des k plus

proches voisins et de procéder au remplacement des va-

leurs manquantes à l'aide de cet algorithme.

Cette boite de dialogue vous permet de remplacer de façon per-

manente les valeurs manquantes des variables sélectionnées par

les moyennes des variables respectives.

6.

La façon la plus rapide, et dans beaucoup de cas la plus facile, d’accéder aux fichiers de don-

nées depuis d’autres applications Windows est d’utiliser le Presse-Papiers. STATISTICA

supporte des formats de données spéciaux dans le Presse-Papiers générés par des applications

telles que Microsoft Excel. Par exemple, STATISTICA interprète proprement les cellules for-

matées (telles que 27/04/2007 ou 10 €) et les valeurs-texte, y compris des formatages étendus

de cellules.

Les fichiers de données issus

d’une large variété

d’applications Windows et

Non-Windows sont acces-

sibles et traduits en format

STATISTICA (.sta) en utili-

sant les outils d’importation

de fichier. L’importation

commence en sélectionnant

Ouvrir dans le menu Fichier.

Page 28: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

22

Une variété de fichiers est disponible dans la liste déroulante Type (documents STATISTICA,

Excel, dBASE, SPSS, SAS, Jump, Minitab, Lotus/Quattro, Text, HTML, et fichiers RTF).

Après avoir sélectionné le fichier à ouvrir dans STATISTICA, vous pouvez spécifier la façon

exacte de réaliser le transfert. Par exemple, quand vous voulez ouvrir un fichier Excel, STATIS-

TICA vous demande s’il doit Importer toutes les feuilles dans un classeur STATISTICA ou

Importer une feuille particulière dans une feuille de données.

ou des fichiers *.txt

Ensuite, vous pouvez spécifier l’étendue du fichier de données (inconnue au départ) à impor-

ter et décider quelles observations et noms d’observation importer.

Cette possibilité de spécifier les détails de

l’importation est un avantage par rapport

au Presse-Papiers. De plus, vous pouvez

accéder à des types de fichiers non acces-

sibles ou difficilement accessibles par les

opérations du Presse-Papiers.

Page 29: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

23

7.

Vous pouvez fusionner soit des observa-

tions (lignes de la feuille de données) soit

des variables (colonnes de la feuille de

données). En d'autres termes, vous pouvez

ajouter le second fichier "en dessous" du

premier, ou "à droite" du premier.

Fusion relationnelle de variables. Lorsque vous sélectionnez ce mode de fusion, les observa-

tions du second fichier sont associées à celles du premier fichier, sur la base des valeurs

prises par la variable-clé spécifiée.

Fusion relationnelle hiérarchique de variables. Ce mode opératoire diffère du mode rela-

tionnel simple décrit ci-dessus au niveau de la gestion des enregistrements multiples associés

à une clé unique dans le fichier principal ou secondaire. En mode relationnel simple (voir ci-

dessus), les différents enregistrements associés à une même valeur de la clé de fusion sont

fusionnés. Si les deux fichiers ne possèdent pas le même nombre d'enregistrements pour une

même clé, des valeurs manquantes seront ajoutées pour "compléter" le fichier possédant le

moins d'enregistrements. Par opposition, en mode relationnel hiérarchique, le fichier est

complété avec les valeurs rencontrées dans le dernier enregistrement associé pour une clé

identique.

8.

STATISTICA propose une fonctionnalité permettant à l’utilisateur d’échantillonner aléatoire-

ment le fichier de données de façon à créer un sous-ensemble de données pour l’analyse. Pour

cela, sélectionnez Sous-ensemble/Échantillonnage aléatoire dans le menu Données. Des sous-

ensembles de données peuvent être créés selon un échantillonnage aléatoire simple et systé-

matique.

Pour réaliser un échantillonnage aléatoire simple, vous

disposez de deux choix pour créer le sous-ensemble : il

peut s’agir soit d’un pourcentage de la feuille de don-

nées originale, soit d’un nombre approximatif

d’observations. Ainsi, vous pouvez choisir d’effectuer

un échantillonnage avec remise et d’utiliser des pondé-

rations d’observations provenant d’une feuille de

données précédemment utilisée.

Pour un échantillonnage aléatoire systématique, votre

sous-ensemble est collecté toutes les kiémes

observa-

tions dans le fichier de données. Par exemple, si vous

entrez 5 dans la boîte K=, STATISTICA sélectionnera

aléatoirement une observation parmi les cinq pre-

mières observations puis va extraire chaque cinquième

observation après la première observation sélectionnée

pour créer le sous-ensemble.

Page 30: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

24

9.

La logique générale ou la restructuration des données est similaire à un tableau croisé des va-

leurs (selon certaines variables catégorielles), et ce type d'opérations est également appelé un

tableau croisé (restructuration) des données (même si cette opération spécifique ne se limite

pas à des effectifs, et si cette application n'est pas l'une des plus fréquentes).

Ces opérations s'appliquent généralement lors de l'accès à des données d'une base de données,

où les valeurs individuelles sont identifiées par des identifiants d'observations et de variables,

et où chaque combinaison distincte de ces identifiants est reportée sur une nouvelle ligne du

fichier de données

- Il est possible d'intercaler des résultats lors de l'empilage.

- Au cours de l’empilement, les variables désempilées peuvent être incluses/exclues des ré-

sultats.

- Pendant le désempilement, des options permettent de gérer plusieurs valeurs d'analyse croi-

sée dans les requêtes d'analyse croisée.

Page 31: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

25

10.

Outre les fonctions d’importation de fichier décrites ci-dessus, STATISTICA propose un accès

à la plupart des bases de données (y compris les bases de données sur gros systèmes telles

que Oracle, Sybase, etc.) via STATISTICA Query, accessible depuis le menu Fichier – Don-

nées Externes.

STATISTICA Query est compatible avec de multiples tables de bases de données, dans les-

quelles des enregistrements spécifiques (lignes de tables) peuvent être sélectionnées en

entrant des instructions SQL. STATISTICA Query construit automatiquement l’instruction

SQL, en fonction des composantes de la requête définies en utilisant l’interface graphique

simple et/ou les boîtes de dialogue et menus optionnels intuitifs. De nombreuses requêtes ba-

sées sur une ou plusieurs bases de données différentes peuvent également être créées pour

restituer les informations dans une feuille de données individuelle. Ainsi, vous pouvez main-

tenir des connexions vers de multiples bases de données externes, simultanément, via un

DSN.

ODBC permet de relier un client à une base de données en déclarant une source de données

(correspondant généralement à une base de données) dans le gestionnaire ODBC (commu-

nément appelé administrateur de source de données ODBC). La source de données peut être

aussi bien une base de données qu'un fichier Access, Excel ou tout autre type de fichier.

On appelle DSN (Data Source Name) la déclaration de la source de données qui sera acces-

sible par l'intermédiaire de ODBC depuis le menu Démarrer/Paramètres/Panneau de

Configuration/Outils d’administration/Sources de données de votre Windows.

Le DSN fournit d'importantes informations relatives à votre base de données, y compris le

chemin pour y accéder ou le pilote OBDC à utiliser. Créer un DSN pour une base de données

est facile, par le biais d'un tableau de commande ODBC.

Page 32: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

26

L'administrateur de source de données ODBC (parfois appelé ODBC32 bits), disponible dans

le panneau de configuration, permet de déclarer le type de données auquel il est possible d'ac-

céder et de lui associer un nom. L'onglet DSN système permet de voir la liste des DSN déjà

installés sur le système :

La création et la configuration d'un DSN (Data source Name - Nom de sources de données)

sont gérées par l'administrateur ODBC. Ils sont de trois types possibles. Ce type est défini

lors de la création de DSN et entraîne certaines propriétés et limites :

DSN Utilisateur : Cette source de données n'est utilisable qu'à partir de la machine sur la-

quelle elle a été définie. Elle est disponible seulement pour l'utilisateur qui l'a créée.

DSN Système : Cette source de données est visible pour tous les utilisateurs accédant direc-

tement ou par réseau à la machine, y compris les services NT.

Différences entre un DSN système et un DSN Utilisateur :

La seule différence entre un DSN système et un DSN Utilisateur est que l'information relative

à un DSN Utilisateur est rangée dans le dossier HKEY_USERS de la base de registre de

Windows, tandis que l'information sur un DSN Système est rangée dans le dossier

HKEY_LOCAL_MACHINE.

DSN Fichier : Cette source de données peut être partagée par plusieurs utilisateurs qui dispo-

sent du DRIVER ODBC concerné.

Pour déclarer une source de données il faut :

créer les données (créer une ou plusieurs tables dans une base de données ou bien

créer un fichier Excel ou Access)

installer le driver ODBC pour la base de données si celle-ci n'est pas installée par dé-

faut sous l'administrateur de source de données

Page 33: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

27

Etablir la liaison ODBC dans l'onglet DSN système de l'administrateur de source de

données, en cliquant sur Ajouter... puis en sélectionnant le type de driver à utiliser.

L'administrateur de base de données va ensuite demander le nom à affecter à la source

de données (Il s'agit du nom par lequel la base de données sera accessible), puis de sé-

lectionner la source de données (un fichier dans le cas d'Excel ou Access, ou bien la

base de données et éventuellement les tables à associer à la liaison ODBC).

Il faut ensuite indiquer le chemin d'accès à la base de données en cliquant sur le bou-

ton Sélectionner de la fenêtre précédente.

La base de données devrait alors être accessible via ODBC.

Page 34: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

28

11.

STATISTICA peut exporter des fichiers de

données vers de nombreuses applications

Windows et Non-Windows en utilisant

les fonctions d’exportation de fichier.

Pour exporter, sélectionnez Enregistrer

Sous dans le menu Fichier pour afficher

la boîte de dialogue Enregistrer Sous.

Une grande variété de fichiers est disponible dans la liste déroulante type (Feuilles de don-

nées STATISTICA, matrice STATISTICA, Excel, dBASE, SPSS Portable, Lotus, Quattro

Pro/DOS, Text, HTML, et Fichiers STATISTICA 5).

Après avoir sélectionné le type de fichier auquel en-

registrer la feuille de données, vous pouvez spécifier

la façon exacte de réaliser le transfert.

Par exemple, si vous l’enregistrez dans une feuille

Excel, vous devez décider de l’ordre du fichier de

données et de l’exportation ou non des noms de va-

riables, des noms d’observations, et des valeurs-texte.

12.

Depuis le menu Outils, vous pouvez accéder à la boîte de dialogue Options, contenant 17 on-

glets. Outre les options générales et d’affichage, ces onglets contiennent des options pour les

rapports, les fichiers de données, les listes personnalisées, les classeurs, les macros, les ana-

lyses/graphiques, l’importation, STATISTICA Data Miner, le gestionnaire de sortie, etc...

Page 35: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

29

L’onglet Généralités comporte des options pour modifier les paramètres par défaut de STA-

TISTICA : apparence de STATISTICA au démarrage, avertissements, calcul des centiles,

répertoire du fichier, et options d’enregistrement automatique.

L’onglet Analyses/Graphiques comporte des options générales d’analyses et de graphiques

ainsi que le Gestionnaire de Sorties qui comporte diverses options pour orienter les sorties

vers des fenêtres individuelles, des classeurs ou des rapports.

Utilisez l’onglet Feuilles de données pour contrôler diverses options de navigation et

d’édition d’une feuille de données.

L’onglet Graphs comporte des options pour ajuster les marqueurs de points, de lignes, les

couleurs des graphiques et comporte des options pour personnaliser les aspects des tracés.

Utilisez l’onglet Classeurs pour spécifier les proportions d’affichage, contrôle des onglets, et

autres options de classeurs par défaut.

L’onglet Macros comporte des options pour éditer les polices, les couleurs, et les avertisse-

ments de scripts SVB.

L’onglet Rapports comporte des options pour modifier l’impression, exportation, et taille des

objets placés dans un rapport.

L’onglet Data Miner comporte des options de personnalisation de projets de STATISTICA Da-

ta Miner.

L’onglet IDBD permet d'accéder à diverses options permettant de configurer les opérations de

la composantes (facultative) IDBD (Interface Directe avec les Bases de Données) de STATIS-

TICA, permettant d'accéder directement à des bases de données distantes sans avoir à

importer préalablement les données ni à les enregistrer dans des fichiers de données STATIS-

TICA sur votre ordinateur en local

L’onglet Configurations comporte des options pour créer, gérer, et modifier des configura-

tions séparées de STATISTICA.

L’onglet Listes Personnalisées comporte des options pour créer ou supprimer des listes per-

sonnalisées.

L’onglet Importation comporte des options d’importation depuis les fichiers Excel, Texte, et

HTML.

L’onglet Serveur/Web permet de paramétrer l’intégration avec WebSTATISTICA Serveur ainsi

que les options des documents de la Fenêtre du Navigateur.

Page 36: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

30

Plusieurs types d’analyses statistiques de

base sont disponibles dans la boîte de dia-

logue Statistiques Élémentaires, accessible

en sélectionnant Statistiques Élémentaires du

menu Statistiques.

Pour les démonstrations suivantes, le fichier

de données Characteristics.sta sera utilisé.

Les sorties seront envoyées dans un classeur.

Si vous souhaitez que votre sortie s’affiche

dans un classeur automatiquement, sélection-

nez les Options du menu Outils pour afficher

la boîte de dialogue Options. Sélectionnez

l’onglet Gestionnaire de Sorties, et sélection-

nez les boutons Classeur et Un seul Classeur

(commun à toutes les Analyses/graphiques).

Ensuite cliquez sur le bouton OK pour fermer

la boîte de dialogue.

Sélectionnez Statistiques Descrip-

tives pour afficher la boîte de

dialogue des Statistiques Descrip-

tives.

La boîte de dialogue d’analyse est structurée de telle sorte que des fonctions logiques soient

regroupées dans des onglets pour une navigation plus facile, ainsi qu’une sélection des procé-

dures et des graphiques fréquemment utilisés pour décrire vos données.

1.

Cliquez sur le bouton Variables pour afficher une

boîte de dialogue de sélection de variables, contenant

une liste de toutes les variables disponibles dans le

fichier de données. Vous pouvez y sélectionner les

variables à analyser. La sélection des variables peut

être consécutive, en sélectionnant la première va-

riable avec le pointeur de la souris puis en déplaçant

Page 37: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

31

le pointeur jusqu’à la dernière variable à sélectionner. Vous pouvez aussi sélectionner une

liste discontinue de variables en maintenant la touche CTRL de votre clavier et tout en cli-

quant sur les variables désirées. Une troisième technique de sélection des variables est de

renseigner les numéros des variables dans le champ Variables.

Une fois la sélection des variables effectuée, cliquez sur le bouton Synthèse pour produire

une feuille de données des résultats avec une sélection de statistiques par défaut.

Par défaut, N Actifs, Moyenne, Minimum, Maximum, et Écart-type sont affichés (pour les dé-

finitions de ces statistiques, voir le glossaire). Une sélection plus complète de statistiques

descriptives est disponible dans l’onglet Avancé. Dans cet onglet, vous pouvez contrôler pré-

cisément les statistiques qui sont calculées et affichées dans la feuille de données.

2.

Toutes les analyses et les graphiques de STATISTICA permettent dorénavant de répéter une

analyse spécifique pour chaque modalité (valeur) distincte des variables 'Par Groupe'. Par

exemple, vous pouvez spécifier des Statistiques décomposées sur les tailles, poids et age se-

lon les couleurs de cheveux et calculer les résultats de façon indépendante pour chaque sous-

ensemble d'observations défini par les différentes modalités d'une variable Sexe (par

exemple, Homme et Femme).

Page 38: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

32

3.

Des statistiques pour

chaque ligne ou colonne

d’un bloc sélectionné peu-

vent être calculées et

ajoutées à la fin de la

feuille de données en sé-

lectionnant les Statistiques

de Blocs souhaitées à par-

tir du menu contextuel.

4.

De nombreux tests élémentaires de significativité statistique se basent sur l’hypothèse de

normalité en fonction des données utilisées pour le test. L’onglet Normalité de la boîte de dia-

logue Statistiques Descriptives contient la plupart des outils servant à vérifier les hypothèses

de normalité. Ces outils sont les tables de fréquences, les histogrammes avec ajustement

normal, et les tests statistiques de normalité.

EXEMPLE 3

1. Sélectionnez Ouvrir du menu Fichier. Parcourir le répertoire C:\Program files\StatSoft\

STATISTICA 10\Examples\Fichiers de données et sélectionnez Characteristics.sta.

2. Sélectionnez Statistiques Élémentaires du menu Statistiques. Sélectionnez Statistiques

Descriptives et cliquez sur le bouton OK.

3. Cliquez sur le bouton Variables et sélectionnez les variables 4-8. Cliquez sur le bouton

OK.

4. Cliquez sur le bouton Synthèse de la boîte de dialogue Statistiques Descriptives pour af-

ficher les statistiques descriptives des variables sélectionnées par défaut.

Page 39: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

33

5. Reprenez l’analyse en cliquant sur le bouton Statistiques Descriptives dans la barre Ana-

lyse dans l’angle inférieur gauche de l’écran. Cliquez sur le bouton Histogrammes pour

produire un histogramme avec un ajustement normal pour chaque variable sélectionnée.

6. Reprenez l’analyse et cliquez sur l’onglet Avancé. Sélectionnez uniquement les statis-

tiques suivantes : Dans Position, N actifs, sélectionnez Moyenne ; dans Dispersion,

moments, sélectionnez Asymétrie et Aplatissement ; dans Centiles, étendues, sélectionnez

Minimum & maximum et Étendue. Puis, cliquez sur le bouton Variables pour re-

sélectionner uniquement les variables Taille (cm), Poids(kg), et Age (an).

7. Cliquez sur le bouton Synthèse pour afficher les calculs sélectionnés.

Notez l’asymétrie positive (0.59) pour la variable Age. Comparez cela avec l’histogramme

pour Age réalisé précédemment dans cet exemple. L’asymétrie positive indique que les don-

nées dévient vers la droite.

Page 40: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

34

8. Pour étudier plus en avant la distribution d’une variable, vous pouvez réaliser la droite de

Henry. Créez ce type de tracé pour les trois variables choisies en reprenant l’analyse et en

cliquant sur l’onglet Nuages de points/probas. Cliquez sur le bouton Droite de Henry.

Trois tracés seront

placés dans le clas-

seur, un tracé par

variable sélectionnée.

Notez que Age (an)

est la variable qui

dévie le plus de la

distribution Normale

par rapport aux va-

riables Taille (cm) et

Poids (kg).

9. Etudions la robustesse des don-

nées par l’onglet du même nom

et sélectionnez les 3 options à co-

cher Moyenne tronquée, Moyenne

winsorisée et Test de Grubbs.

5.

La corrélation est une mesure de la relation entre plusieurs variables. Les échelles de mesures

utilisées sont des échelles d’intervalles. Les coefficients de corrélation sont compris entre -

1.00 et +1.00. La valeur de -1.00 représente une parfaite corrélation négative alors qu’une

valeur de +1.00 représente une parfaite corrélation positive. Une valeur de 0.00 représente

une absence de corrélation ou indépendance.

Page 41: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

35

EXEMPLE 4

1. Utilisez à nouveau le fichier de données Characteristics.sta. Sélectionnez Statistiques

Élémentaires du menu Statistiques pour afficher la boîte de dialogue des Statistiques

Élémentaires. Ensuite, sélectionnez les Matrices de Corrélations et cliquez sur le bouton

OK pour afficher la boîte de dialogue des Matrices de Corrélations.

2. Il y a deux formes générales pour

l’analyse de la corrélation : la matrice

carrée (toutes les variables dans une

liste seront corrélées entre elles) et la

matrice rectangulaire (les variables

d’une première liste sont croisées

avec les variables d’une seconde

liste). Cliquez sur le bouton 1 liste de

variables et sélectionnez les variables

4 à 11. Cliquez sur le bouton OK.

3. Cliquez sur le bouton Synthèse pour produire les résultats. Notez qu’une partie de la ma-

trice est présentée ci-dessous.

Si l'option Description détaillé des variables est sélectionnée, le fait de cliquer sur le bouton

Synthèse produira un tableau détaillé des résultats (et non une matrice). Ce tableau ne com-

portera non seulement les coefficients de corrélations mais aussi les moyennes par couple, les

écarts-types par couple, les pondérations de la régression, les ordonnées à l'origine, et autres

statistiques de la régression.

4. Dans la feuille de résultats par défaut, les coefficients de corrélation sont affichés. Cli-

quez sur l’onglet Options. Sélectionnez le bouton Corrélations, niveaux p, et N. Cliquez

sur le bouton Synthèse.

Page 42: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

36

La plus forte corréla-

tion r (en amplitude)

existe entre l’Age (an)

et Poids (kg) avec

r = -0.2573. Cette cor-

rélation est négative

indiquant ainsi que

lorsqu’une variable

décroît, l’autre variable

augmente. Elles ont

une relation inverse.

5. Vous pouvez représenter graphiquement les relations entre ces variables avec l’option

Matrice dans la boîte de dialogue des Matrices de Corrélations. Etudier une matrice de

nuages de points est une bonne technique exploratoire pour identifier les points atypiques

qui vont dévier la droite de régression d’un côté ou de l’autre. En d’autres termes, les

points aberrants (atypiques, observations peu fréquentes) peuvent avoir une influence ma-

jeure sur la pente de la droite

de régression et le coefficient

de corrélation correspondant.

Les points atypiques peuvent

artificiellement augmenter la

valeur du coefficient de cor-

rélation, ou peuvent diminuer

la valeur d’une corrélation

“légitime”. Reprenez

l’analyse. Dans l’onglet

Avancé/Tracé, cliquez sur le

bouton Nuage matriciel. Sé-

lectionnez toutes les variables

et cliquez sur le bouton OK.

Le test t est la méthode la plus fréquemment utilisée pour évaluer les différences de

moyennes entre deux groupes. Le test suppose que les données suivent une distribution nor-

male à l’intérieur de chaque groupe, et que la variance intra-groupe est du même ordre entre

les deux groupes. Les niveaux alpha, valeurs p, variances, écart-types et autres termes sont

importants quand on parle des tests t. Vous pouvez vous référer au glossaire et à différents

ouvrages de statistiques élémentaires pour vous informer sur ces termes. Dans les Statistiques

Élémentaires quatre tests t différents vous sont proposés. Ce chapitre vous expliquera quel

test utiliser selon l’analyse.

1.

Lorsqu’une variable comporte deux groupes, et qu’une seconde variable comporte les me-

sures dépendantes, il est plus approprié de choisir un test t par groupes.

Page 43: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

37

EXEMPLE 5

1. Ouvrez le fichier de données Characteristics.sta. Sélectionnez les Statistiques Élémen-

taires depuis le menu Statistiques pour afficher la boîte de dialogue des Statistiques

Élémentaires. Ensuite, sélectionnez Test t pour Éch. indépendants par groupes et cliquez

sur le bouton OK pour afficher la boîte de dialogue Test T pour Éch. Indépendants par

Groupes.

2. Cliquez sur le bouton Variables, sélectionnez Taille (cm) comme variable dépendante, et

sélectionnez Sexe comme variable de classement. Cliquez sur le bouton OK.

3. Cliquez sur le bouton Synthèse pour afficher les résultats du test t.

Notez que plusieurs statistiques sont données dans cette feuille de résultats. Déplacez-vous

vers la droite de la feuille de données pour visualiser tous les résultats.

Le test t compare la moyenne de l’échantillon femme (x-barre = 172,72) à celle de

l’échantillon homme (x-barre = 172,18). Il calcule une valeur de t, accompagnée de sa valeur

p correspondante, pour que l’utilisateur puisse évaluer et décider si les moyennes sont signifi-

cativement différentes les unes des autres. Dans cet exemple, avec une valeur de p importante

de 0.769, nous pouvons conclure que les moyennes ne sont pas différentes les unes des

autres. Le groupe des femmes est similaire au groupe des hommes sur la variable Taille (cm).

Le Sexe n’a pas d’effet sur la Taille.

Les intervalles de confiance des estimations sont désormais disponibles dans ces tests.

Page 44: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

38

2.

Lorsque les deux groupes à comparer se trouvent dans des variables séparées, il est plus ap-

proprié de choisir un test t par variables.

EXEMPLE 6

1. Ouvrez le fichier de données Characteristics.sta, sélectionnez les Statistiques Élémen-

taires dans le menu Statistiques. Puis sélectionnez test t pour Éch. Indépendants par

variables et cliquez sur le bouton OK.

2. Cliquez sur le bouton Variables (groupes) et sé-

lectionnez Bien Etre 1 comme première variable

et Bien Etre 2 comme seconde variable. Cliquez

sur le bouton OK.

3. Cliquez sur le bouton Synthèse pour afficher les résultats du test t.

Une nouvelle fois, STATISTICA a comparé la moyenne du Groupe 1 à la moyenne du Groupe

2. La valeur de p est nulle. Puisque la valeur p est inférieure à Alpha seuil de significativité,

vous pouvez conclure qu’il y a une différence significative entre Bien Etre 1 et Bien Etre 2.

3.

Le test t pour des échantillons appariés vous aide à tirer parti d’un type de plan spécifique

dans lequel une source de variation intra-groupe importante peut facilement être expliquée. Si

les deux groupes à comparer étaient mesurés deux fois sur la même variable, alors une partie

considérable de variation intra-groupe pourrait être attribuée aux différences individuelles

entre les mesures sur les mêmes sujets. Pour l’illustrer, suivez l’exemple suivant.

EXEMPLE 7

1. Ouvrez le fichier de données Characteristics.sta, sélectionnez Statistiques Élémentaires

depuis le menu Statistiques. Sélectionnez test t pour échantillons appariés et cliquez sur

le bouton OK.

2. Cliquez sur le bouton Variables et sélec-

tionnez Test Élément 1 comme première

variable et Test Élément 2 comme deu-

xième variable. Cliquez sur le bouton OK.

Page 45: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

39

3. Cliquez sur le bouton Synthèse pour voir les résultats du test t.

Nous considérons que Test Élément 1 a été mesuré sur 100 sujets à un instant t et ensuite

Test Élément 2 a été mesuré sur les mêmes 100 sujets, dans les mêmes circonstances,

mais à un instant t différent. Y a-t-il une différence entre les deux variables ? Avec une

valeur de p qui est nulle, vous démontrez qu’il existe bien une différence entre Test Élé-

ment 1 et Test Élément 2.

4. Reprenez l’analyse. Cliquez

sur le bouton Boîtes à Mous-

taches pour représenter

graphiquement la différence

que vous venez de démontrer

entre les deux variables.

4.

En utilisant le test t pour comparer une moyenne à un standard, vous pouvez comparer la

moyenne d’une variable particulière à une valeur spécifique. Illustrons-le par un exemple.

EXEMPLE 8

1. Ouvrez le fichier de données Characteristics.sta, sélectionnez les Statistiques Élémen-

taires depuis le menu Statistiques. Sélectionnez Comparer une moyenne à un standard et

cliquez sur le bouton OK.

2. Cliquez sur le bouton Variables et sélectionnez Poids (kg) comme variable de l’analyse.

Cliquez sur le bouton OK.

Page 46: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

40

3. Sélectionnez l’option Comparer toutes les

moyennes à et entrez 100 dans la boîte ad-

jacente. Vous allez tester si la moyenne des

Poids (kg) diffère significativement de 100

kilos.

4. Cliquez sur le bouton Synthèse pour voir les résultats du test t.

Avec une valeur p qui est nulle, vous pouvez conclure que la moyenne des Poids (kg), qui

est de 83,9, est significativement différente de 100.

5. Reprenez l’analyse. Cliquez sur

le bouton Boîtes à moustache.

Sélectionnez Moyenne/Écart-

Type/1.96*Écart-Type dans la

boîte de dialogue Type de

Boîtes à Moustache. Cliquez sur

le bouton OK pour créer le tracé.

Les moustaches dans ce tracé

affichent un intervalle de con-

fiance à 95% autour de la

moyenne. Notez que la valeur

100 n’est pas comprise dans

l’intervalle délimité par les

moustaches.

Page 47: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

41

Le module Décompositions et ANOVA à 1 facteur calcule diverses statistiques descriptives

décomposées par groupes (par exemple, par sexe et par groupe d’âge). Précisément, vous

pouvez calculer – décomposer par groupes – diverses statistiques descriptives, matrices de

corrélations, graphiques de synthèse, et davantage. Avec cette analyse, vous pouvez aussi réa-

liser des ANOVA complètes à 1 facteur, et disposer des tests d’homogénéité des variances et

des statistiques post-hoc des différences de moyennes.

Les décompositions sont classiquement utilisées comme technique exploratoire de données.

La question type qui se pose est : Est-ce que les groupes sont différents en fonction de la va-

riable dépendante ? Les différences de moyenne peuvent être étudiées avec la méthode

ANOVA d’ordre Un. Les différences de variance peuvent être étudiées par les tests

d’homogénéité de variances. De plus, l’onglet Tests Post-hoc de la boîte de dialogue des ré-

sultats propose les techniques de comparaison les plus connues.

EXEMPLE 9

1. Nous allons utiliser à nouveau le fichier de données Characteristics.sta. Sélectionnez Sta-

tistiques Élémentaires depuis le menu Statistiques, puis Décompositions & ANOVA à 1

Facteur dans les Statistiques Élémentaires, et cliquez sur le bouton OK.

2. Dans la boîte de dialogue des Statistiques par Groupes (Décompositions), sélectionnez

l’onglet Listes de tables, et cliquez sur le bouton Variables de Classement. Pour la Liste1

sélectionnez Sexe, pour la Liste2 sélectionnez Couleur des Yeux, et pour la Liste3 sélec-

tionnez la Couleur des Cheveux.

3. Cliquez sur le bouton OK. Cliquez sur le bouton Variables Dépendantes. Sélectionnez les

variables Taille (cm) et Âge et cliquez sur le bouton OK.

Page 48: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

42

4. Dans l’onglet Liste des tables, sélectionnez Sommes, Variances, Écarts-types, Min & max

et N dans le cadre Statistiques. Dans les Tableaux de Sortie, sélectionnez seulement

Tables de Synthèse des moy. Cliquez sur le bouton Synthèse.

Notez que la table est décomposée en 24 combinaisons (2 sexes x 3 couleurs des yeux x 4

couleurs des cheveux = 24) et est associée aux statistiques requises pour chacune.

5. Reprenez l’analyse. Cliquez sur

l’onglet Tables individuelles. Cli-

quez sur le bouton Variables.

Sélectionnez Taille (cm) et Âge

comme Variables Dépendantes et

Couleur des Cheveux comme Va-

riables de Classement. Cliquez

sur le bouton OK.

6. Vous pourrez cliquer sur le bouton Codes des variables de classement pour sélectionner certains niveaux

des variables de groupe pour

l’analyse, par exemple, juste les

couleurs de cheveux roux et noir.

Si vous ne cliquez pas sur ce bou-

ton, et cliquez sur le bouton OK,

STATISTICA sélectionnera tous les

codes par défaut de la variable de

classement. Pour cet exemple, inu-

tile de cliquer sur le bouton Codes des variables de classement puisque nous les voulons tous, donc

cliquez sur le bouton OK. La boîte

de dialogue Statistiques par Groupe

- Résultats s’affichera.

Page 49: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

43

7. Cliquez sur le bouton Synthèse pour afficher la table des statistiques par défaut. (Notez

qu’une seule partie du classeur est présentée ci-dessous.) Souvenez-vous que cette ana-

lyse ignore le sexe et la couleur des yeux ainsi que les autres variables du fichier de

données. Seules les variables Taille (cm), Âge et Couleur des Cheveux sont considérées.

8. Reprenez l’analyse en cliquant sur le bouton Statistiques par Groupes dans la barre Ana-

lyse, ou en appuyant sur CTRL+R de votre clavier. Cliquez sur le bouton Analyse de

Variance. La table ANOVA vous indiquera si des différences significatives ont été mises

en évidence entre les couleurs des cheveux pour les variables dépendantes Taille (cm) et

Âge.

Avec des valeurs p de 0,538 et 0,97, nous pouvons dire que les moyennes de la taille et de

l’âge, respectivement, ne semblent pas différentes selon la couleur des cheveux. Les

quatre couleurs de cheveux correspondent à des âges et des tailles moyennes proches. En

d’autres termes la couleur des cheveux n’a pas d’effet sur la taille ou l’âge.

9. Reprenez l’analyse. Cliquez sur le bouton Boîtes à moustaches catégorisées dans l’onglet

Stats Descriptives. Sélectionnez les deux variables dépendantes et cliquez sur le bouton

OK.

Deux tracés seront générés, un pour la variable

Taille (cm) et un pour la variable Âge. En

examinant les boîtes à moustaches, vous pou-

vez observer que les cheveux blonds semblent

avoir une variance plus importante que les trois

autres couleurs de cheveux pour les variables

dépendantes, et il est aussi simple de voir

comment les moyennes d’échantillon se situent

les unes par rapport aux autres pour les quatre

couleurs de cheveux.

Page 50: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

44

Les onglets ANOVA & tests et Tests Post-hoc sont également disponibles si vous désirez tes-

ter plus en avant l’égalité des variances ou connaître quels niveaux diffèrent des autres (via

l’onglet Tests). Par conséquent, puisque nous n’avons découvert aucune différence de taille

ou de poids entre les niveaux de couleur de cheveux, nous n’approfondirons pas davantage.

Notez également que si vous souhaitez réaliser une ANOVA en considérant les variables

Sexe, Couleur des Cheveux et Couleur des Yeux en même temps, vous le pouvez. Il y aurait

24 combinaisons différentes dans cette analyse (2 niveaux x 3 niveaux x 4 niveaux). Par

exemple, une combinaison, serait femme - yeux verts – cheveux roux, et une autre femme -

yeux verts - cheveux noirs. Si vous l’exécutez dans Décompositions et ANOVA à 1 Facteur,

vous rechercherez des différences en général sur la variable dépendante. Mais, si vous sou-

haitez tester les effets principaux et les termes d’interaction séparément, alors

Décompositions et ANOVA à 1 Facteur n’est pas le module approprié. Ainsi, vous pouvez re-

chercher les interactions possibles avec ce type de plan, mais il est recommandé d’utiliser soit

le module ANOVA soit le module Modèle Linéaire Général de STATISTICA pour explorer ces

plans plus complexes.

Les méthodes non-paramétriques ont été développées pour être utilisées par le chercheur s’il

ne connaît rien sur les paramètres de la variable ou des observations lorsque les hypothèses

ne sont pas vérifiées. Les méthodes non-paramétriques ne sont pas liées à l’estimation des

paramètres décrivant la distribution de la variable concernée dans la population. Il existe au

moins un équivalent non-paramétrique pour chaque type de test paramétrique.

1.

Quand vos données ne sont pas distribuées normalement, et que les mesures contiennent au

mieux une information sur l’ordre (voir le glossaire sur les types de données), alors le calcul

des statistiques descriptives standard (par exemple, moyenne, écart-type) n’apporte pas plus

d’informations sur les données. Les Statistiques descriptives ordinales calculeront une grande

variété de mesures de positionnement (moyenne, médiane, mode, etc.) et de dispersion (va-

riance, écart moyen, étendue inter-quartiles, etc.) pour donner une « impression générale »

sur vos données.

EXEMPLE 10

Ouvrez le fichier de données Characteristics.sta. Les variables Test Élément ne sont pas dis-

tribuées normalement, donc les méthodes non-paramétriques vous fourniront de meilleurs

résultats que les autres tests présentés précédemment.

Si vous effectuez un test de normalité sur ces trois variables, tel que le test W de Shapiro-

Wilk (dans le module Statistiques Descriptives des Statistiques Élémentaires), vous les trou-

verez non-normales avec une valeur de p inférieure à 0.001.

1. A partir du menu Statistiques, sélectionnez

Tests Non-paramétriques pour afficher les

Tests Non-paramétriques.

Page 51: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

45

2. Sélectionnez les Statistiques Descrip-

tives Ordinales (médiane, mode, …) et

cliquez sur le bouton OK. Dans la

boîte de dialogue Statistiques Des-

criptives, cliquez sur le bouton

Variables et sélectionnez les variables

Test Élément 1, Test Élément 2, et

Test Élément 3. Cliquez ensuite sur le

bouton OK.

À présent, cliquez sur le bouton Synthèse pour afficher les résultats. La feuille de résul-

tats n’est pas présentée entièrement ci-dessous, mais vous pouvez remarquer que

moyenne, N actifs, médiane, mode, fréquence du mode, minimum, maximum, centiles et

bien plus, sont affichés dans la feuille de résultats. Utilisez l’ascenseur horizontal pour

vous déplacer vers la droite afin d’observer les différentes statistiques calculées.

4. Reprenez l’analyse (appuyez sur

CTRL+R) et cliquez sur le bouton Boîtes

à moustaches de toutes les variables. La

boîte de dialogue Type de Boîtes à mous-

taches s’affichera. Pour des données non-

paramétriques, il est fréquent d’utiliser le

type de tracé Médiane/Quartiles/Étendue.

Le point central de la boîte sera la mé-

diane, la boîte représentera les 25èmes

et

75èmes

centiles, et les moustaches donne-

ront l’étendue des données (minimum et

maximum). Sélectionnez l’option Mé-

diane/Quartiles/Étendue et cliquez sur le

bouton OK.

A partir du tracé, vous pouvez voir que Test Élément 1 possède les plus petites valeurs.

Test Élément 2 possède les valeurs les plus élevées dans cet échantillon. De plus, étant

donné que les moustaches sont d’une longueur comparable, vous pouvez conclure que les

étendues sont similaires entre les variables Test Élément.

5. Reprenez l’analyse. Calculez les 10ème

et 90ème

centiles pour les données en entrant 10 et

90 dans les boîtes Premier centile et Second centile, respectivement, dans Calculer les

bornes des centiles. Cliquez sur Synthèse. Vous allez devoir vous déplacer vers la droite

de la feuille de données résultante pour observer les centiles que vous avez choisis.

Page 52: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

46

2.

Il y a quelques méthodes alternatives non-paramétriques pour le test t pour des échantillons

indépendants. Les alternatives non-paramétriques disponibles dans STATISTICA, pour le test

t des échantillons indépendants, sont le test des suites de Wald-Wolfowitz , le test U de Mann-

Whitney, et test de Kolmogorov-Smirnov de 2 échant.

EXEMPLE 11 Pour cet exemple, le test U de Mann-Whitney sera utilisé. En utilisant le même fichier de

données, nous voulons savoir s’il existe une différence significative pour Test Élément 1

entre les hommes et les femmes. Notez que vous pouvez utiliser le même classeur pour toutes

vos analyses ou fermer le classeur actuel et placer les résultats de la nouvelle analyse dans un

nouveau classeur.

1. A partir du menu Statistiques, sélectionnez Non-paramétriques pour afficher les Test Non-

paramétriques. Choisir Comparer 2 échantillons indépendants (groupes) et cliquez sur le

bouton OK.

2. Cliquez sur le bouton Variables et sélec-

tionnez Test Élément 1 dans la boîte Liste

de Variables Dépendantes et Sexe dans la

boîte Variable Indép. (de classement). Cli-

quez sur le bouton OK. Notez que les codes

des groupes on été entrés : Groupe 1 –

homme et Groupe 2 - femme. Si vous dispo-

sez de plus de deux groupes, vous pouvez

double-cliquer dans ces champs pour choi-

sir les niveaux que vous souhaitez

comparer. Puisque la variable Sexe a seule-

ment deux niveaux, par défaut STATISTICA

sélectionnera automatiquement les deux ni-

veaux.

Cliquez sur le bouton test U de M-W pour lancer l’analyse. Notez qu’une seule partie de la

feuille de données est affichée ci-dessous. Avec une valeur p de 0,926, on peut considérer

que la différence entre les hommes et les femmes pour la variable Test Élément 1 n’est pas

significative.

3. À présent, regardez le tracé des boîtes à moustaches pour illustrer les résultats. Pour cela,

reprenez l’analyse. Cliquez sur le bouton Boîte à moustaches tous groupes dans la boîte

de dialogue Comparaison de Deux Groupes.

Page 53: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

47

Le tracé confirme notre conclusion, avec les

médianes très proches (proches de 10) et les

boîtes de tailles identiques, il n’y a pas de

différence entre les hommes et les femmes

pour la variable Test Élément 1.

Vous pourrez reprendre l’analyse et réaliser

les deux autres tests disponibles pour com-

parer deux groupes indépendants. Vous

trouverez que les valeurs p sont aussi très

importantes (supérieure à 0,05), pour arriver

à la même conclusion.

3.

Si vous voulez comparer deux variables mesurées dans le même échantillon, vous utiliserez

le test t pour des échantillons appariés. Cependant, quand les données sont non-

paramétriques, vous utiliserez le test des signes ou le test de Wilcoxon, pour comparer les

deux variables ou les deux échantillons appariés.

EXEMPLE 12 Supposez que Test Élément 1 soit une mesure d’une variable à un temps t et Test Élément 2 à

un temps t+1 sur un même échantillon. Habituellement un test t pour des variables dépen-

dantes serait suffisant pour comparer ces deux variables, mais puisqu’elles ne sont pas

distribuées normalement, les méthodes non-paramétriques devront s’appliquer.

1. Toujours en utilisant le fichier de données Characteristics.sta. Affichez les Tests Non-

paramétriques en sélectionnant Non-paramétriques depuis le menu Statistiques.

2. Choisir Comparaison d’échantillons appariés (variables) et cliquez sur le bouton OK.

3. Dans la boîte de dialogue Comparaison

de 2 variables, cliquez sur le bouton Va-

riables. Sélectionnez la variable Test

Élément 1 dans la boîte 1ère Liste de va-

riables et sélectionnez ensemble Test

Élément 2 dans la boîte 2éme Liste de va-

riables.

Cliquez sur le bouton Test des signes

pour afficher les résultats.

Le niveau p pour le test des signes est très significativement inférieur à 0,05. Ainsi, vous

pouvez conclure que Test Élément 1 est différent de Test Élément 2.

Page 54: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

48

5. Reprenez l’analyse et créez un tracé de boîte à moustaches pour représenter graphique-

ment les résultats. Cliquez sur le bouton Boîtes à moustaches de toutes variables dans la

boîte de dialogue Comparaison de 2 variables. Sélectionnez Test Élément 1 et Test Élé-

ment 2 et cliquez sur le bouton OK. Sélectionnez l’option Médiane/Quartiles/Étendue dans

la boîte de dialogue Type de Boîtes à moustaches, et cliquez sur le bouton OK pour pro-

duire le graphique.

Ce tracé confirme les résultats du Test des signes. Vous pouvez voir que Test Élément 1 et

Test Élément 2 sont très différents.

4.

Si vous disposez de plusieurs groupes (plus de deux) et de données paramétriques, vous utili-

serez l’analyse de la variance pour comparer les moyennes d’échantillon. Les équivalents

non-paramétriques à cette méthode sont l’analyse des Rangs de Kruskal-Wallis et le Test de

la Médiane.

EXEMPLE 13 1. En utilisant le fichier de données Characteristics.sta, sélectionnez Non-paramétriques à

partir du menu Statistiques.

2. Choisissez Comparaison de plusieurs échantillons indépendants (groupes) à partir des

Tests Non-paramétriques. Cliquez sur le bouton Variables et sélectionnez Test Élément 1

dans la Liste de variables dépendantes, et Couleur des cheveux comme Variable Indép.

(de classement). (Souvenez-vous que la Couleur des cheveux a quatre groupes – châtain,

roux, noir, et blond.) Cliquez sur le bouton OK.

Page 55: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

49

3. Cliquez sur Synthèse pour afficher les résultats. (Souvenez-vous, si nous ne sélectionnons

pas les codes tels que châtain, roux, noir et blond, STATISTICA supposera que vous com-

parez tous les codes de la variable de groupe par défaut.) Les résultats de l’ANOVA de

Kruskal-Wallis et Test de la Médiane s’afficheront en premier dans le classeur.

Les résultats ne sont pas statistiquement significatifs (valeur p = 0,551 ; dans l’en-tête de

la feuille de données). Ainsi, vous pouvez conclure qu’il n’y a pas de différence sur Test

Élément 1 pour les différentes couleurs de cheveux.

Les résultats du Test de la Médiane sont affichés à la suite dans le classeur :

Le Test de la Médiane est une version “brute” de l’ANOVA de Kruskal-Wallis en ce sens

qu’il effectue le calcul sur une table de contingence. Précisément, STATISTICA compte

simplement le nombre d’observations dans chaque échantillon qui sont avant ou après la

médiane et calcule la statistique du Chi-deux pour la table de contingence résultante 2 x k,

où k est le nombre de groupes analysés. En outre, avec une valeur de p importante de

0,5917, vous pouvez conclure qu’aucune différence significative n’existe entre les

groupes définis par les couleurs des cheveux.

4. Maintenant, regardons un tracé de boîte à mous-

taches pour visualiser graphiquement les résultats.

Ce graphique est disponible via le bouton Boîte à

moustaches dans la boîte de dialogue ANOVA de

Kruskal-Wallis et Test de la Médiane.

Ceci nous permet de conclure la formation sur les

tests non-paramétriques. Si vous aviez décidé

d’envoyer tous les documents dans le même clas-

seur, votre classeur aurait ressemblé à celui-ci :

Page 56: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

50

1.

Les tables d’ordre un ou de fréquences représentent la méthode la plus simple pour analyser

les données catégorielles (nominales). Elles sont souvent utilisées en tant que procédure ex-

ploratoire pour étudier la distribution de différentes catégories de valeurs dans un échantillon.

Par exemple, dans une étude de spectateurs intéressés par différents sports, nous pouvons

synthétiser l’intérêt des personnes interrogées à regarder le football dans une table de fré-

quences.

EXEMPLE 14

Ouvrez le fichier de données Sports.sta. Ce fichier de données comporte les réponses de 100

hommes pour 14 sports différents. Il leur a demandé pour chaque sport à quelle fréquence ils

le regardaient - jamais, parfois, souvent ou toujours. Nous vous suggérons de fermer le clas-

seur à l’écran pour commencer à travailler avec un nouveau un classeur. Vous pouvez

également fermer les autres fichiers de données et ne conserver que le fichier de données

Sports.sta.

1. Sélectionnez Statistiques Élémentaires

depuis le menu Statistiques. Sélectionnez

Tables de Fréquences dans les Statis-

tiques Élémentaires. Cliquez sur le bouton

OK. Cliquez sur le bouton Variables pour

afficher la boîte de dialogue de sélection

de variables, sélectionnez Football, et cli-

quez sur le bouton OK.

2. Cliquez sur le bouton Synthèse pour produire la table de fréquences. (Seule une partie de

cette feuille est présentée dans l’illustration suivante).

La feuille de données par défaut affiche le nombre de réponses de chaque type pour le foot-

ball (Effectifs), les Effectifs cumulés, la proportion des hommes qui ont donné cette réponse

pour football en pourcentage (%age), et le Pourcentage Cumulé. Elle donne également le

nombre de valeurs manquantes dans le fichier de données (VM). Dans cet exemple, chaque

personne avait répondu pour la variable Football, donc aucune donnée n’est manquante. No-

tez que vous pouvez personnaliser la table de fréquences (la diviser en catégories spécifiques,

ou avoir plus ou moins de statistiques listées) en utilisant les nombreuses options dans les on-

glets Avancé et Options.

Page 57: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

51

3. Reprenez l’analyse (CTRL-R). Modifiez la sélection des variables et sélectionnez Foot-

ball et Marathon en cliquant sur le bouton Variables et sélectionnez les deux sports dans

la boîte de dialogue de spécification de variables. Vous pouvez sélectionner des variables

individuelles en mode discontinu en appuyant sur la touche CTRL de votre clavier tout en

cliquant sur les variables que vous voulez sélectionner.

4. Revenez à la boîte de dialogue des Tables de Fréquences et sélectionnez l’onglet Stats

descriptives.

5. Cliquez sur le bouton histogrammes en 3D, distributions bivariées. Sélectionnez Football

comme première variable et Marathon comme seconde variable. Cliquez sur le bouton

OK.

Un histogramme est une autre façon de représenter les données nominales. A partir de ce gra-

phique, vous pouvez remarquer que parmi les personnes regardant les deux sports

sélectionnés, le groupe de spectateurs le plus important dit ne jamais regarder le marathon à

la télévision et toujours regarder le football. Pour étudier deux ou plusieurs sports en même

temps, il est plus adéquat d’utiliser des tableaux croisés.

Page 58: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

52

2.

Un tableau croisé est une combinaison de plusieurs tables de fréquences arrangées de telle

sorte que chaque cellule dans la table résultante représente une combinaison unique de va-

leurs spécifiques des variables. Ainsi, la tabulation croisée nous permet d’examiner les

fréquences d’observations appartenant à des catégories spécifiques de plusieurs variables. En

examinant ces fréquences, nous pouvons identifier les relations entre les variables.

EXEMPLE 15

Utilisez le fichier de données Sports.sta pour cet exemple.

1. Sélectionnez Statistiques Élémentaires du menu Statistiques. Choisissez Tris Croisés et

cliquez sur le bouton OK pour afficher la boîte de dialogue des Tableaux Croisés.

2. Dans l’onglet Tableaux Croisés, cliquez sur le bouton Spécifier les tables (sélection des

variables) pour afficher une boîte de dialogue de spécification de variables, et sélection-

nez Football dans la Liste1 et Formule1 dans la Liste2. Cliquez sur le bouton OK et à

nouveau sur OK dans la boîte de dialogue des Tableaux Croisés pour exécuter l’analyse.

La boîte de dialogue des Résultats des Tableaux Croisés s’affichera.

3. Cliquez sur le bouton Synthèse pour réaliser le tableau croisé.

Dans l’étude sur 100 hommes, 24 hommes disent regarder souvent la Formule 1 et toujours le

football. Il y a 28 hommes qui regardent toujours la Formule 1 quelle que soit leur réponse

vis-à-vis du football. Il y a 19 hommes qui ne regardent jamais le football quelle que soit leur

réponse vis-à-vis de la Formule 1. Les effectifs supérieurs à 10 sont marqués en rouge. Ce

paramétrage par défaut peut être modifié ou même désactivé via l’option Effectifs en surbril-

lance dans l’onglet Options de la boîte de dialogue des résultats.

Page 59: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

53

4. Vous pouvez personnaliser la table en ajoutant d’autres statistiques, d’autres fréquences,

ou d’autres effectifs dans les onglets Avancé et Options de la boîte de dialogue des Résul-

tats. Pour cet exemple, sélectionnez l’onglet Options, et cochez l’option Chi² max de

vraisemblance & Pearson. Dans l’onglet Avancé, cliquez sur Tableaux Détaillés à double

entrée pour examiner les statistiques sélectionnées. (Notez que la table d’ordre 2 sera

produite, avec les statistiques dans une feuille de données).

Les résultats sont très significatifs et nous permettent de dire que les deux variables Foot-

ball et Formule 1 sont liées. Les personnes qui regardent souvent le football tendent

également à regarder la Formule 1.

5. Les résultats peuvent être présentés dans un histogramme 3D. Pour produire le graphique,

reprenez l’analyse et cliquez sur le bouton histogrammes en 3D de l’onglet Avancé.

6. Reprenez l’analyse et modifiez à nouveau la sélection des variables en revenant dans la

boîte de dialogue des Tableaux Croisés et en cliquant sur le bouton Spécifier les tables

(sélection des variables). Sélectionnez Football dans la Liste1, Formule 1 dans la Liste2,

et Tennis dans la Liste3. Cliquez sur le bouton OK.

7. Cliquez sur le bouton OK dans la boîte de dialogue des Tableaux Croisés pour lancer

l’analyse. Cliquez sur le bouton Synthèse. Dans cette étude, 12 hommes disent regarder

parfois la Formule 1, parfois le Football, et parfois le Tennis.

Page 60: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

54

STATISTICA propose une méthode graphique qui répond à chacun de vos besoins : des gra-

phiques prédéfinis pour faciliter l’interprétation d’analyses statistiques spécifiques, des

graphiques conçus pour une exploration rapide des données, des graphiques permettant des

présentations personnalisées des données.

Il est possible de créer (et maintenir) des environnements intégrés "données-graphiques" dans

une optique d'analyse exploratoire.

Les données des graphiques STATISTICA se mettent à jour dès que les données du fichier

source changent, même après la fermeture des analyses STATISTICA respectives.

Il est également possible d'établir un lien entre un graphique existant et de nouvelles feuilles

de données et variables, ce qui vous permet d'utiliser des graphiques déjà personnalisés

(titres, échelles, objets incorporés, palette de couleurs, etc...) comme des "Modèles" que vous

pouvez utiliser pour les déployer sur d'autres jeux de données.

1.

Les approches graphiques de STATISTICA diffèrent selon les sources de données et la simpli-

cité de leur spécification.

Tous les graphiques de STATISTICA permettent dorénavant de répéter une analyse spécifique

pour chaque modalité (valeur) distincte des variables 'Par Groupe'. Par exemple, vous pouvez

spécifier un modèle de Régression Linéaire Multiple et calculer les résultats de façon indé-

pendante pour chaque sous-ensemble d'observations défini par les différentes modalités d'une

variable Ville (par exemple, Paris, Lyon, Marseille, Lille...).

Page 61: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

55

Dans STATISTICA, les graphiques les plus rapides sont les graphiques prédéfinis ou “inté-

grés” accompagnant la plupart des analyses. Ces graphiques peuvent être créés par un simple

clic de souris, et présentent souvent une information pertinente sur l’analyse en cours.

Tous les autres graphiques permettent à l’utilisateur, à des degrés divers, de spécifier les ca-

ractéristiques du graphique à réaliser.

Les Graphiques des Données d’Entrée sont disponibles dans le menu contextuel généré par

un clic droit sur n’importe quelle cellule d’une feuille de données, à partir du menu Gra-

phiques, ou en sélectionnant Graphiques à partir du menu du bouton démarrer de

STATISTICA (dans la barre d’Analyse de STATISTICA, dans la partie inférieure gauche de

l’écran).

Page 62: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

56

Les Graphiques des Données d’Entrée offrent des synthèses rapides des données à partir des

feuilles de données d’entrée. La sélection des variables se base automatiquement sur la posi-

tion du curseur dans la feuille de données, qu’elle soit ou non une feuille de données d’entrée

ou une feuille de données produite par une analyse. Les Graphiques des Données d’Entrée

correspondent aux graphiques les plus fréquemment utilisés, mais il s’agit de formats de gra-

phiques par défaut qui sont produits pour minimiser les sélections d’options. Les Graphiques

des Données d’Entrée prennent en compte les filtres de sélection et pondérations pour le fi-

chier de données utilisé. Vous pouvez reporter automatiquement les filtres de sélection

utilisés dans les zones de titre de tous les graphiques (produits à partir des sous-ensembles

sélectionnés) et dans les tableaux numériques de résultats.

Notez que toutes les feuilles de données issues d’analyses peuvent être spécifiées comme

nouvelles feuilles de données actives afin de permettre un traitement par les Graphiques des

Données d’Entrée ; sélectionnez la feuille de données, et sélectionnez Feuille de Données ac-

tive dans le menu Données.

Les graphiques disponibles dans le sous-menu des Graphiques des Données d’Entrée (pour

les sélections se terminant par…) requièrent deux variables. Si la position du curseur dans la

feuille de données est associée à une seule variable, la sélection d’une commande par… né-

cessitera de spécifier une seconde variable à partir de la feuille de données active. Si la feuille

de données est une matrice ou que la position du curseur indique non pas une mais deux va-

riables (dans une seule cellule), le graphique bivarié sera disponible à partir du menu des

Graphiques des Données d’Entrée sans sélectionner de seconde variable.

EXEMPLE 16

Vous désirez peut-être visualiser vos sorties dans des fenêtres individuelles. La comparaison

des graphiques est alors plus évidente. Pour ajuster le format de sortie, sélectionnez Options

dans le menu Outils. Cliquez sur l’onglet Gestionnaire de Sorties, sélectionnez l’option Fe-

nêtres Individuelles, ensuite cliquez sur le bouton OK.

1. Ouvrez le fichier de données Characteristics.sta, et effectuez un clic droit dans n’importe

quelle cellule de la colonne Taille (cm) pour afficher le menu contextuel. Sélectionnez

Graphiques des Données d’Entrée – Histogramme : Taille (cm) – Ajustement Normal pour

afficher le graphique suivant :

Page 63: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

57

La variable Taille (cm) semble suivre une distribution normale.

2. Effectuez à nouveau un clic droit dans n’importe quelle cellule de la variable Taille (cm),

mais cette fois sélectionnez Graphiques des Données d’Entrée – Nuage de points par - Ré-

gression, IC à 95%. La boîte de dialogue Sélectionnez la seconde variable s’affichera.

Sélectionnez Poids(kg) comme seconde variable et cliquez sur le bouton OK pour pro-

duire le graphique.

3. A partir du menu Statistiques, sélectionnez Statistiques Élémentaires pour afficher la

boîte de dialogue des Statistiques Élémentaires. Sélectionnez Matrices de Corrélations et

ensuite cliquez sur le bouton OK pour afficher la boîte de dialogue Matrices de Corréla-

tions. Cliquez sur le bouton 1 liste de variables pour afficher la boîte de dialogue

Sélectionnez les variables de l’analyse, sélectionnez les variables 4 à 12, et cliquez sur le

bouton OK. Cliquez ensuite sur le bouton Synthèse : Matrice de Corrélations dans l’onglet

Base. (Seule une partie de cette matrice est présentée ici).

Page 64: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

58

4. Dans la matrice des Corrélations obtenue, effectuez un clic droit dans la cellule représen-

tant l’intersection de Poids(kg) et Age (an). Dans le menu contextuel, sélectionnez Graphiques des Données d’Entrée – Nuage de Points par Age (an) - Régression, IC à 95%. Notez que le graphique est construit sans aucune spécification de variable en utilisant

Poids (kg) comme variable X et Age (an) comme variable Y.

Les Graphiques de Blocs sont disponibles à partir du menu contextuel accessible par un clic

droit sur n’importe quelle cellule ou bloc d’une feuille de données, à partir du menu Gra-

phiques ou en sélectionnant Graphiques depuis le menu du bouton démarrer de

STATISTICA dans la barre d’analyse de STATISTICA dans l’angle inférieur gauche de

l’écran.

Les Graphiques de Blocs, comparés aux Graphiques des Données d’Entrée, représentent leur

sortie à partir des sélections de la feuille de données actuellement active. Ils sont très utiles

comme aides rapides à la visualisation des résultats d’analyse aussi bien que pour

l’exploration des relations entre les sous-ensembles de données. Ils sont intermédiaires en

souplesse et en simplicité de définition entre les graphiques du menu Graphiques (voir le pa-

ragraphe suivant) et les Graphiques des Données d’entrée décrits auparavant. Ainsi,

contrairement aux graphiques du menu Graphiques et aux Graphiques des Données d’Entrée,

les Graphiques de Blocs ignorent les filtres de sélection et les pondérations des feuilles de

données qui ont pu être spécifiées.

Les Graphiques de Blocs utilisent la position du curseur ou un bloc de données (continues)

actuellement sélectionné, dans la feuille de données active, pour définir les données d’entrée

du graphique. Quand un bloc de données est sélectionné, les Graphiques de Blocs peuvent

être spécifiés pour envoyer les données vers un mode de traitement en ligne ou en colonne

(entières ou de bloc).

La partie supérieure du sous-menu des Graphiques de Blocs contient un ensemble de gra-

phiques prédéfinis par défaut (par exemple, Histogramme : Colonnes du Bloc, Histogramme :

Colonnes Entières, etc.) pouvant immédiatement être produits par un simple clic de souris.

Ces graphiques par défaut ont des noms explicites permettant de savoir s’ils opèrent sur des

colonnes de données entières ou des blocs de données sélectionnés (signalés en lignes ou en

colonnes).

Page 65: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

59

La seconde partie du sous-menu des Gra-

phiques de Blocs contient quatre commandes

de Graphiques Personnalisés pour des gra-

phiques par bloc (par ligne ou par colonne)

et des graphiques qui utilisent les lignes et

colonnes entières de la feuille de données en

entrée. Sélectionnez une des options pour

afficher la boîte de dialogue Sélectionnez un

Graphique (voir l’illustration suivante), utili-

sée pour spécifier une grande variété de

graphiques alternatifs qui sont un sous-

ensemble des graphiques disponibles dans

les graphiques du menu Graphiques.

Les graphiques sélectionnés seront alors produits de la manière spécifiée (par exemple, sur le

bloc de données sélectionné en ligne ou sur une colonne entière de données) en utilisant la

(ou les) variable(s) définie(s) par la position du curseur ou le bloc de données sélectionné

dans la feuille de données. Notez que vous pouvez cocher Ajouter à la liste du menu Gra-

phiques pour nommer et ajouter le graphique spécifié aux options du menu.

EXEMPLE 17

1. En utilisant le fichier de données Characteristics.sta, sélectionnez Statistiques Élémen-

taires dans le menu Statistiques. Dans la boîte de dialogue des Statistiques Élémentaires,

sélectionnez Statistiques Descriptives et ensuite cliquez sur le bouton OK. Cliquez sur le

bouton Variables, et sélectionnez les variables Taille (cm) à Test Éléments (3). Ensuite

cliquez sur le bouton OK. Cliquez sur le bouton Synthèse pour produire la feuille de don-

nées Statistiques Descriptives.

Page 66: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

60

2. À présent, sélectionnez le bloc de données dans la feuille de données des Statistiques

Descriptives correspondant à la Moyenne, Minimum, et Maximum pour Test Élément 1,

Test Élément 2, et Test Élément 3. Effectuez un clic droit dans le bloc pour afficher le

menu contextuel, et sélectionner les Graphiques de Blocs – Graphique Perso. Issu du Bloc

par Colonne pour afficher la boîte de dialogue Sélectionnez un Graphique.

a. Sous Catégorie de Graphique, sélec-

tionnez Graphiques en 2D ; sous Type

de Graphique, sélectionnez Tracés

d’étendue ; et sous Type de Représen-

tation, sélectionnez Moustaches -

absolues. Cliquez sur le bouton OK

pour produire le graphique montrant

les moyennes et étendues des trois va-

riables.

3. Retournez à la feuille de données et sélectionnez Trier dans le menu Données. Triez en

utilisant la variable Couleur des Cheveux. Après la fin du tri, déplacez-vous dans la

feuille de données pour sélectionner le bloc de données de Taille (cm) et Poids (kg) cor-

respondant au groupe avec des cheveux roux. Une fois le bloc sélectionné, effectuez un

clic droit dans une cellule du bloc pour sélectionner Graphiques de Blocs dans le menu

contextuel. Dans le sous-menu, sélectionnez Graphique Perso issu du Bloc par Colonne.

a. Dans la boîte de dialogue Sélectionnez

un Graphique sous Catégorie de Gra-

phique, spécifiez Graphiques en 2D ;

sous Type de Graphique, sélectionnez

Nuages de Points ; et sous Type de Re-

présentation, sélectionnez Régression

Linéaire, 95%. Cochez Ajouter à la liste

du menu Graphiques et ensuite cliquez

sur le bouton OK. Nommez le graphique

MonNuagedePointssurBlocdeCols et

cliquez sur le bouton OK pour créer le

graphique suivant.

Page 67: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

61

4. Effectuez à présent un clic droit sur une cellule du bloc sélectionné et notez que votre

nouveau type de graphique défini a été ajouté dans à la liste des Graphiques de Blocs.

5. Dans la dernière partie du sous-menu des Graphiques de Blocs, sélectionnez Personnali-

ser la Liste pour afficher la boîte de dialogue Personnaliser le Menu Graphique. Cette

boîte de dialogue est utilisée pour modifier la liste du menu (par exemple, édition, re-

nommer, et supprimer) et ajouter de nouveaux graphiques prédéfinis en utilisant la boîte

de dialogue Sélectionnez un Graphique.

2.

Les graphiques du menu Graphiques sont disponibles depuis le menu Graphiques ou à partir

du menu du bouton démarrer de STATISTICA dans la barre d’Analyse de STATISTICA

dans la partie inférieure gauche de l’écran.

Les graphiques du menu Graphiques trai-

tent les données directement à partir de la

feuille de données d’entrée ; ils ne dépen-

dent pas de blocs en surbrillance ou de la

position du curseur dans la feuille de don-

nées pour identifier les données ou

variables à utiliser. Les graphiques du

menu Graphiques acceptent toutes les

données des feuilles de données. Toute

feuille de données peut être définie

comme feuille de données active permet-

tant un traitement par les graphiques du

menu Graphiques en sélectionnant cette

feuille de données, puis en sélectionnant

Feuille de Données active dans le menu

Données. STATISTICA prend en compte

les filtres de sélections et pondérations des

variables à tracer quand il génère les gra-

phiques du menu Graphiques.

Page 68: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

62

Les graphiques du menu Graphiques sont divisés en Graphiques 2D, Graphiques Séquentiels

3D, Graphiques XYZ en 3D, Tracés Matriciels, Tracés de Figures, et Graphiques Catégorisés.

Les choix du sous-menu incluent les méthodes standard de synthèse graphique des données

brutes (par exemple, divers nuages de points et histogrammes) ou techniques analytiques gra-

phiques standard (par exemple, droites de Henry catégorisées, normalité par moitié, ou tracés

d’intervalles de confiances pour les droites de régression). Sélectionnez un type de graphique

dans le menu Graphiques pour afficher une définition graphique.

Les boîtes de dialogue de définition des graphiques du menu Graphiques sont toutes simi-

laires. Elles sont constituées de quelques onglets contenant les fonctionnalités et les options

les plus courantes pour créer un graphique :

L’onglet Base contient un panel limité d’options les plus couramment utilisées pour le

type de graphique respectif.

L’onglet Avancé (voir ci-dessus) comporte un ensemble complet d’options applicables

dans certaines circonstances afin de définir l’architecture détaillée du graphique.

L’onglet Apparence contient des options permettant de sélectionner un type de graphique,

un Style de Graphique enregistré (voir Utilisation des Styles de Graphiques), pour utiliser

un modèle de création du graphique, et sélectionner un Style de Document prédéfini pour

gouverner le format général du graphique tel qu’il apparaîtra à l’impression.

L’onglet Catégorisé contient diverses options pour créer des graphiques catégorisés.

Les onglets Options 1 et Options 2 donnent un accès à des options moins fréquemment

utilisées pour définir l’habillage graphique (par exemple, ajouter des titres et étiquettes,

en utilisant des systèmes de coordonnées Cartésiennes ou Polaires, permettent de sélec-

tionner des options supplémentaires d’ajustement, de sélectionner la mise à jour

automatique des graphiques et d’enregistrer le graphique comme Graphique

Personnalisé).

Ces onglets sont sensiblement les mêmes pour tous les graphiques du menu Graphiques. Les

boîtes de dialogue de définition pour certains graphiques du menu Graphiques présentent en

plus l’onglet Catégorisé, permettant de sélectionner une ou deux variables définissant les ca-

tégories pour la création de graphiques multiples.

Page 69: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

63

EXEMPLE 18

Les graphiques du menu Graphiques comportent beaucoup d’options graphiques de STATIS-

TICA, mais dans les exemples que nous allons illustrer, les options seront très rapidement

spécifiées.

1. Ouvrez le fichier de données Characteris-

tics.sta et à partir du menu Graphiques et

sélectionnez Graphiques Séquentiels en 3D –

Histogrammes Bivariées. Dans l’onglet Histo-

grammes Bivariés 3D - Base, cliquez sur le

bouton Variables pour afficher une boîte de

dialogue de sélection et spécifiez Couleur des

Cheveux sur l’axe X et Couleur des Yeux sur

l’axe Y. Cliquez ensuite sur le bouton OK

dans la boîte de dialogue de sélection des va-

riables et sur le bouton OK dans la boîte de

dialogue Histogrammes Bivariés 3D pour pro-

duire le graphique.

Après la création du graphique, vous pouvez utiliser le bouton Rotation 3D du Graphique

dans la barre d’outils Graphique pour positionner le graphique afin d’obtenir une

meilleure interprétation.

2. Supposons que vous souhaitez étudier la distribution du bien-être des hommes en fonction

du bien-être des femmes en général mesuré par la variable Bien Etre 1 dans notre fichier

de données Characteristics. Supposons encore que vous souhaitez savoir si la distribution

du bien-être change avec l’Age.

a. Dans le fichier de données Characteristics.sta actif, sélectionnez Moyennes avec

Barres d’Erreur dans le menu Graphiques. Dans l’onglet Moyennes avec Barres

d’Erreur – Base, cliquez sur le bouton Variables et sélectionnez Bien Etre 1 comme va-

riable dépendante et Sexe comme variable de classement dans la boîte de dialogue de

sélection. Conservez par défaut les autres options de l’onglet Base pour produire un

tracé de moyennes avec un intervalle de confiance à 95% autour des moyennes pour

Bien Etre 1 chez les hommes et chez les femmes. Cliquez sur le bouton OK.

b. Reprenez l’analyse en sélectionnant Reprendre dans le menu Graphiques, appuyez sur

CTRL+R, ou cliquez sur le bouton Moyennes avec Barres d’Erreur dans la barre

d’Analyse. Cliquez sur l’onglet Catégorisé. Sous Catégories de X cochez Oui, cliquez

sur le bouton Changer la Variable, et spécifiez Age comme variable à utiliser pour la

catégorisation. Comme la variable Age est continue, les catégories doivent être définies

avant d’effectuer le tracé. STATISTICA le fera automatiquement sans d’autres spécifi-

cations, mais supposons que vous êtes particulièrement intéressés par les groupes

d’âge inférieur à 40, compris entre 40 à 60, et supérieur à 60. Vous pouvez spécifier

ces limites en sélectionnant les Limites sous Catégories de X.

c. Quand l’option Limites est sélectionnée, l’intitulé du bouton en bas est modifié en Spé-

cifier les Limites. Cliquez sur ce bouton pour afficher une boîte de dialogue dans

laquelle nous pouvons saisir les limites pour définir nos catégories. Entrez 40, puis un

espace, puis 60 dans la boîte Saisissez les Limites Supérieures et ensuite cliquez sur le

bouton OK pour fermer cette boîte de dialogue.

Page 70: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

64

d. Enfin, cliquez sur le bouton OK dans la boîte de dialogue Moyennes avec Barres

d’Erreur pour produire le graphique.

En termes de mesure du bien-être exprimé par la variable Bien Etre 1, il apparaît que le

bien-être relatif des hommes est proche à celui des femmes dans les trois groupes

d’âge que nous avons défini.

EXEMPLE 19

Les graphiques du menu Graphiques présentent d’autres options graphiques telles que les

Bag Plots de STATISTICA.

1. Ouvrez le fichier de données Characteristics.sta et à partir du menu Graphiques et sélec-

tionnez Graphiques en 2D – Bag Plot. Dans l’onglet Base, cliquez sur le bouton Variables

pour afficher une boîte de dialogue de sélection et spécifiez Poids (Kg) et Taille (cm).

Cliquez ensuite sur le bouton OK dans la boîte de dialogue de sélection des variables et

sur le bouton OK pour produire le graphique.

Page 71: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

65

2. Supposons que vous souhaitez étudier la présence de points atypiques. La valeur 1.5 est

selon TUKEY une valeur pragmatique qui a une raison probabiliste. Si le coefficient vaut

1, la probabilité serait de 0.957, et elle vaudrait 0.999 si le coefficient est égal à 2. Cette

valeur est donc un compromis pour retenir comme atypiques assez d’observations mais

pas trop. Le coefficient du noyau (50) permet de spécifier le pourcentage de points situés

à l'intérieur du noyau. Dans le fichier de données Characteristics.sta actif, identifiez les

points atypiques en les marquant.

3.

L’option Ajouter au Menu comme graphique Personnalisé dans l’onglet Options 2 (voir ci-

dessous) des boîtes de dialogue de définition de tous les graphiques du menu Graphiques est

utilisée pour enregistrer toutes les options spécifiées durant la définition du graphique (y

compris la sélection des variables) pour un rappel ultérieur et utilisée avec cette feuille de

données ou une autre pour créer des graphiques identiques sans spécification supplémentaire.

Une fois enregistrés, ces modèles de graphiques sont accessibles dans les Graphiques Per-

sonnalisés du menu Graphiques. A partir de la même option Graphiques Personnalisés, vous

pouvez étudier ou modifier la liste des graphiques personnalisés via la boîte de dialogue Menu

des Graphiques Personnalisés, accessible en sélectionnant le Menu Personnalisé.

Page 72: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

66

EXEMPLE 20 Les graphiques spécialisés qui ont besoin d’être répétés pour de nombreux fichiers de don-

nées similaires ou pour des variables identiques dans un seul fichier peuvent souvent avoir

besoin d’utiliser un Graphique Personnalisé. Pour illustrer ce concept nous allons créer un

Graphique Personnalisé en utilisant le fichier de données Characteristics.sta.

1. Ouvrez le fichier de données Characteristics.sta et sélectionnez Nuages de Points dans le

menu Graphiques. Dans la boîte de dialogue Nuages de Points en 2D, onglet Base, cli-

quez sur le bouton Variables et spécifiez Taille (cm) pour l’axe X et Poids (kg) pour l’axe

Y. À présent, déplacez-vous sur l’onglet Avancé et cliquez sur le bouton Marquer Sous-

ens. Sélect. pour afficher la boîte de dialogue Spécifiez des Sous-Ensembles Multiples.

Entrez ‘Couleur des Cheveux’ = ‘chatains’ dans la boîte Sous-Ensemble 1 et ‘Couleur

des Cheveux’ = ‘roux’ dans la boîte Sous-Ensemble 2. (Notez que de simples apostrophes

entourant le nom de la variable Couleur des Cheveux sont nécessaires, car le nom de la

variable contient un caractère spécial, qui dans ce cas est un espace). Nous pourrons aussi

spécifier des sous-ensembles multiples tels que V3 = 1 et V3 =2 pour arriver au même ré-

sultat, mais dans cet exemple nous voulons retrouver la légende pour identifier

explicitement les catégories et noms de variables. La boîte de dialogue Spécifiez des

Sous-Ensembles Multiples apparaîtra ainsi :

2. Cliquez sur le bouton OK pour fermer la boîte de dialogue. Sélectionnez ensuite l’onglet

Options 1 de la boîte de dialogue des Nuages de Points en 2D. Dans la boîte Titre Person-

nalisé, entrez Propriété de Couleur de Cheveux (roux/chatains). Pour vérifier le tracé,

cliquez sur le bouton OK pour créer le graphique.

Le graphique utilise des marqueurs triangulaires

et des losanges pour les propriétés châtains et

roux ainsi que des marqueurs ronds pour indi-

quer les individus qui ont des cheveux ni roux,

ni châtains. (Notez que si votre graphique était

produit dans un classeur, le titre personnalisé

apparaîtrait dans l’arborescence du classeur ain-

si que dans le graphique).

Page 73: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

67

3. À présent, maximisez la boîte de dialogue des Nuages de Points en 2D de la barre

d’Analyse et sélectionnez l’onglet Options 2. Cliquez sur le bouton Ajouter au Menu

comme Graphique Personnalisé pour afficher la boîte de dialogue Nouveau Graphique

Personnalisé. Dans la boîte Nom dans le Menu, entrez un nom pour identifier le type de

graphique (par exemple, NuagedePointsCouleurCheveux). Décochez Enregistrer les va-

riables et cliquez ensuite sur le bouton OK pour fermer la boîte de dialogue. Fermez la

boîte de dialogue Nuages de Points en 2D en cliquant sur le bouton Annuler.

Désormais, vous pouvez sélection-

ner Graphiques Personnalisés dans

le menu Graphiques, le sous-menu

comporte le graphique personnalisé

que vous venez de définir (voir ci-

contre).

4. Sélectionnez le type de graphique récemment défini pour ouvrir à nouveau la boîte de dia-

logue Nuages de Points en 2D. Notez que parce que nous n’avons pas enregistré les noms

de variables au moment de la définition du type de graphique, nous devrons sélectionner

les variables avant d’utiliser ce modèle pour créer des graphiques identiques. Explorez les

options définies dans les onglets Avancé et Options 1 pour confirmer que les options res-

tent telles que nous les avons définies à l’origine. Vous pourrez modifier à ce niveau les

options de cet onglet si vous le souhaitez, mais sélectionnez seulement les nouvelles va-

riables et produisez le graphique.

Dans l’onglet Base, sélectionnez Test Élément 3 sur l’axe X et Test Total (Moy) sur l’axe

Y. Cliquez sur le bouton OK. Puis cliquez à nouveau sur le bouton OK pour créer le gra-

phique.

Page 74: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

68

Les graphiques du menu Graphiques

peuvent être spécifiés mis à jour

pour maintenir des liens automa-

tiques à la feuille de données active

à partir de laquelle ils sont créés.

Etablir des liens veut dire que les

graphiques sont mis à jour dès que

les données sont entrées. C’est aussi

une méthode pratique pour explorer,

de manière interactive, les effets de

points atypiques ou d’autres anoma-

lies suspectées dans les données.

Les liens entre les données et les graphiques sont établis par défaut en mode automatique.

Il est possible de créer (et maintenir) des environnements intégrés "données-graphiques" dans

une optique d'analyse exploratoire.

Lorsque vous changez le statut d’observations dans le fichier de données, le changement se

répercute sur tous les graphiques générés…

Les graphiques STATISTICA se mettent à

jour dès que les données du fichier source

changent, même après la fermeture des

analyses STATISTICA respectives.

Page 75: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

69

Il est possible d'établir un lien entre un graphique existant et de nouvelles feuilles de données

et variables, ce qui vous permet d'utiliser des graphiques déjà personnalisés (titres, échelles,

objets incorporés, palette de couleurs, etc...) comme des "Modèles" que vous pouvez utiliser

pour les déployer sur d'autres jeux de données.

EXEMPLE 21

Supposons que vous suspectiez que certaines valeurs de Poids (kg) et/ou Taille (cm) aient été

incorrectement saisies dans le fichier de données Characteristics.sta. Nous pouvons explorer

graphiquement et de manière interactive les données en activant la Mise à jour Automatique

de STATISTICA.

1. Dans le fichier de données Characteristics.sta actif, sélectionnez Nuages de Points dans

le menu Graphiques. Dans l’onglet Base de la boîte de dialogue des Nuages de Points en

2D, cliquez sur le bouton Variables pour afficher la boîte de dialogue de spécification des

variables, spécifiez Taille (cm) sur l’axe X et Poids (kg) sur l’axe Y. Dans l’onglet Options

1 de la boîte de dialogue Nuages de Points en 2D, cochez Mettre à jour graphiques exis-

tants sous Mise à jour auto. Conservez l’option Mettre à jour si données d’entrée

modifiées. Puis, cliquez sur le bouton OK pour produire le graphique. STATISTICA nous

informe dans le message affiché que le graphique sera placé dans une fenêtre individuelle

si le Gestionnaire de Sortie était réglé pour produire une sortie dans un classeur ou rap-

port. Cliquez sur le bouton OK.

Page 76: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

70

Le graphique comporte deux points représentant les valeurs de Poids (kg) de moins de 50

kg. Vérifiez les données saisies, les valeurs de poids représentées par ces points (36 kg

pour l’une des ces observations (individu numéro 33), et 39 kg pour l’autre observation

(individu numéro 88) sont en effet des valeurs saisies incorrectement. Les vraies valeurs

sont de 90 kg et 93.5 kg, respectivement.

2. Déplacez la fenêtre graphique, si nécessaire, et recherchez dans la feuille de données

l’observation 33 dans la colonne Poids (kg). Remplacez l’ancienne valeur de poids par la

valeur 90 dans la cellule appropriée. Quand les données sont saisies, appuyez sur la

touche ENTRÉE de votre clavier ou cliquez sur une autre cellule. STATISTICA présentera

un avertissement vous informant qu’une analyse est en cours et que les changements des

données peuvent affecter les résultats. Comme c’est ce que nous souhaitons dans cet

exemple, cliquez sur le bouton OK dans la boîte d’avertissement et assistez à la mise à

jour du graphique.

a. De façon similaire, changez la valeur de l’observation numéro 88 pour le Poids (kg) en

93,5. Notez que lorsque cette valeur est modifiée (et après toutes les modifications ul-

térieures sur les données), le message d’avertissement ne s’affiche plus. Votre

graphique ressemble maintenant à la capture suivante :

Comparé au tracé précédent, l’échelle de l’axe Y a changé afin de refléter la nouvelle

étendue des données, et que l’ajustement linéaire ainsi que son équation dans le titre

ont été sensiblement modifiés suite aux nouvelles valeurs.

Page 77: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

71

Dans le menu Outils, sélectionnez Options pour afficher la boîte de dialogue des Options, la-

quelle présente de nombreuses options s’appliquant aux graphiques. Une fois fixées, les

options associées aux créations graphiques s’appliqueront ensuite à tous les Graphiques des

Données d’Entrée, Graphiques de Blocs, et graphiques du menu Graphiques, mais pas aux

graphiques intégrés créés à partir des boutons des analyses statistiques.

L’onglet Analyses/Graphiques de la boîte de dialogue Options contient des options se rappor-

tant à la fermeture des graphiques une fois que le graphique est produit, des options

d’affichage des ajustements dans les titres des graphiques, et des options liées à la création de

graphiques à partir de gros fichiers de données. La dernière option contrôle l’affichage par

une barre de progression durant la création du graphique et affiche un avertissement à

l’utilisateur quand il est approprié de sélectionner des options supplémentaires pour réduire

les sollicitations de mémoire.

L’onglet Graphs - Affichage contient des options par défaut de personnalisation concernant

les tailles, couleurs, et structures utilisées pour marquer des points, des lignes et des aires du

graphique produit.

L’onglet Graphs - Paramètres contient des options se rapportant à la taille du graphique, la

proportion, et les titres par défaut aussi bien que les options pour spécifier l’ordre de

l’ajustement du polynôme par défaut et la base du logarithme à utiliser dans tous les gra-

phiques.

Dans l’onglet Configuration, les options décrites ici, de même que les options des autres on-

glets de la boîte des Options, peuvent être Enregistrées Sous pour créer, gérer, et modifier des

configurations séparées de STATISTICA.

Les graphiques composés sont des graphiques dans STATISTICA qui comprennent :

Certains types de graphiques du menu Graphiques affichant différents types de graphiques

dans un seul graphique, tels que les nuages de points avec boîtes à moustaches, Nuages de

points avec Histogrammes, et graphiques matriciels. (La dernière contient des nuages de

points et des histogrammes).

Les graphiques du menu Graphiques sont construits en utilisant les options Catégorisé des

définitions graphiques ou en sélectionnant Graphiques Catégorisés dans le menu Graphiques.

Certains graphiques spécialisés, conçus à partir des boîtes de dialogue des procédures statis-

tiques (par exemple, Cartes X-barre et R dans le Contrôle Qualité Interactif).

Les graphiques composés spécifiés depuis soit les commandes Assistant soit Modèles.

Les trois premiers types de graphiques composés décrits auparavant sont des combinaisons

graphiques créées par STATISTICA avec certaines limites telles que les types de graphiques

affichés. Le quatrième type est un graphique composé personnalisé qui peut inclure des gra-

phiques individuels de variété infinie.

Sélectionnez Graphiques Composés dans le menu Graphiques ou depuis le menu du bouton

démarrer de STATISTICA pour accéder au sous-menu Graphiques Composés, contenant

deux options (Assistant et Modèles) pour créer des graphiques composés selon le choix de

l’utilisateur à partir des graphiques existants.

Page 78: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

72

Sélectionnez Assistant dans le sous-menu Graphiques Composés pour afficher la boîte de

dialogue Assistant Mise en Forme – Étape 1, utilisée pour regrouper les graphiques à inclure

dans le graphique multiple. Cliquez sur le bouton Issus d’un Fichier pour afficher la boîte de

dialogue Sélectionnez les Fichiers Graphiques à Insérer sur la Page, où les graphiques peu-

vent être ajoutés à la liste. Cliquez sur le bouton Toutes les Fenêtres pour ajouter tous les

graphiques présents en tant que fenêtre individuelle à la liste (les graphiques stockés dans les

classeurs actifs ou rapports ne seront pas inclus). Les graphiques peuvent être supprimés de la

liste en les sélectionnant et en cliquant sur le bouton Supprimer. Cliquez sur le bouton Gra-

phiques Vierges pour ajouter un graphique vierge à la liste. Les graphiques vierges peuvent

être utilisés ultérieurement comme des containers pour accueillir d’autres objets graphiques

tels que des bitmap ou peuvent servir de “places réservées” dans l’assemblage. Des gra-

phiques supplémentaires STATISTICA ou d’autres objets graphiques tels que du texte, etc.,

peuvent par la suite remplir les espaces ouverts réservés. Le nombre de graphiques (c’est-à-

dire, le nombre de graphiques plus les graphiques vierges) dans une liste complète détermine-

ra le nombre d’espaces destinés à accueillir des graphiques. L’ordre dans lequel les éléments

apparaissent peut être ajusté dans la boîte de dialogue Assistant de Mise en Forme – Étape 2.

Cliquez sur le bouton Suivant > dans l’Assistant Mise en Forme – Étape 1 pour afficher

l’Assistant Mise en Forme – Étape 2. Dans la fenêtre Mise en Forme Automatique, vous pou-

vez sélectionner (en l’activant) l’option de sortie que souhaitez. L’ordre des éléments de la

liste dans la fenêtre du bas peut être changé pour correspondre aux positions occupées par les

graphiques de votre choix. D’autres options disponibles dans cette boîte de dialogue vous

permettent de modifier la liste des graphiques (en retournant à l’Étape 1), l’addition de titres

au graphique composé, et l’ajustement de marges et proportions graphiques. Cliquez sur le

bouton Terminer pour créer le graphique composé.

Sélectionnez Modèles dans le sous-menu Graphiques Composés pour afficher la boîte de dia-

logue Modèle de Graphique. Cette fonctionnalité, contrairement à l’Assistant, ne permet pas

de spécifier l’inclusion de graphiques enregistrés ou de fenêtres graphiques individuelles. Des

graphiques vierges pourront plutôt être spécifiés. Les graphiques vierges peuvent être utilisés

plus tard comme des containers pour d’autres objets graphiques tels que des bitmaps ou peu-

vent servir de “réservations” dans la construction. Des graphiques supplémentaires de

STATISTICA ou d’autres objets graphiques tels que du texte, etc., pourront remplir les es-

paces réservés par les graphiques vierges. Un maximum de 25 graphiques vierges peut être

spécifié dans la boîte Nbre de graphiques vierges à arranger.

Cliquez sur le bouton OK de la boîte de dialogue Modèles de Graphique pour afficher

l’Assistant Mise en Forme – Étape 2 (décrit ci-dessus), où vous pouvez sélectionner le type de

graphiques composés.

EXEMPLE 22

1. A partir du menu Outils, sélectionnez Options pour afficher la boîte de dialogue des Op-

tions. Dans l’onglet Gestionnaire de Sortie, sélectionnez Fenêtres Individuelles afin

d’envoyer les sorties dans des fenêtres individuelles, et cliquez sur le bouton OK.

2. Ouvrez le fichier de données Characteristics.sta et effectuer un clic droit dans la colonne

Test Élément 1. A partir du menu contextuel, sélectionnez Graphiques des Données

d’Entrée - Histogramme Test Élément 1 – Ajustement Normal.

Page 79: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

73

À présent, répétez la procédure afin de produire les

graphiques de Test Élément 2, Test Élément 3, et Test

Total (Moy) dans des fenêtres individuelles. Vous de-

vrez avoir quatre graphiques dans des fenêtres

individuelles à l’écran.

3. Ensuite, à partir du menu Graphiques, sélectionnez Graphiques Composés - Assistant.

Dans l’Assistant Mise en Forme – Étape 1, cliquez sur le bouton Toutes les Fenêtres sous

Ajouter des Graphiques. Les titres des quatre graphiques seront affichés dans la fenêtre de

la boîte de dialogue. Cliquez ensuite sur le bouton Suivant pour afficher l’Assistant Mise

en Forme – Étape 2. Dans cette boîte de dialogue (illustrée ci-dessous) sélectionnez le

format de sortie que vous souhaitez appliquer (par exemple, l’arrangement par défaut

avec les mêmes tailles pour les quatre graphiques). Sélectionnez l’option Titre sous Créer.

4. Cliquez enfin sur le bouton Terminer

pour dessiner le graphique. Notez que

le graphique a le mot Titre comme

titre. Double-cliquez sur le mot Titre

pour afficher la boîte de dialogue

Texte/Titre du graphique, où vous pou-

vez changer le titre en Synthèse des

Tests Éléments. Votre graphique appa-

raît comme celui figurant ci-contre :

Page 80: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

74

EXEMPLE 23

Les graphiques tels que les surfaces de réponses peuvent se fusionner sur un seul graphique

pour cumuler les courbes d’isoréponse et présenter une lecture aisée de la recherche d’un Op-

timum, minimum ou maximum.

1. Dans le fichier de données Characteris-

tics.sta actif, sélectionnez Courbes

d’Isoréponse dans le menu Graphiques

XYZ en 3D. Dans l’onglet Base de la

boîte de dialogue des Courbes

d’Isoréponse en 3D, cliquez sur le bou-

ton Par Groupes pour utiliser la variable

Sexe comme variable de classement.

Sélectionnez les variables Taille, Poids

et Age en X, Y, Z.

Copier le graphique des femmes puis Coller et Fusionner le avec celui des hommes.

Page 81: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

75

2. Dans le fichier de données Characte-

ristics.sta actif, sélectionnez Courbes

d’Isoréponse dans le menu Gra-

phiques XYZ en 3D. Dans l’onglet

Base de la boîte de dialogue des

Courbes d’Isoréponse en 3D, cliquez

sur le bouton Par Groupes pour utili-

ser la variable Sexe comme variable

de classement. Sélectionnez les va-

riables Taille, Poids en X, Y et Bien

être1 et 2 en Z de façon à connaître

les Taille et Poids des individus dont

les degrés de bien être sont les plus

élevés.

Le spectre entier des approches graphiques (y compris la plupart des graphiques intégrés spé-

cifiés à partir des boîtes de dialogue des analyses statistiques) produit un seul type de

graphique dans lesquels tous les graphiques STATISTICA peuvent être personnalisés de la

même manière après création. Effectivement, des graphiques simples pour l’exploration de

données rapidement créés avec les paramètres par défaut peuvent être personnalisés ultérieu-

rement pour ressembler aux graphiques sophistiqués dont les paramètres ont été définis avant

la création. Vous pouvez utiliser les options de personnalisation pour modifier presque toutes

les caractéristiques graphiques concevables de STATISTICA aussi bien que pour ajouter de

nouvelles caractéristiques (par exemple, ajustements, tracés, texte, images, documents, et

même des graphiques complets).

Dans STATISTICA, il y a trois principaux types de personnalisation graphique disponibles :

Ajouter/éditer des objets graphiques personnalisés et autres,

Personnaliser les composantes d’un graphique, et

Utiliser les styles graphiques pour personnaliser les graphiques.

STATISTICA fournit les outils pour la création et l’ajout de texte, de rectangles, de rectangles

avec bords arrondis, de cercles ou d’ovales, d’arcs, de polygones ou de lignes à main levée, et

flèches dans n’importe quel graphique STATISTICA comme des objets déplaçables et person-

nalisables. En plus, les graphiques STATISTICA permettent l’insertion d’objets graphiques

pré-existants de STATISTICA ou provenant d’autres applications.

Les outils permettant d’ajouter des objets graphiques personnalisés vers un graphique courant

(actif) sont accessibles depuis la barre d’outils Outils Graphiques ou depuis le menu Insérer.

Une fois ajouté, un simple clic droit de la souris sur un objet graphique personnalisé affiche

un menu contextuel où vous pouvez ouvrir une boîte de dialogue spécifique des Propriétés de

l’objet. Vous pouvez ensuite personnaliser l’objet sur son emplacement dans le graphique :

modifier sa taille, sa structure, sa couleur ou d’autres propriétés.

Page 82: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

76

Les objets sont en mode coordonnées fixes, (c’est-à-dire qu’ils maintiendront leur position

relative en fonction des dimensions de la fenêtre graphique) quand ils sont initialement placés

dans un graphique. En utilisant les boîtes de dialogue Propriétés, les objets peuvent être faci-

lement convertis en mode coordonnées Dynamiques dans lequel ils maintiendront une

position correspondant à un ensemble de coordonnées sur les axes du graphique sur lequel ils

sont placés. Par exemple, la tête d’une flèche placée en mode Dynamiques aux coordonnées

X=3 et Y=2 continuera à pointer à ces coordonnées sur le graphique même si les axes sont

modifiés par la suite.

Plusieurs types d’objets graphiques permettent d’affecter différents modes sur différentes par-

ties du même objet. Par exemple, la tête d’une flèche peut être positionnée en mode

Dynamiques et la queue peut être laissée en mode Fixe (c’est-à-dire, avec l’option Dyna-

miques non cochée). Quelques objets, tels que les boîtes de texte flottant, ont une seule

option Dynamiques utilisée pour ancrer à un coin spécifique de l’objet.

EXEMPLE 24

1. Le fichier de données Characteristics.sta étant ouvert, sélectionnez Nuages de Points

dans le menu Graphiques. Dans l’onglet Base de la boîte de dialogue de définition des

Nuages de Points 2D, spécifiez Age (an) sur l’axe X et Taille (cm) sur l’axe Y. Puis cli-

quez sur le bouton OK pour créer le nuage de points.

2. Notez qu’il y a deux points aux valeurs de Taille (cm) de 145, et 147 près du bord du tra-

cé. Nous aimerions attirer l’attention sur cette information taille-age en étiquetant les

points avec les noms des participants à l’étude. Maximiser le graphique ou le classeur

contenant le graphique, et activez (cliquez sur) l’outil de dessin Flèche de la barre

d’outils Outils Graphiques. Placez le curseur (maintenant sous la forme d’une flèche) à

droite des deux points (voir ci-dessous), lâchez le bouton de la souris, et dessinez (glissez)

une petite flèche en vous dirigeant vers la droite. La flèche sera terminée en relâchant le

bouton de la souris. Après avoir dessiné la flèche, double-cliquez dessus pour afficher la

boîte de dialogue des Propriétés de l’Objet Flèche. Vous n’avez pas besoin de changer

quoi que se soit dans la boîte de dialogue, mais prenez note des options disponibles et no-

tez plus particulièrement que la tête et la queue de la flèche sont dynamiquement

positionnés par défaut. Vous pouvez modifier le style, la couleur, etc. de la flèche comme

vous le voulez, mais laissez les réglages sur Dynamiques. Cliquez ensuite sur le bouton

OK pour fermer la boîte de dialogue.

a. Cliquez sur le bouton Texte de la barre d’outils des Outils Graphiques et d’un clic à

côté de la queue de la flèche, placez-vous sur le graphique. Les mots Texte Personnali-

sé s’afficheront dans le graphique à l’endroit où vous avez cliqué. Maintenant double-

cliquez sur les mots Texte Personnalisé pour afficher une boîte de dialogue

Texte/Titres du graphique où vous pourrez modifier le texte en Marie. Cliquez sur le

bouton OK pour fermer la boîte de dialogue et observez le texte. Effectuez un clic droit

sur le mot Marie et sélectionnez Propriétés de l’Objet Texte dans le menu contextuel.

Dans la boîte de dialogue Propriétés de l’Objet Texte, cochez Dynamiques sous Coor-

données et spécifiez Gauche, Bas comme Point d’Ancrage de la boîte. Cliquez ensuite

sur le bouton OK pour fermer la boîte de dialogue.

b. Répétons maintenant la procédure ci-dessus pour étiqueter le point sur la gauche avec

une flèche et une étiquette (nous l’appellerons Bob) placé au-dessus et sur la gauche du

point. Toutefois, quand vous placerez la flèche, vous ne sélectionnerez pas les options

Dynamiques dans la boîte de dialogue Propriétés de l’Objet Flèche.

Page 83: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

77

Quand vous aurez terminé, votre graphique ressemblera à celui ci-dessous :

3. Présentons le sujet qui sera introduit dans la prochaine section – Personnalisation des

composantes individuelles. Nous notons que l’axe X du graphique est compris entre un

minimum de 10 et un maximum de 90. Nous aimerions avoir une échelle de 0 à 100.

Double-cliquez sur la ligne de l’axe X du graphique pour afficher la boîte de dialogue

Mise en Forme des Axes. Dans l’onglet Échelle de cette boîte de dialogue, changez le

Mode Auto en Manuel sous Intervalle et ensuite entrez 0 et 100 comme les valeurs

d’échelle Minimum et Maximum. Ensuite cliquez sur le bouton OK pour redessiner le gra-

phique.

Notez que la flèche et l’étiquette associées avec le point Marie sont toujours positionnés

correctement, parce qu’ils sont placés dynamiquement et déplacés avec les valeurs des

axes. La flèche et l’étiquette de Bob par conséquent restent positionnées en mode “fixé”

par rapport à la structure graphique, et les points intéressants se sont déplacés.

Page 84: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

78

Les composantes de tous les graphiques STATISTICA sont entièrement personnalisables après

création. Les mêmes options de personnalisation du tracé sont disponibles pour les gra-

phiques intégrés, graphiques du menu Graphiques, Graphiques des Données d’Entrée, et

Graphique de Blocs. En général, quel que soit le mode de création graphique, une fois qu’il

apparaît à l’écran, toutes les options de personnalisation graphique disponibles dans STATIS-

TICA peuvent être utilisées pour le personnaliser. Les exceptions à cette règle générale sont

certains types de graphiques très spécialisés et inhabituels comme les options des boutons de

quelques boîtes de dialogue d’analyses statistiques.

Les paramètres contrôlant presque tous les aspects de l’apparence des graphiques de STATIS-

TICA sont accessibles de manière interactive après la production d’un graphique en double-

cliquant directement sur la caractéristique graphique ou composante que vous voulez chan-

ger, par un clic droit sur la composante graphique et en sélectionnant Propriétés (ou autres

commandes appropriées) depuis le menu contextuel ou depuis la boîte de dialogue de person-

nalisation graphique Options du Graphique.

La voie la plus directe pour accéder aux fonctions de personnalisation des composantes gra-

phiques est de double-cliquer sur une fonction graphique. Une boîte de dialogue s’affichera

immédiatement pour donner accès aux personnalisations de cette fonction.

La même séquence de boîtes de dialogue offrant progressivement un grand nombre d’options

est accessible dans un menu contextuel (la commande Propriétés) obtenu par un clic droit sur

la fonction graphique que vous souhaitez personnaliser.

La boîte de dialogue Options du Graphique est accessible depuis le menu Format sur un gra-

phique actif, en double-cliquant sur le fond du graphique (c’est-à-dire, l’aire au-delà des

axes), ou en sélectionnant Options du Graphique dans le menu contextuel par un clic droit sur

le graphique.

Pour de nombreux de types de graphiques, des options spéciales sont disponibles pour per-

mettre aux graphiques d’être convertis d’un type spécifique à un autre à l’intérieur d’un

graphique général (par exemple, conversion d’histogrammes en camemberts impliquant des

variables individuelles catégorisées).

Les sections suivantes décrivent les options disponibles pour de nombreux types communs de

graphiques en utilisant en exemple les onglets disponibles quand un nuage de points en 2D

est le graphique actif. Pour illustrer quelques-unes des plus importantes fonctions personnali-

sables, créez un simple nuage de points en utilisant le fichier de données Characteristics.sta.

Sélectionnez Nuages de Points dans le menu Graphiques, et dans l’onglet Base de la boîte de

dialogue Nuages de Points en 2D, spécifiez un nuage de points de type Multiple en utilisant

Taille (cm) sur l’axe X et Poids (kg) ainsi que Age (an) sur l’axe Y.

EXEMPLE 25

1. Dans la boîte de dialogue Options du Graphique et L’onglet Fenêtre, sélectionnez un bleu

clair pour l’extérieur et un jaune clair pour l’intérieur du graphique (Astuce : Utilisez

l’option Autres couleurs pour définir une palette de jaune appropriée). Cochez Bordures

du graphique ; cliquez ensuite sur le bouton Bordures pour afficher la boîte de dialogue

Propriétés de Ligne. Changez la largeur de ligne en 5 points et cliquez sur le bouton fer-

mer pour sortir de la boîte de dialogue.

Page 85: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

79

2. Cliquez sur L’onglet Mise en Forme et sélectionnez Axes identiques (égaux) dans les Pro-

portions des axes. Cliquez sur le bouton OK dans le bas de la boîte de dialogue Options

du Graphique pour redessiner le graphique avec les nouveaux réglages.

EXEMPLE 26

1. Dans la boîte de dialogue Options du Graphique, L’onglet Titres/Textes, modifiez le titre

du graphique en RELATIONS TAILLE/POIDS/AGE dans la fenêtre d’édition texte. Cen-

trez le titre et mettez-le en gras en utilisant les boutons de la barre d’outils de

STATISTICA.

2. Sélectionnez ensuite le Sous-Titre du graphique dans la liste déroulante de la fenêtre

d’édition texte. Décochez l’Affichage juste au-dessus et cliquez sur le bouton OK dans la

partie inférieure de la boîte de dialogue pour redessiner le graphique.

Onglet Tracé - Généralités

L’onglet Généralités permet d’accéder à tous les tracés individuels d’un graphique à partir de

la liste déroulante Tracé en haut de l’onglet. Dans cet onglet, l’affichage des tracés indivi-

duels à activer ou à désactiver, la personnalisation complète des couleurs, le type, et la taille

(si applicable), tous les marqueurs de points, lignes ou aires qui sont des parties intégrantes

du tracé sont disponibles. De nouveaux tracés peuvent également être ajoutés dans le gra-

phique à partir de cet onglet.

EXEMPLE 27

1. Dans l’onglet Tracé - Généralités de la boîte de dialogue Options du Graphique, sélection-

nez 1: Poids (kg) dans la boîte Tracé puis cliquez sur le bouton Symbole de points.

Dans la boîte de dialogue Propriétés des marqueurs, sélec-

tionnez un point circulaire rempli (bleu) et cliquez ensuite

sur Fermer la boîte de dialogue. Sélectionnez ensuite 2:

Age (an) dans la boîte Tracé et cliquez sur le bouton Sym-

bole de points. Cette fois, sélectionnez un point circulaire

rempli (rouge). Une nouvelle fois, fermez la boîte de dia-

logue Propriétés des marqueurs et cliquez sur le bouton

OK pour redessiner le graphique.

Notez que les caractéristiques des points changent dans la

légende du graphique en même temps que le corps du gra-

phique.

Page 86: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

80

Onglet Tracé - Étiquettes de Points

Les options dans l’onglet Tracé - Étiquettes de Points sont utilisées pour représenter les éti-

quettes des noms d’observations et/ou coordonnées X et Y associées avec les marqueurs de

points sur chaque tracé du graphique.

Onglet Tracé - Ajustement

Les options de l’onglet Tracé - Ajustement sont utilisées pour ajouter, supprimer, et/ou per-

sonnaliser les ajustements prédéfinis des tracés 2D et 3D sélectionnés à partir de la liste

déroulante Tracé en haut de l’onglet. La liste déroulante Ajustement est utilisée pour sélec-

tionner le type d’ajustement à partir d’une grande variété d’ajustements appropriés. L’étendue

des valeurs de X (ou valeurs X et Y dans le cas de tracés 3D) sur laquelle l’ajustement sera

calculé peut également être spécifiée.

Onglet Tracé - Bandes de Régression

Les options de l’onglet Tracé - Bandes de Régression sont utilisées soit pour ajouter soit pour

personnaliser les limites de Confiance ou de Prévision des fonctions d’ajustement polynomial

présentes sur le graphique. Vous pouvez ajouter autant de bandes de régression que vous

souhaitez sur chaque tracé du graphique. Des tracés individuels peuvent être sélectionnés en

utilisant la liste déroulante Tracé au sommet de l’onglet. Des ajustements individuels pour

chaque tracé peuvent être sélectionnés à partir de la liste déroulante Ajustement.

EXEMPLE 28

1. Dans l’onglet Tracé - Ajustement de la boîte de dialogue Options du Graphique, sélection-

nez 1: Poids (kg) dans la liste déroulante Tracé, puis sélectionnez Polynomial dans la liste

déroulante Type d’ajustement pour changer l’ajustement actuel Linéaire (Fit 1) en poly-

nomial. Ensuite, sélectionnez 2: Age (an) dans la liste déroulante Tracé, et cliquez sur le

bouton Ajouter nouvel ajustement. Notez que la boîte Ajustement affiche maintenant un 2.

Appliquez une nouvelle fois un ajustement polynomial en modifiant le type d’ajustement

par défaut Linéaire en Polynomial dans la boîte Type d’ajustement.

2. Cliquez sur l’onglet Tracé - Bandes de Ré-

gession. Tout d’abord, sélectionnez 1: Poids

(kg) dans la liste déroulante Tracé ; ensuite,

sélectionnez Ajustement 1 et cliquez sur le

bouton Nouvelles Bandes. Acceptez les op-

tions par défaut et cliquez sur le bouton OK

en haut de la boîte de dialogue Options du

Graphique pour redessiner le graphique.

Page 87: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

81

EXEMPLE 29

1. Dans l’onglet Tracé - Ellipse, sélectionnez 2: Age (an) à partir de la liste déroulante Tracé,

et cliquez sur le bouton Nouvelle ellipse. Modifiez la valeur dans la boîte Coefficient en

0,95 et acceptez tous les autres paramètres par défaut. Cliquez sur le bouton OK en bas de

la boîte de dialogue pour ajouter une ellipse de confiance à 95% au tracé Taille (cm) en

fonction de Age (an).

Onglet Axe - Titre

L’onglet Axe - Titre donne accès à la personnalisation des titres des axes, pour tous les axes

définis sur le graphique. Tous les titres des axes, y compris ceux générés par STATISTICA

durant la création du graphique peuvent être édités au niveau du texte, de la police, de la taille

de la police, de la couleur, et de l’alignement. Des symboles spéciaux peuvent être ajoutés et

des formats d’affichage tels que gras, italiques, soulignement, indice, et exposant peuvent

s’appliquer.

Onglet Axe - Échelle

Les options de l’onglet Axe - Échelle permettent une personnalisation complète et indépen-

dante des paramètres d’échelles principaux pour tous les axes du graphique. Vous pouvez

sélectionner dans cet onglet les modes d’échelle automatique/manuel, les caractéristiques ma-

jeures telles que les valeurs minimum et maximum, la sélection du type d’échelle telle que

logarithme, probabilité, etc., l’ajout de rupture d’échelle, et l’inversion des axes (échelles

renversées).

Onglet Axe - Unités Principales

L’onglet Axe - Unités Principales fournit les options pour modifier les unités définissant les

incréments sur tous les axes du graphique. Par défaut, les valeurs d’échelles s’appliqueront à

intervalles définis par les unités principales.

Onglet Axe - Unités Secondaires

Pour tous les axes du graphique, l’onglet Axe - Unités Secondaires permet d’accéder à la dé-

finition du nombre et l’affichage de sous-intervalles à l’intérieur des intervalles définis dans

l’onglet Axe - Unités Principales (voir ci-dessus).

Page 88: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

82

Onglet Axe - Valeurs d’Échelle

Utilisez les options de l’onglet Axe - Valeurs d’Échelle pour spécifier l’affectation des valeurs

d’échelle sur tous les axes du graphique. STATISTICA anticipe la meilleure disposition des

étiquettes sur les graphiques, mais si vous voulez afficher l’étiquetage de l’information diffé-

remment, il y a plusieurs options ici pour l’expérimenter. En particulier, la disposition et

l’affichage d’étiquettes peuvent être modifiées en changeant les options sous Ignorer des Va-

leurs et dans la boîte Mise en Forme en bas de l’onglet.

Onglet Axe - Unités perso.

Utilisez l’onglet Axe - Unités Perso pour représenter des valeurs numériques ou des valeurs-

texte sur l’axe sélectionné du graphique. Un formatage spécial peut être appliqué à ces va-

leurs ou étiquettes et chacune peut être accompagnée d’une graduation et/ou d’un quadrillage.

Dans le cas le plus simple, ces fonctionnalités peuvent être utilisées pour ajouter des éti-

quettes où vous le souhaitez sur les axes du graphique ; mais les mêmes fonctionnalités

peuvent être utilisées pour personnaliser complètement les unités des axes graphiques si vous

le souhaitez. Cet ensemble d’options peut être utilisé pour définir les intervalles de contours

des graphiques en 3D.

Onglet Axe - Généralités

Utilisez l’option Nouvel axe dans cet onglet pour placer autant de nouveaux axes que vous le

souhaitez sur le graphique. L’onglet Axe - Généralités permet aussi d’accéder aux options

contrôlant l’apparence générale de chaque axe individuel y compris la couleur, la forme des

lignes et leur épaisseur ainsi que la position de l’axe en fonction de la zone du tracé dans le

graphique. Cet onglet contient aussi un bouton Synthèse des Paramètres qui affichera comme

rappel une boîte de dialogue avec un bref résumé des options principales du graphique qui

ont un effet sur le graphique.

Notez que l’onglet Axe - Généralités et tous les autres onglets Axe - contiennent un bouton

Copier spécs de l’axe dans… qui affichera une boîte de dialogue du même nom vous permet-

tant de spécifier rapidement quels paramètres liés aux axes vous souhaitez copier depuis un

axe vers un autre.

EXEMPLE 30

1. Dans l’onglet Axe - Titre, sélectionnez l’axe X dans la boîte Axe et changez le titre en

Taille EN CM. Centrez le titre, mettez-le en caractères gras, attribuez-lui une taille de 12

points en utilisant les boutons de la barre d’outils dans cet onglet.

2. Dans l’onglet Axe - Échelle, sélectionnez l’axe X dans la boîte Axe et changez le Mode

Auto en Manuel. Ensuite spécifiez une valeur Minimum de 100 et Maximum de 210. Sélec-

tionnez l’axe Y gauche dans la boîte Axe et fixez également le mode Auto sur Manuel avec

une valeur Minimum de -10 et Maximum de 150.

3. Dans l’onglet Axe - Unités Principales, spécifiez l’axe Y gauche dans la boîte Axe. Chan-

gez le Mode Auto en Manuel et spécifiez l’Incrément sur 50.

4. Finalement, cliquez sur le bouton OK en bas de la boîte de dialogue Options du Graphique

pour redessiner le graphique avec ses échelles et étiquetages ajustés.

Page 89: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

83

Onglet Fonction Définie

L’onglet Fonction Définie dans la boîte de dialogue Options du Graphique permet l’ajout de

nombreuses fonctions personnalisées (par exemple, Y=-2*X + X^2 ou Z=3*X^2 - 2*Y^3 +

48) sur le graphique. Chaque fonction peut être appliquée sur une étendue spécifiée de va-

leurs X (ou valeurs X et Y dans le cas de tracés en 3D). Les équations de fonctions seront

automatiquement ajoutées en sous-titres dans le graphique.

EXEMPLE 31

1. Dans l’onglet Fonction Définie, cliquez sur le bouton Nouvelles fonctions pour ajouter une

fonction personnalisée au graphique. Dans la fenêtre fonction Y= ajoutez 0.5*X – 10. Ac-

ceptez tous les autres paramètres par défaut et cliquez sur le bouton OK pour ajouter la

fonction au graphique.

2. Dans l’onglet Titres/Textes et sous Options avancées, sélectionnez Texte Flottant dans la

liste déroulante Statut. Alors dans la barre d’outils, cliquez sur le bouton F= pour afficher

la liste des fonctions disponibles. Sélectionnez Fonction 1 à partir de la liste pour afficher

l’équation de la nouvelle fonction entrée. Maintenant, cliquez sur le bouton OK pour re-

dessiner le graphique.

3. Quand le graphique est redessiné, la fonction personnalisée sera placée dans la partie infé-

rieure gauche du graphique. Cliquez sur la fonction et déplacez-la dans la marge près de

la ligne de régression.

Page 90: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

84

L’utilisation des Styles graphiques est une façon supplémentaire de personnaliser l’apparence

des graphiques STATISTICA. Les Styles graphiques sont des ensembles d’options enregistrés

pouvant être rapidement appliqués pour changer simultanément l’apparence d’une variété de

caractéristiques graphiques, évitant ainsi le besoin de redéfinir constamment les options au

moment de créer les graphiques qui ont une apparence similaire. Les graphiques sont compo-

sés de collections d’objets graphiques ; c’est-à-dire, que se sont des collections d’étiquettes,

d’axes, de droites d’ajustement, de marqueurs de points, etc., aussi bien que des objets ajou-

tés séparément tels que des cercles, des boîtes de texte ou des flèches. Les styles graphiques

affectent les propriétés des objets graphiques (par exemple, la taille, la couleur, l’épaisseur, le

style de lignes ; la taille, la forme, et la couleur des marqueurs de points ; la couleur et la

forme utilisées pour la définition des aires ; la taille, la couleur, et les polices des étiquettes,

les titres, et les échelles). Les styles graphiques ne sont pas utilisés pour ajouter les objets aux

graphiques, mais pour spécifier les propriétés des objets déjà ajoutés au graphique.

Une fois qu’un style a été appliqué au graphique (soit durant la création du graphique soit

après sa création), les caractéristiques graphiques attribuées par le style sont changées. Le

graphique modifié résultant est, par conséquent, exactement le même que si ses caractéris-

tiques avaient été changées manuellement en utilisant les options disponibles dans les boîtes

de dialogue de création ou de personnalisation du graphique.

Un graphique avec un style appliqué peut être envoyé à un autre utilisateur STATISTICA et

ses caractéristiques seront correctement interprétées même si l’utilisateur n’a pas défini un

style de graphique équivalent. Les styles graphiques (avec des ensembles complets d’options

graphiques générales définies) peuvent être enregistrés, exportés, ou importés depuis l’onglet

Gestionnaire de Configuration dans la boîte de dialogue Options accessible depuis le menu

Outils.

EXEMPLE 32

1. Créez un histogramme 2D en utilisant le

fichier de données Characteristics.sta et

la variable Test Total (Moy) en acceptant

les valeurs par défaut.

Double-cliquez dans la marge de

l’histogramme pour afficher la boîte de

dialogue Options du Graphique.

2. Dans l’onglet Fenêtre Graphique, modifiez la couleur du fond extérieur du graphique en

noir. Dans l’onglet Titres/Textes, changez les couleurs des Titre et Sous-Titre en blanc. Sé-

lectionnez alors l’onglet Tracé - Barres et cliquez sur le bouton Aires. Dans la boîte de

dialogue Propriétés de la surface, sélectionnez la seconde structure (vierge) dans la ma-

trice Motifs de surface et sélectionnez la Couleur Arrière-plan en blanc et Couleur Premier-

plan en noir.

3. Ensuite, dans l’onglet Axe - Valeurs d’échelles sélectionnez l’axe X dans la boîte Axe ;

puis cliquez sur le bouton Police. Dans la boîte de dialogue Police sous Effets, fixez la

Couleur sur blanc. Cliquez sur le bouton OK pour fermer la boîte de dialogue Police et ré-

pétez les étapes pour l’axe Y.

Page 91: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

85

4. Dans l’onglet Axe - Titres modifiez la couleur

de la police en blanc pour les axes X et Y. Fina-

lement, cliquez sur le bouton OK dans la partie

inférieure de la boîte de dialogue Options du

Graphique pour redessiner le graphique. Il de-

vrait apparaître comme l’illustration graphique

suivante.

5. Effectuez sur le graphique redessiné, un

clic droit dans la boîte des Styles Gra-

phiques du côté gauche de la barre

d’outils Outils Graphiques. Sélectionnez

Enregistrer Sous dans le menu contex-

tuel et donnez un nom au style (par

exemple, HistogrammeN&B) dans la

boîte Nom de Style. Puis cliquez sur le

bouton Enregistrer Sous … pour fermer

ce menu.

6. Fermez le graphique modifié et créez un

nouvel histogramme à partir du même

fichier de données en utilisant la variable

Poids (kg). A partir de la liste des styles

graphiques disponibles dans la boîte des

Styles Graphiques, sélectionnez le nou-

veau style (HistogrammeN&B) pour

l’appliquer au graphique créé.

4.

STATISTICA contient tout une gamme d’outils pour une exploration interactive des données

graphiques. Nous avons déjà discuté de l’utilisation de la Mise à jour Automatique comme

outil exploratoire dans un précédent paragraphe. Celui-ci concernera l’utilisation des fonc-

tions de Zoom, d’Habillage, et de Rotation comme outils supplémentaires pour l’exploration

des données.

Les fonctions du zoom sont disponibles dans la barre d’outils Outils Graphiques.

Cliquez sur le bouton Zoom avant de la barre d’outils sur une zone spécifique d’un gra-

phique en 2D ou en 3D pour effectuer un agrandissement soit en cliquant avec la souris au

centre de la zone que vous voulez agrandir soit en créant un rectangle pour définir la zone du

zoom. En re-sélectionnant l’outil et en répétant la procédure sur la portion agrandie du gra-

phique, des étapes supplémentaires d’agrandissement peuvent être réalisées.

Page 92: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

86

Cliquez sur le bouton Zoom arrière de la barre d’outils pour “annuler” l’agrandissement

appliqué par l’outil Zoom avant. Chaque fois que l’outil est appliqué en cliquant avec la sou-

ris sur la zone en question, une étape de l’agrandissement précédent sera supprimée. L’outil

doit être re-sélectionné entre des zooms arrières successifs. Pour annuler tous les agrandisse-

ments précédemment appliqués, cliquez sur le bouton Annuler zoom de la barre d’outils.

(Notez qu’une option pour zoomer/agrandir une zone du graphique spécifique définie en uni-

tés d’échelles est disponible dans l’onglet Mise en Forme de la boîte de dialogue de

personnalisation Options du Graphique.)

EXEMPLE 33

1. En utilisant le fichier de données Characteristics.sta, créez un Nuage de Points en 2D en

utilisant la variable Taille (cm) sur l’axe X et la variable Poids (kg) sur l’axe Y.

2. Cliquez sur le bouton Zoom avant de la barre d’outils, et placez le pointeur de la souris à

peu près au centre du nuage de points à la taille = 175 cm et poids environ 90 kg. Ensuite

cliquez pour agrandir et augmenter la résolution du graphique. Vous pouvez re-

sélectionner le Zoom avant et cliquer encore sur la même zone du graphique pour un autre

agrandissement.

Notez que c’est un vrai zoom augmentant non seulement la résolution du tracé mais aussi

les caractéristiques du tracé tel qu’il a été créé à l’origine.

3. Cliquez ensuite sur le bouton Zoom arrière pour retourner à l’état original du graphique.

Page 93: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

87

Cliquez sur le bouton Habillage de la barre d’outils Outils Graphiques pour afficher la

boîte de dialogue Habillage (voir l’illustration suivante) contenant les outils permettant

d’identifier des points ou groupes de points aussi bien sur des graphiques 2D que 3D en les

marquant, étiquetant, ou en les désactivant temporairement (c’est-à-dire, en les supprimant du

graphique et des calculs des fonctions d’ajustement, etc.). Quand l’habillage est activé, le

pointeur de la souris se transforme par défaut en loupe avec une forme de “viseur” . Le

pointeur peut être utilisé pour sélectionner/mettre en surbrillance soit des points individuels

(sélectionnez l’option Point sous Sélection des outils d’habillage dans la boîte de dialogue

Habillage), soit des groupes de points (Lasso ou Rectangle). D’autres options telles que la

Section X, Y, et Z et le Cube peuvent être utilisées pour définir des zones sur un tracé 2D ou

3D ou des volumes sur un tracé 3D. Les aires ou volumes définis par les options Lasso, Rec-

tangle, Coupe, et Cube peuvent être animé(e)s pour se déplacer sur l’étendue du tracé (ou une

matrice de tracés pour certaines observations) afin d’explorer la distribution spatiale des va-

leurs.

1. Intégration étroite entre les graphiques et les données-source.

Page 94: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

88

2. Utilisez la fonctionnalité de balayage dans un nuage de points afin de marquer automati-

quement les observations dans la feuille de données, et ainsi, pouvoir utiliser directement

ces sous-ensembles dans vos analyses ultérieures.

3. Le statut défini par le Balayage est répercuté en amont sur la feuille de données et donc,

en aval, sur l'ensemble des graphiques actuellement ouverts qui sont connectés à cette

feuille de données ; vous pouvez ainsi balayer les points d'un graphique et observer la

manière dont les observations sélectionnées se comportent dans les autres graphiques

ouverts.

Les événements définis par le Balayage dans un graphique permettent de mettre à jour le sta-

tut des observations dans la feuille de données en leur affectant les attributs : Étiqueté/Non-

Étiqueté, Exclu des Calculs/Inclus dans les Calculs, ou Marqué/Non-marqué). D'autres gra-

phiques reposant sur les mêmes données pourront alors être mis à jour pour refléter ces

attributs définis sur le graphique initial.

Avec les points mis en surbrillance, cliquez sur le bouton Mise à jour dans la boîte de dialogue

Habillage entraîne l’exécution de l’action spécifiée (étiquetage, marquage, désactivation, etc…).

Les actions prises peuvent être inversées en cliquant sur le bouton Réinitialiser tout.

Le bouton Quitter ferme la boîte de dialogue laissant intactes les actions déjà appliquées.

Page 95: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

89

EXEMPLE 34

Créez un Nuage de points en 2D avec Taille (cm) comme variable X et Poids (kg) comme

variable Y en utilisant le fichier de données Characteristics.sta.

Activez l’outil d’habillage et gardez les

paramètres par défaut des options de la

boîte de dialogue Habillage 2D. Cliquez

avec le pointeur de la souris sur les

points de faible poids dans la partie in-

férieure du graphique correspondant

aux tailles 170 et 178 cm. Dans la boîte

de dialogue Habillage 2D, sélectionnez

l’option Étiqueter les points sélection-

nés sous Action. Finalement, cliquez

sur le bouton Mise à jour pour voir

quelles observations correspondent aux

deux points sélectionnés.

EXEMPLE 35

1. Ouvrez le fichier de données Characteristics.sta, et sélectionnez Tracés Matriciels dans le

menu Graphiques. Acceptez toutes les options par défaut dans l’onglet Base et spécifiez

les variables Test Élément 1, Test Élément 2, et Test Élément 3. Cliquez ensuite sur le

bouton OK pour créer le tracé.

2. À présent, activez l’habillage en cliquant sur le bouton Habillage de la barre d’outils, et

dans la boîte de dialogue Habillage 2D, sélectionnez l’option Rectangle sous Type de Sé-

lection d’Habillage. Au centre du nuage de points, construisez un rectangle autour de

plusieurs points. Votre graphique devrait maintenant ressembler à celui ci-dessous.

3. Notez qu’en plus des points mis en surbrillance dans le graphique dans lequel la boîte a

été dessinée, les points avec les valeurs correspondantes sont aussi mis en surbrillance

dans les autres nuages de points de la matrice. Cliquez sur le bouton Animer dans la boîte

de dialogue Habillage 2D pour mettre la zone de sélection en mouvement afin d’explorer

les points supplémentaires correspondants. Notez que vous pouvez contrôler l’animation

en utilisant les options de la boîte de dialogue Animation ou l’arrêter sur n’importe quel

point en cliquant sur le bouton OK. (Sélectionner Annuler renvoie l’animation à sa posi-

tion initiale, avant d’avoir cliqué sur le bouton Animation.)

Page 96: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

90

Les graphiques en 3D de STATISTICA peuvent subir des rotations autour de l’axe horizontal

et de l’axe vertical et la perspective ou “point de vue” change pour explorer la distribution

des données 3D ou pour obtenir la meilleure position avec un affichage clair des graphiques

importants.

Pour explorer un graphique en rotation, cliquez sur le bouton Rotation 3D du Graphique

dans la barre d’outils des Outils Graphiques pour afficher la boîte de dialogue Paramétrage du

Point de Vue et Rotation Exploratoire (voir l’illustration suivante), contenant des contrôles

multiples pour changer de manière interactive (ou spécifier numériquement) les angles de vue

horizontale et verticale ainsi que la perspective du graphique.

Cliquez sur le bouton Options de rotation

dans une optique exploratoire en haut de la

boîte de dialogue pour commencer la rota-

tion du graphique et exposer des options

supplémentaires se rapportant au contrôle de

la rotation. La rotation peut être arrêtée à

n’importe quel moment en cliquant sur le

bouton Stop ou le bouton OK et le graphique

s’affichera dans sa nouvelle perspective.

EXEMPLE 36

1. Créez une surface de réponse en 3D. Ouvrez le fichier de données Characteristics.sta et

sélectionnez Surfaces de Réponses dans l’onglet Graphiques. Sélectionnez Age (an) sur

l’axe X, Taille (cm) sur l’axe Y, et Poids (kg) comme variable Z. Acceptez tous les para-

mètres par défaut dans l’onglet Base de la boîte de dialogue Surfaces de Réponses et

cliquez sur le bouton OK pour produire le graphique. Il devrait apparaître comme le tracé

de l’illustration suivante.

En étudiant le tracé, nous pouvons supposer qu’un angle de vue sensiblement différent

rendrait l’affichage plus facilement interprétable.

Cliquez sur le bouton Rotation 3D du Gra-

phique pour afficher la boîte de dialogue Paramétrage du Point de Vue et Rotation

Exploratoire. Cliquez sur le bouton Options de rotation dans une optique exploratoire pour faire tourner le graphique. Nous pou-

vons constater, en observant le graphique

tourner sur un axe vertical, qu’il existe de

meilleures perspectives pour étudier la sur-

face de réponse. Cliquez sur le bouton OK

quand le graphique vous semble avoir une

meilleur position (ou utilisez les autres

contrôles pour positionner manuellement le

graphique comme vous le voulez et cliquez

ensuite sur le bouton OK. Le graphique de-

vient beaucoup plus facile à interpréter.

Page 97: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

91

Le langage industriel standard STATISTICA Visual Basic (intégré dans STATISTICA) offre

incomparablement plus qu’un simple “langage de programmation supplémentaire” pouvant

être utilisé pour écrire des extensions personnalisées. STATISTICA Visual Basic (SVB) tire

pleinement avantage du modèle d’architecture objet de STATISTICA et vous permet

d’accéder par programmation à tous les aspects et pratiquement tous les détails des fonction-

nalités du programme. Même les analyses et graphiques les plus complexes peuvent être

enregistrés dans des macros Visual Basic (SVB) et exécutés par la suite de manière routinière

ou éditées et utilisées comme des blocs construits pour d’autres applications. STATISTICA

Visual Basic ajoute plus de 10 000 nouvelles fonctions à la syntaxe standard complète de Mi-

crosoft Visual Basic constituant ainsi un des environnements de développement les plus

riches.

STATISTICA propose une sélection complète de procédures d’enregistrements des macros

(programmes SVB) pour automatiser un travail répétitif ou pour être utilisées comme un

moyen de générer automatiquement des programmes pour les éditer ou les modifier. Les pro-

grammes STATISTICA Visual Basic enregistrés par ces fonctionnalités peuvent être

enregistrés pour être exécutés “tels quels”, ou ils peuvent être utilisés comme des “blocs de

construction” pour des programmes Visual Basic plus complexes ou hautement personnali-

sés.

Il y a trois catégories générales de macros pouvant être automatiquement créées quand vous

exécutez le programme :

1.

Tout d’abord, vous pouvez enregistrer des macros simples d’analyse à partir d’une analyse

pour enregistrer les réglages, sélections, et options retenues pour cette analyse spécifique.

(Notez que le terme “analyse” dans STATISTICA dénote une tâche sélectionnée soit depuis le

menu Statistiques soit depuis le menu Graphiques, qui peut être très petite et simple (par

exemple, un nuage de points construit à partir du menu Graphiques), ou très élaborées (par

exemple, une analyse d’équations structurelles complexe sélectionnée en choisissant cette

commande depuis le menu Statistiques, et impliquant des centaines de documents de sortie).

Après avoir sélectionné vos commandes statistiques dans le menu Statistiques ou commandes

graphiques dans le menu Graphiques, toutes les actions comme les sélections de variables, les

réglages d’options, etc. sont enregistrées en “arrière-plan.” A n’importe quel moment vous

pouvez alors transférer cet enregistrement (c’est-à-dire, le code Visual Basic de cette macro)

vers la fenêtre d’Édition Visual Basic. Notez que la commande Créer une Macro est disponible

depuis toutes les analyses via le bouton Options (voir ci-dessous) puis le menu déroulant qui

apparaît.

Page 98: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

92

2.

Ensuite, vous pouvez enregistrer une filière d’analyses de votre session entière pouvant con-

tenir plusieurs analyses ; cet enregistrement “connectera” les analyses réalisées avec diverses

options d’analyses à partir du menu Statistiques ou Graphiques. Toutefois, contrairement aux

macros d’analyse simples, vous pouvez arrêter momentanément l’enregistrement des filières

d’analyses. L’enregistrement d’une filière d’analyses commencera lorsque vous activerez

l’enregistrement, et il se terminera quand vous le stopperez. Entre ces actions, toutes les sé-

lections de fichiers et la plupart des opérations de gestion des données seront enregistrées,

dans l’ordre des évènements.

3.

Quand vous sélectionnez Enregistrer une macro au clavier depuis le menu Outils - Macro,

STATISTICA enregistrera les frappes que vous entrez au clavier. Quand vous arrêtez

l’enregistrement, une fenêtre d’édition STATISTICA Visual Basic s’ouvrira avec un pro-

gramme très simple contenant une commande simple de séquences de frappes de touches

avec les symboles représentant les différentes frappes de touches que vous avez effectuées

pendant l’enregistrement. Notez que ce type de macro est très simple en ce sens qu’il

n’enregistre pas le contexte dans lequel les frappes de touches sont utilisées et n’enregistrera

pas leur signification (c’est-à-dire, les commandes que ces touches déclenchent), mais cette

fonctionnalité les rend particulièrement utiles pour quelques applications spécifiques.

Toutes trois suivent une même syntaxe et peuvent être modifiées ultérieurement. Mais en rai-

son des différentes manières de créer ces macros, elles offrent des avantages et inconvénients

distincts pour des applications spécifiques.

EXEMPLE 37

Pour cet exemple, la sortie doit être envoyée automatiquement vers un seul classeur. Cet

exemple va vous guider à travers une analyse simple tandis que le script SVB est créé en ar-

rière-plan. Vous n'avez pas besoin de demander l'enregistrement de la Macro d'Analyse pour

que son enregistrement débute. Vous devez cependant demander le script lorsque vous avez

terminé l'analyse pour l'enregistrer en tant que macro et l'utiliser à l'avenir. Suivez ces

simples étapes et souvenez-vous que cette fonctionnalité est disponible dans toutes les boîtes

de dialogue d'analyse de tous les modules de STATISTICA.

1. Fermez toutes les anciennes analyses et fenêtres de sortie. Ouvrez le fichier de données

Characteristics.sta. A partir du menu Statistiques, sélectionnez Statistiques Élémentaires.

Sélectionnez Matrices de corrélation et cliquez sur OK. Cliquez sur le bouton 1 liste de va-

riables et sélectionnez Taille à Test Eléments 3. Cliquez sur OK. Cliquez sur le bouton

Synthèse. Reprenez l'analyse (CTRL-R) et cliquez sur l'onglet Avancé/tracé. Cliquez sur

le bouton Histogrammes en 3D. Sélectionnez Couleur des Yeux dans 1ère variable, et Cou-

leur des Cheveux dans 2nde variable. Cliquez sur le bouton OK pour créer le graphique.

Page 99: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

93

2. Vous avez terminé l'analyse. Maintenant,

vous souhaitez enregistrer ces étapes dans

une macro. Pour ce faire, revenez à la boîte

de dialogue de l'analyse et cliquez sur le

bouton Options. Sélectionnez Créer une

Macro.

STATISTICA va vous demander de nommer la

macro. Entrez un nom dans le champ d'édition

Nom. Cliquez sur OK.

Après quelques instants, un script STATISTICA Visual Basic va apparaître dans une fenêtre

d'édition. Une fois que le code est généré pour vous, sélectionnez Enregistrer Sous à partir du

menu Fichier et enregistrez la macro. (Le script complet n'est pas affiché ci-dessous).

3. A présent testez la macro. Fermez toutes les fenêtres (et les analyses minimisées) de votre

écran mis à part le fichier de données Characteristics.sta et le script SVB. Le script étant

la fenêtre active, remarquez que la barre d'outils des macros est présente. Dans cette barre

d'outils, cliquez sur le bouton Exécuter la Macro pour l'exécuter. Les mêmes résul-

tats vont s'afficher dans le classeur de la même façon que lorsque l'analyse avait été

menée de manière interactive.

Notez que cette macro peut également être exécutée sur différents fichiers de données où

l'utilisateur souhaite calculer des corrélations et créer un histogramme en 3D avec les seconde

et troisième variables. Le script est également modifiable. Avec très peu de connaissance du

langage Visual Basic, vous devez être capable d'éditer directement le script pour calculer les

statistiques sur d'autres variables du fichier de données, ou même modifier les statistiques à

calculer, sans enregistrer à nouveau l'analyse.

STATISTICA offre la souplesse d’interfaces utilisateur complètement personnalisables. Le

programme permet d’ajuster l’interface utilisateur standard pour répondre au mieux à vos be-

soins spécifiques. En fait, STATISTICA “anticipe” vos besoins dans le sens où il garde en

mémoire les différents choix que vous avez fait, essentiellement un apprentissage au démar-

rage. Par exemple, si vous exécutez une analyse depuis l’onglet Avancé dans une boîte de

dialogue de spécification d’analyse, l’onglet Avancé sera alors sélectionné pour vous (au lieu

de l’onglet Base) à la prochaine utilisation de cette boîte de dialogue.

Pratiquement tous les aspects de l’interface-utilisateur peuvent être personnalisés, en com-

mençant par des contrôles élémentaires personnalisés tels que les menus, les barres d’outils,

Page 100: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

94

et les raccourcis clavier. La procédure permettant de personnaliser ces composantes à l’écran

est rapide et directe. Vous pouvez personnaliser globalement ou localement vos graphiques,

feuilles de données, classeurs, rapports, etc., et maintenir différentes configurations de STA-

TISTICA (pour un seul utilisateur aussi bien que pour des utilisateurs en réseau). Vous

pouvez aussi définir entièrement de nouvelles interfaces. Et enfin, vous pouvez modifier

l’arrière-plan STATISTICA via le menu Personnaliser, onglet Arrière-plan.

STATISTICA comporte un ensemble de barres d’outils contenant les boutons les plus deman-

dés ou contrôles spéciaux pour une tâche particulière.

Par défaut, la barre du menu, barre d’outils

Standard, et la barre d’outils Feuille de don-

nées sont visibles quand STATISTICA s’ouvre

pour la première fois. D’autres barres d’outils

sont visibles quand elles sont nécessaires et la

(ou les) barre(s) d’outil(s) associée(s) aux

types de document respectifs remplace(nt) la

barre d’outils Feuille de données. Par exemple,

quand un graphique est le document actif, la

barre d’outils des Outils graphiques est visible.

Les barres d’outils peuvent être gérées depuis

le menu Affichage – Barres d’outils ainsi que

depuis l’onglet Barres d’outils de la boîte de

dialogue Personnaliser (disponible via le menu

Outils - Personnaliser).

Notez que les barres d’outils STATISTICA sont cachées pendant l’activation sur place

d’objets Non-STATISTICA. Ainsi, ne vous attendez pas à voir des barres d’outils STATISTI-

CA lors de l’édition d’un document Microsoft Word (ou document similaire) inséré dans un

document STATISTICA.

Outre les barres d’outils par défaut, vous pouvez créer vos propres barres d’outils en utilisant

des combinaisons de boutons ou contrôles spéciaux (par exemple, police et taille, couleur de

police, ou styles graphiques). Comme avec les barres d’outils STATISTICA, elles peuvent être

activées quand vous en avez besoin.

Lorsque vous travaillez avec STATIS-

TICA, l’aide est accessible depuis le

menu Aide. Sélectionnez Index pour

afficher le sommaire du Manuel Élec-

tronique STATISTICA, aussi bien que

la fonction Rechercher de l’aide.

Le Conseiller Statistique présente des questions simples sur la nature de votre problématique

et le type de données afin de vous aider à décider quelles procédures statistiques utiliser.

Enfin des Didacticiels vous donneront une présentation des diverses routines fréquemment

utilisées dans STATISTICA.

Le site Internet de StatSoft fournit des informations supplémentaires telles qu’un Manuel

Électronique en ligne.

Page 101: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

95

Ces explications, définitions, et formules sont données comme un complément rapide au sup-

port de cours Introduction à STATISTICA. Il contient les termes utilisés dans ce document et

la formation. Ces définitions se trouvent également dans le Manuel Électronique (Electronic

Text) sur notre site Web à l’adresse www.statsoft.com. Veuillez noter que toutes les réfé-

rences se trouvent dans l’Electronic Textbook.

Aplatissement. Les mesures d’“aplatissement” d’une distribution font partie des mesures de

forme et caractérisent un aspect de la forme d’une distribution donnée. Plus précisément,

elles caractérisent le degré d’aplatissement de la distribution normale. En effet, certaines

distributions se rapprochent de la loi normale sans toutefois y être totalement identiques.

Il est alors utile de pouvoir tester si la forme de la distribution présente une déviation par

rapport à l’aplatissement de la distribution normale. On parle de distribution platicurtique

si la courbe est plus aplatie que la courbe normale et de distribution leptocurtique si la

courbe est plus pointue que la courbe normale. Si l’aplatissement est nettement différent

de 0, alors la distribution est soit étalée soit pointue par rapport à une courbe normale. Le

coefficient d’aplatissement ou kurtosis d’une distribution normale est 0. Il est calculé ain-

si :

Kurtosis = [n*(n+1)*M4 - 3*M2*M2*(n-1)] / [(n-1)*(n-2)*(n-3)*4]

où : Mj est égal à : (xi-Moyennex)j

n est le nombre d’observations valides

4 est l’écart-type (sigma) élevé à la puissance 4

Asymétrie. Dans une distribution symétrique, la médiane, la moyenne et le mode se confon-

dent en un même point central. Cet équilibre n’existe plus lorsqu’il y a asymétrie. Dans ce

cas, le mode est séparé de la moyenne, et la médiane se trouve entre les deux. Par consé-

quent, il est nécessaire de développer des mesures d’asymétrie pour appréhender le degré

de déviation de la forme de la distribution par rapport à une distribution symétrique. Si

l’asymétrie est nettement différente de 0, alors cette distribution est asymétrique, alors

que les distributions normales sont parfaitement symétriques.

Asymétrie = n*M3/[(n-1)*(n-2)* 3]

où M3 est égal à : (xi-Moyennex)3

3 est l’écart-type (sigma) élevé à la puissance trois

n est le nombre d’observations valides.

Atypiques. Les points atypiques (par définition), des observations non fréquentes ; des points

qui n’apparaissent pas suivre la distribution caractéristique du reste des données. Elles

peuvent refléter les vraies propriétés du phénomène sous-jacent (variable) ou être dues à

des erreurs de mesure ou autres anomalies qui ne devraient pas être modélisées.

Centiles. Le centile d’une distribution de valeurs est un nombre xp tel qu’un pourcentage p

des valeurs de la population est inférieur ou égal à xp. Par exemple, le 25ème

centile (aussi

appelé le quantile 0.25 ou quartile inférieur) d’une variable est une valeur (xp) telle que

25% (p) des valeurs de la variable se trouvent inférieures à cette valeur.

De même, le 75ème

centile (aussi appelé le quantile 0,75 ou quartile supérieur) est une va-

leur telle que 75% des valeurs de la variable sont supérieures à cette valeur et est calculée

en conséquence.

Page 102: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

96

Corrélation. La corrélation est une mesure de la relation entre deux ou plusieurs variables.

Les coefficients de corrélation peuvent osciller entre -1.00 et +1.00. La valeur de -1.00

représente une corrélation négative parfaite tandis qu’une valeur de +1.00 représente une

parfaite corrélation positive. Une valeur de 0.00 représente une absence de corrélation.

Degrés de Liberté. Utilisés à des niveaux sensiblement différents au cours d’une étude sta-

tistique, les Degrés de Liberté étaient d’abord introduits par Fisher sur la base d’une idée

de degrés de liberté dans un système dynamique (par exemple, le nombre de valeurs in-

dépendantes co-ordonnées nécessaires pour le déterminer). Les degrés de liberté d’un

ensemble d’observations sont le nombre de valeurs qui pourraient être affectées au sein

des spécifications du système. Par exemple, dans un échantillon de taille n groupé dans k

intervalles, il y a k-1 degrés de liberté, parce que k-1 fréquences sont spécifiées alors que

l’autre est spécifié par la taille totale n. Ainsi dans une table de contingence p par q avec

des totaux marginaux fixés, il y a (p-1)(q-1) degrés de liberté. Dans quelques circons-

tances le terme degrés de liberté est utilisé pour afficher le nombre de comparaisons

indépendantes pouvant être faites entre les membres d’un échantillon.

Dans une autre acceptation, les degrés de liberté se référent au nombre de termes linéai-

rement indépendants impliqués dans le calcul d’une somme de carrés sur n observations

indépendantes. La somme des déviations de n observations par rapport à leur moyenne

arithmétique est toujours égale à zéro. Cette exigence constitue une contrainte sur cha-

cune des déviations Yi-Ybarre utilisées dans le calcul de la variance. Cette contrainte

implique que n-1 déviations déterminent complètement la nème

. On dit alors que les n dé-

viations (et donc également leur somme de carrés et la variance de l’échantillon S²) ont n-

1 degrés de liberté.

Écart-Type. L’écart-type est une mesure de dispersion très largement utilisée. Il correspond

à la racine carrée positive de la variance, où la variance est la moyenne des déviations au

carré de chaque observation par rapport à la moyenne de l’ensemble des observations.

L’écart-type d’une population de valeurs est calculé comme :

= [ (xi-µ)2/N]

1/2

où µ est la moyenne de la population

N est la taille de la population.

L’écart-type de la population issu d’un échantillon est calculé dans STATISTI-

CA comme :

s = [ (xi-xbarre)2/n-1]

1/2

où xbarre est la moyenne d’échantillon

n est la taille d’échantillon.

Erreur-Type de la Moyenne. L’erreur-type de la moyenne ou écart-type de la distribution

d’échantillonnage des moyennes dépend de la variance de la population (sigma) et la

taille d’échantillon (n) comme indiqué ci-dessous :

x-barre= (2/n)

1/2

où 2 est la variance de la population et

n est la taille d’échantillon.

Puisque la variance de la population est inconnue, le meilleur estimateur de l’erreur-type

de la moyenne est calculé ainsi :

sx-barre = (s2/n)

1/2

Page 103: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

97

où s2 est la variance de l’échantillon (estimateur de la variance de la population)

n est la taille d’échantillon.

Si la population est infinie ou si l’échantillon est non exhaustif (avec remise), l’erreur-

type de la moyenne est donc égale à l’écart-type de la population divisé par la racine carré

de la taille d’échantillon.

Échelles de Mesure. Les variables diffèrent dans la manière d’être mesurées, c’est-à-dire,

dans quelles circonstances leur échelle de mesure peut renseigner. Il y a évidemment

quelques erreurs de mesure impliquées dans chaque mesure, qui déterminent la “somme

d’information” que nous pouvons obtenir. Un autre facteur déterminant la somme

d’information fournie par une variable est son “type d’échelle de mesure.” Précisément

les variables sont classées en (a) nominale, (b) ordinale, (c) intervalle ou (d) ratio.

a. Les variables Nominales permettent seulement d’effectuer une classification qualita-

tive. C’est-à-dire qu’elles peuvent être mesurées uniquement en termes d’appartenance

à des catégories distinctivement différentes, mais nous ne pouvons pas quantifier ou

même ranger ces catégories. Par exemple, tout ce que nous pouvons dire est que 2 in-

dividus sont différents selon la variable A (par exemple, ils sont de race différente),

mais nous ne pouvons pas dire lequel “dispose le plus ” de la qualité représentée par la

variable. Des exemples typiques de variables nominales sont le sexe, la race, la cou-

leur, la ville, etc.

b. Les variables Ordinales nous permettent de ranger les éléments que nous mesurons se-

lon qu’ils ont plus ou moins de la qualité représentée par la variable, mais nous ne

pouvons toujours pas mesurer leur différence. Un exemple typique de variable ordinale

est le statut socio-économique des familles. Par exemple, nous savons que la moyenne

supérieure est plus élevée que la moyenne, mais nous ne pouvons pas dire qu’il y a,

par exemple, 18% de plus. Ainsi cette nette distinction entre nominale, ordinale, et les

intervalles d’échelles représentent un bon exemple d’une variable ordinale. Par

exemple, nous pouvons dire que les mesures nominales fournissent moins

d’informations qu’une mesure ordinale, mais nous ne pouvons pas dire de “combien

elles diffèrent ” ou de combien est cette différence entre les variables ordinales et les

échelles d’intervalles.

c. Les variables d’Intervalles nous permettent non seulement de ranger les éléments me-

surés, mais aussi de quantifier et de comparer les différences qui existent entre eux.

Par exemple, la température, mesurée aussi bien en degrés Fahrenheit ou en degrés

Celsius, constitue une échelle d’intervalle. Nous pouvons dire qu’une température de

40 degrés est plus élevée qu’une température de 30 degrés, et qu’une augmentation de

20 à 40 degrés est le double d’une augmentation de 30 à 40 degrés.

d. Les variables Ratio sont très proches des variables d’Intervalles ; outre les propriétés

des variables d’intervalles, elles présentent un point zéro absolu identifiable, ainsi elles

permettent des relations telles que x est égal à deux fois y. Des exemples typiques

d’échelles de ratio sont les mesures de temps ou d’espace. Par exemple, comme

l’échelle de température de Kelvin est une échelle de ratio, non seulement nous pou-

vons dire qu’une température de 200 degrés est supérieure à 100 degrés, mais nous

pouvons également dire qu’elle est deux fois plus importante. Les échelles

d’intervalles n’ont pas la propriété de ratio. La plupart des procédures analytiques sta-

tistiques de données ne distinguent pas la différence entre les propriétés d’intervalles et

de ratio des échelles de mesure.

Page 104: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

98

Erreur de Type I (Alpha). Dans la réalisation d’un test d’hypothèse, on appelle erreur de

première espèce Alpha la probabilité de rejeter l’hypothèse nulle H0, alors que celle-ci est

vraie. L’erreur de première espèce Alpha est égale au seuil de signification du test

d’hypothèse.

Intervalle de Confiance. Les intervalles de confiance pour des statistiques spécifiques (par

exemple, moyennes ou droites de régression) nous donnent une étendue de valeurs, calcu-

lée à partir des observations de l’échantillon, ayant une certaine probabilité de contenir la

vraie valeur du paramètre de la population. Le calcul des intervalles de confiance est basé

sur l’hypothèse de normalité de la population. Cette estimation n’est pas correcte si

l’hypothèse n’est pas vérifiée, à moins que la taille d’échantillon soit importante (n >=

100). Il faut être prudent dans l’interprétation de l’intervalle de confiance. Si, à un niveau

de confiance de 95%, nous trouvons un intervalle de confiance pour une moyenne dont

les bornes inférieures et supérieures sont respectivement k1 et k2, nous pourrons conclure

que « sur la base de l’échantillon étudié, nous pouvons affirmer qu’il est probable que la

moyenne de la population se trouve dans l’intervalle établi. ». En revanche, il serait faux

de conclure qu’il y a 95% de chances pour que la moyenne de la population se trouve

dans l’intervalle. En effet la moyenne étant une constante, de même que les bornes k1 et

k2 de l’intervalle, l’intervalle contient ou ne contient pas la moyenne.

Intervalle InterQuartile. L’intervalle interquartile d’une variable est calculé comme la va-

leur du 75ème

centile moins la valeur du 25ème

centile. Ainsi la largeur de l’étendue autour

de la médiane comprend 50% des observations.

Médiane. C’est une mesure de tendance centrale définie comme la valeur qui se trouve au

centre d’un ensemble d’observations lorsque celles-ci sont rangées par ordre croissant ou

décroissant. La médiane d’un échantillon est la valeur pour laquelle 50% des observations

(une fois rangées) sont placées de part et d’autre de cette valeur. Quand le nombre de va-

leurs dans l’échantillon est pair, la médiane est calculée par la moyenne des deux

observations du milieu.

Méthodes pour Traiter les Valeurs Manquantes :

Supprimer les VM. Quand cette option est sélectionnée, alors seules les observations

qui ne contiendront pas de données manquantes pour toutes les variables sélectionnées

seront inclues dans l’analyse. Dans le cas de corrélations, toutes les corrélations sont

calculées en retirant les observations qui ont des données manquantes pour toutes les

variables sélectionnées (toutes les corrélations sont basées sur le même ensemble de

données).

Remplacement des VM par la Moyenne. Quand vous sélectionnez cette option, les

données manquantes seront remplacées par les moyennes des variables respectives

pendant l’analyse.

Ignorer les VM. Quand cette option est sélectionnée, les observations seront exclues de

tous les calculs impliquant les variables pour lesquelles il y a des données manquantes.

Dans le cas de corrélations, les corrélations entre chaque paire de variables sont calcu-

lées à partir de toutes les observations ayant des données valides pour ces deux

variables.

Mode. C’est une mesure de tendance centrale, le mode d’un échantillon est la valeur que

l’on rencontre le plus fréquemment, c’est-à-dire celle qui la plus grande fréquence.

Page 105: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

99

Moyenne. La moyenne d’une variable aléatoire est une mesure de “tendance centrale” repor-

tée avec ses intervalles de confiance. Cette mesure nous donne une estimation de la

moyenne de la variable aléatoire X dont sont issues les observations. Plus la taille

d’échantillon est importante, plus sa moyenne sera fiable. Plus la dispersion des données

est importante, moins la moyenne sera fiable.

Moyenne = (xi)/n où n est la taille d’échantillon.

Moyenne Géométrique. La Moyenne Géométrique est une statistique de “synthèse” utile

quand l’échelle de mesure n’est pas linéaire ; dans la pratique, la moyenne géométrique

est utilisée essentiellement quand on désire calculer la moyenne de ratios ou plus particu-

lièrement la moyenne d’indices ; elle est calculée ainsi :

G = (x1*x2*...*xn)1/n

où n est la taille d’échantillon.

Comme la moyenne arithmétique, la moyenne géométrique prend en compte chaque ob-

servation individuellement. Toutefois, elle diminue l’effet des grands nombres. C’est une

raison pour laquelle elle est parfois préférée à la moyenne arithmétique. Un des aspects

importants de la moyenne géométrique est qu’elle ne s’applique qu’aux nombres positifs.

Moyenne Harmonique. La Moyenne Harmonique est une statistique de “synthèse” utilisée

dans les analyses de fréquences ; elle est calculée ainsi :

H = n * 1/ (1/xi) où n est la taille de l’échantillon.

La moyenne harmonique est très peu utilisée en statistique. Toutefois, elle peut se révéler

appropriée dans certains cas. Par exemple :

-Si un ensemble d’investissements à des taux différents amène chacun le même revenu, le

taux unique auquel le capital doit être investi pour produire le revenu total est égal à la

moyenne harmonique des différents taux individuels.

-Si un montant identique est investi dans plusieurs biens de prix différents, le prix moyen

des biens est égal à la moyenne harmonique des différents prix.

Une propriété de la moyenne harmonique est d’être très peu influencée par des observa-

tions aberrantes lorsque celles-ci sont beaucoup plus grandes que l’ensemble des autres

données. Par exemple, si l’on considère les valeurs suivantes : 1,2,3,4,5 et 100, la

moyenne arithmétique vaut dans ce cas 19,17. Par contre, elle est beaucoup plus sensible

aux valeurs aberrantes lorsque celles-ci sont beaucoup plus petites que l’ensemble des

autres données. C’est ainsi qu’avec les observations 1,6,6,6,6,6, on trouve H= 3,27 alors

que la moyenne arithmétique vaut ici 5,17.

Niveau p (Significativité Statistique). La signification statistique d’un résultat est une me-

sure estimée de son degré de “vérité” (dans le sens de “représentation de la population”).

Plus techniquement, la valeur du niveau p représente un index décroissant de la fiabilité

d’un résultat. Plus le niveau p est élevé, moins nous pouvons dire que la relation observée

entre les variables de l’échantillon est un indicateur fiable de la relation entre les variables

respectives de la population. Précisément, le niveau p représente la probabilité d’erreur

qui est impliquée pour accepter notre résultat comme valide, c’est-à-dire comme “repré-

sentatif de la population.” Par exemple, le niveau p de 0,05 (c’est-à-dire, 1/20) indique

qu’il y a une probabilité de 5% pour que la relation entre les variables, trouvée dans notre

échantillon, soit vérifiée. En d’autres termes, en acceptant que dans la population il n’y ait

aucune relation entre ces variables et que nous répétions les expériences l’une après

l’autre, nous pourrions nous attendre à ce que toutes les 20 réplications de l’expérience

nous observions la relation proposée. Dans de nombreux domaines de recherche, le ni-

veau p de 0,05 est considéré comme un niveau d’erreur de “limite acceptable”.

Page 106: STRUCTURE OF STATISTICA 6 - statsoft.fr STATISTICA.pdf · de la variable, est utilisé pour spécifier le nombre maximum de caractères pour définir la va-riable. Dans le Format

100

Non-paramétriques. Les méthodes Non-paramétriques ont été développées pour être utili-

sée dans les cas où le chercheur ne connaît pas les paramètres de la distribution de la

variable dans la population (par conséquent le nom non-paramétrique). En termes plus

techniques, les méthodes non-paramétriques ne se basent pas sur l’estimation des para-

mètres (telle que la moyenne ou écart-type) décrivant la distribution de la variable étudiée

dans la population. Toutefois, ces méthodes sont parfois appelées méthodes paramètre-

libre ou distribution-libre.

Rang. Un rang est un nombre affecté à une observation spécifique dans un échantillon

d’observations classé par leurs valeurs, et reflétant ainsi la relation ordinale avec les

autres observations dans l’échantillon. En fonction de l’ordre de tri (ascendant ou descen-

dant), les rangs élevés représentent les plus hautes valeurs (c’est-à-dire, pour les rangs

ascendants, la plus petite valeur est affectée au rang 1) ou les rangs les plus élevés repré-

sentent les plus petites valeurs (c’est -à-dire, rangs descendants, la plus haute est affectée

au rang 1).

N Valides. Le nombre d’observations sans les valeurs manquantes pour une certaine variable.

Variance. Empiriquement, la variance d’une variable quantitative X est définie comme la

somme des déviations au carré de chaque observation par rapport à la moyenne arithmé-

tique, divisée par le nombre d’observations. La variance d’une population de valeurs est

calculée comme:

2 = (xi-µ)

2/N

µ est la moyenne de la population

N est la taille de la population.

L’estimateur non biaisé de l’échantillon de la variance de la population est calculé

comme :

s2 = (xi-xbarre)

2/n-1

xbarre est la moyenne d’échantillon

n est la taille d’échantillon.