GLOSSAIRE

Recueil de concepts statistiques et définition (vous pouvez ajouter un nouvel article ou commenter un article)



Consultez le glossaire à l'aide de cet index

Spécial | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | Tout

C

Cas

Le cas est l’unité spécifique à propos de laquelle on collecte des données d'échantillon. On parle aussi d'unité de sondage.

Cas déviants

Ce sont les cas dont les scores dévient, s'écartent de l'ensemble des scores d'une distribution. Les cas déviants présentent des scores aberrants. Ils sont caractéristiques d'une distribution asymétrique.

Catégories collectivement exhaustives

Elles signifient que l'ensemble des catégories de valeurs inclut tous les cas. Les cas qui ne rentrent pas dans les catégories prédéterminées sont inclus dans une catégorie résiduelle "autre".

Catégories mutuellement exclusives

Elles signifient que chaque cas appartient à une et une seule catégorie. 

Centiles

Mesures de position, les centiles divisent une distribution en 100 parties égales, de telle sorte que chaque partie occupe 1% des scores. La médiane correspond au 50e centile (C50).

chi-carré

Test d'hypothèse utilisé lorsqu'on veut analyser une relation entre deux variables qualitatives, discrètes parfois. L'enjeu est de savoir si une relation révélée par l'analyse tabulaire bivariée est statistiquement significative ou non dans la population.

Chi-carré critique

Valeur se trouvant dans la table de la distribution d'échantillonnage du chi-carré. Le chi-carré critique est la valeur minimale nécessaire au rejet de l'hypothèse nulle d'une absence de relation entre deux variables catégorielles. Précisément, dans le cas d'une absence de relation (sous l'hypothèse nulle), si l'on devait répéter l'expérience de sélection de l'échantillon 100 fois, 95% des échantillons auraient des chi-carrés compris entre 0 et la valeur critique au seuil de signification 0,05; 99% des échantillons auraient des chi-carrés compris entre 0 et la valeur critique au seuil de signification 0,01, etc. La valeur critique est une sorte de constante qui dépend de deux paramètres: le seuil de signification et le nombre de degrés de libertés.

Codage

Procédure qui consiste à assigner aux données (de nature qualitative surtout) des codes numériques afin de faciliter les opérations subséquentes de conversion des données en informations. Par exemple, pour la variable sexe, on peut assigner 1 à Homme et 2 à Femme.

Coefficient d'aliénation

Lorsqu'on soustrait le coefficient de détermination du total 1 (1 moins r-deux), on obtient le coefficient d'aliénation. Le coefficient d'aliénation s'interprète comme la proportion de variation dans la variable dépendante non expliquée par la variable indépendante

Coefficient de corrélation

Indice montrant dans quelle mesure deux variables quantitatives sont corrélées l'une à l'autre. Le coefficient de corrélation mesure précisément le degré de concentration des points (du diagramme de dispersion) autour de la droite de régression. Il varie de 0 à 1 pour une corrélation positive, et de -1 à 0 pour une corrélation négative

Coefficient de détermination

Lorsqu'on élève au carré le coefficient de corrélation r, obtient le coefficient de détermination appelé encore r-deux. Il s'interprète comme la proportion de variation dans la variable dépendante expliquée par la variable indépendante

Coefficient de régression linéaire

Coefficient montrant l'effet d'une variable indépendante quantitative (X) sur une variable dépendante quantitative (Y). On l'appelle aussi pente.  Le coefficient de régression s'interprète comme le degré de changement en Y lorsque X augmente d'une unité. Contrairement au coefficient de corrélation linéaire, le coefficient de régression linéaire peut dépasser la valeur 1, puisqu'il est sensible aux différences dans les unités de mesure des deux variables. 

Coefficient de variation

C'est le rapport entre l'écart-type et la moyenne, sur une base de comparaison 100. Approprié pour comparer la dispersion de distributions ayant des unités de mesure différentes. Par convention, lorsque le coefficient de variation relative est supérieur à 15%, la distribution est hétérogène.

Concept

Un concept est une représentation d'une réalité d'un phénomène. Il traduit un choix parmi les significations possibles d'un terme. Ainsi, le chercheur en sciences sociales opère toujours sur des concepts et non sur des notions.

Consistance

Un estimé est consistant lorsque sa distribution d’échantillonnage comportant une faible variabilité. La consistance est la propriété la plus désirable d'un estimé. Augmenter la consistance d'un estimé revient à augmenter la taille de l'échantillon.


Constante

Sur la droite de régression mettant en évidence la relation entre une variable indépendante quantitative (X) et une variable dépendante quantitative (Y), la constante correspond à la valeur fixe qui coupe l'axe Y. On l'appelle aussi intersection ou ordonnée à l'origine. Elle s'interprète comme la valeur de Y lorsque X est nul. 

Corrélation linéaire

Technique statistique utilisée pour analyser une relation d'association entre deux variables quantitatives (X et Y), permettant notamment de mesurer l'intensité de la concentration des points (du diagramme de dispersion) autour d'une droite de régression linéaire. Plus les points se regroupent autour de cette droite, plus la corrélation est forte, étant entendu que des points très dispersés traduisent une absence de corrélation.

Corrélation négative

Il y a corrélation négative lorsque deux variables quantitatives covarient dans le sens contraire: à mesure qu'une variable augmente, l'autre diminue.  Les scores les plus élevés d'une variable sont associés aux scores les plus faibles de l'autre variable. On peut aussi parler de corrélation inverse.

Corrélation positive

Il y a corrélation positive lorsque deux variables quantitatives covarient dans le même sens: lorsqu'une variable augmente l'autre augmente.  Les scores les plus élevés d'une variable sont associés aux scores les plus élevés de l'autre variable. On peut aussi parler de corrélation directe.