Peut-on répondre à la question posée, à la seule lecture du tableau croisé ci-dessus A GAUCHE ? Ce n’est pas évident. Si l’on s’en tient aux effectifs, c’est impossible. Certes, on voit dans les femmes semblent être nettement plus nombreuses que les hommes à préférer le bleu, mais cette différence est-elle suffisante pour pouvoir dire sans se tromper, que les couleurs préférées varient en fonction du sexe ? Le test d’indépendance du Chi-deux va nous permettre de répondre plus scientifiquement à la question. Il va évaluer objectivement les différences constatées et déterminer si elles sont « statistiquement significatives ».
- les effectifs réels : ceux que l’on observe dans l’enquête
- et les effectifs théoriques : ceux que l’on aurait dû obtenir s’il n’y a aucune relation entre les deux variables
Les effectifs théoriques se calculent de la manière suivante. Il y a 90 hommes dans l’échantillon sur 200 répondants soient 45% des personnes interrogées. Si il n’y avait aucune relation entre le sexe et la fréquence de l’audience, on aurait 45% d'hommes dans chaque catégorie de couleur.
Par exemple 45% d'hommes qui préfèrent le bleu soient 45% de 130= 58,5. Idem pour les femmes. Elles sont 110 soient 55% de l’échantillon, elles devraient théoriquement être 55% dans la catégorie des personnes qui ne préfèrent le rouge, soient 55% de 70= 38,5 et ainsi de suite…
Le test du Chi-Deux consiste à calculer la somme des différences entre effectifs réels et effectifs théoriques. Si les différences sont très faibles, on est proche du cas où il n’y a aucune relation entre les deux variables. Plus les différences sont importantes, plus la relation est forte entre les deux variables.
Calculs
La formule est la suivante :
chi² calculé = somme (Effectif Théorique - Effectif Réel)² / Effectif Théorique
Dans notre exemple, cette formule de calcul s’applique à 4 reprises (2 lignes x 2 colonnes) :
chi² calculé = (58,5-46)²/58,5 (31,5-44)²/31,5 (71,5-84)²/71,5 (38,5-26)²/38,5
= 2,67 4,96 2,18 4,06 = 13,87
Cette valeur doit être comparée avec une valeur de référence que l'on peut trouver dans les
tables du chi-deux, en fonction :
- du nombre de degrés de liberté = (nb de lignes - 1) x (nb de colonnes - 1), soit 1 dans notre exemple
- du taux d'erreur accepté, soit par défaut 0.05 (5%)
Dans l'exemple, cette valeur est de 3,84.
Conclusion
Si le chi-deux calculé est supérieur au chi-deux théorique, la relation est validée. Dans notre cas (13,87 > 3,84), les préférences de couleurs varient en fonction du sexe... CQFD.