Comment calculer les valeurs aberrantes

Une valeur aberrante est une valeur dans un ensemble de données qui est loin des autres valeurs. Les valeurs aberrantes peuvent être causés par des erreurs expérimentales ou de mesure, ou par une population à longue queue. Dans le premier cas, il peut être souhaitable d'identifier les valeurs aberrantes et les supprimer de données avant d'effectuer une analyse statistique, car ils peuvent secouer les résultats de sorte qu'ils ne représentent pas exactement la population de l'échantillon. La façon la plus simple d'identifier les valeurs aberrantes est avec la méthode de quartile.


Sommaire

  • Instructions
  • Conseils & avertissements
  • Choses que vous devez




    • Calculatrice

    Instructions

    1. Trier les données par ordre croissant. Par exemple, prenons l'ensemble de données {4, 5, 2, 3, 15, 3, 3, 5}. Trier, l'ensemble de données exemple est {2, 3, 3, 3, 4, 5, 5, 15}.

    2. Trouver la médiane. Ceci est le numéro auquel la moitié des points de données sont plus grandes et la moitié sont plus petites. Si il ya un nombre pair de points de données, les deux du milieu sont en moyenne. Pour l'ensemble de données par exemple, les points intermédiaires sont 3 et 4, de sorte que la médiane est (3 + 4) / 2 = 3,5.

    3. Trouvez le quartile supérieur, Q2- tel est le point de données à laquelle 25 pour cent des données sont plus grandes. Si l'ensemble de données est encore, la moyenne des 2 points autour du quartile. Pour l'ensemble des données d'exemple, cela est (5 + 5) / 2 = 5.

    4. Trouvez le quartile inférieur, Q1- tel est le point de données à laquelle 25 pour cent des données sont plus petits. Si l'ensemble de données est encore, la moyenne des 2 points autour du quartile. Pour les données de l'exemple, (3 + 3) / 2 = 3.

    5. Soustraire le quartile inférieur de la quartile supérieur pour obtenir l'intervalle interquartile, IQ. Pour l'ensemble des données d'exemple, Q2 - Q1 = 5 - 3 = 2.

    6. Multipliez l'intervalle interquartile par 1,5. Ajoutez à cela le quartile supérieur et le soustraire le quartile inférieur. Tout point en dehors de ces valeurs de données est une valeur aberrante doux. Pour l'exemple, 1,5 x 2 = 3- donc 3 - 3 = 0 et 5 + 3 = 8. Donc, toute valeur inférieure à 0 ou supérieure à 8 serait une valeur aberrante doux. Cela signifie que 15 se qualifie comme une valeur aberrante doux.

    7. Multipliez l'intervalle interquartile par 3. Ajoutez ceci à le quartile supérieur et le soustraire du quartile inférieur. Tout point en dehors de ces valeurs de données est une valeur aberrante extrême. Pour l'exemple, 3 x 2 = 6 donc 3-6 = -3 et 5 + 6 = 11. Donc, toute valeur inférieure à -3 ou supérieur à 11 serait une valeur aberrante extrême. Cela signifie que 15 se qualifie comme une valeur aberrante extrême.








    Conseils & Avertissements

    • Valeurs extrêmes sont plus indicatifs d'un point de données mauvaise qu'une valeur aberrante doux.
    » » » » Comment calculer les valeurs aberrantes