Définition médiane. La médiane de l'ensemble des nombres est

4. Mode. Médian. Moyenne générale et moyenne d'échantillon

Le mode est à l'écran, la médiane est dans le triangle et les moyennes sont la température à l'hôpital et dans le service. Nous continuons notre cours pratique statistiques amusantes (Leçon 1)étude des caractéristiques centrales population statistique, dont vous voyez les noms dans l'en-tête. Et nous commencerons par sa fin, car valeurs moyennes le discours est venu presque dès les tout premiers paragraphes du sujet. Pour les lecteurs avancés table des matières:

  • Moyenne générale et moyenne d'échantillon– calcul en fonction des données primaires et pour les séries variationnelles discrètes générées ;
  • Mode– définition et constatation pour un cas discret;
  • Médian– une définition générale de la manière de trouver la médiane ;
  • Moyenne, mode et médiane de la série de variation d'intervalle– calcul à partir des données primaires et de la série finie. Formules de mode et de médiane,
  • Quartiles, déciles, centiles - brièvement sur l'essentiel.

Eh bien, il vaut mieux que les "nuls" se familiarisent avec le matériel dans l'ordre :

Alors explorons quelques population volume, à savoir sa caractéristique numérique, peu importe discret ou alors continu (Leçons 2, 3).

Secondaire général appelé moyenne toutes les valeurs de cet ensemble :

Si les chiffres sont les mêmes (ce qui est typique pour série discrète) , alors la formule peut s'écrire sous une forme plus compacte :
, où
option fois répétées ;
option - heures ;
option - heures ;

option - fois.

Exemple de calcul en direct secondaire général rencontré dans Exemple 2, mais pour ne pas être ennuyeux, je ne rappellerai même pas son contenu.

Davantage. On s'en souvient, le traitement de l'ensemble de la population générale est souvent difficile voire impossible, et donc ils s'organisent représentantéchantillonnage volume, et sur la base de l'étude de cet échantillon, une conclusion est tirée sur l'ensemble de la population.

Moyenne de l'échantillon appelé moyenne toutes les valeurs d'échantillon :

et en présence des mêmes options, la formule s'écrira de manière plus compacte :
- comme la somme des produits de la variante sur le correspondant fréquences .

La moyenne de l'échantillon permet d'estimer avec précision vraie valeur, ce qui est suffisant pour de nombreuses études. Plus l'échantillon est grand, plus cette estimation sera précise.

Commençons la pratique, ou plutôt continuons, avec série de variation discrète et la condition familière :

Exemple 8

Sur la base des résultats d'une étude sélective des ouvriers de l'atelier, leurs catégories de qualification ont été établies : 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5 , 5, 2, 3, 6, 5, 4, 6, 4, 3.

Comme résoudre tâche? Si on nous donne données primaires(valeurs brutes d'origine), alors elles peuvent être bêtement additionnées et divisées par la taille de l'échantillon :
- la catégorie de qualification moyenne des ouvriers de l'atelier.

Mais dans de nombreux problèmes, il est nécessaire de composer une série variationnelle (cm. Exemple 4) :

- soit cette série a été initialement proposée (ce qui arrive plus souvent). Et puis, bien sûr, nous utilisons la formule "civilisée":

Mode . Le mode d'une série variationnelle discrète est option avec une fréquence maximale. À ce cas. La mode est facile à trouver sur la table, et encore plus facile sur gamme de fréquences est l'abscisse du point le plus haut :


Parfois, il existe plusieurs valeurs de ce type (avec la même fréquence maximale), puis chacune d'elles est considérée comme une mode.

Si tout ou presque tout choix différent (ce qui est typique pour série d'intervalles), alors la valeur modale est déterminée d'une manière légèrement différente, qui est abordée dans la 2ème partie de la leçon.

Médian . Médiane de la série de variation * - c'est la valeur qui le divise en deux parties égales (selon le nombre d'options).

Mais maintenant, nous devons trouver la moyenne, le mode et la médiane.

Décision: trouver milieu selon les données primaires, il est préférable de faire la somme de toutes les options et de diviser le résultat par le volume de la population :
tanière. unités

Soit dit en passant, ces calculs ne prendront pas beaucoup de temps, même avec une calculatrice hors ligne. Mais s'il y a Excel, alors, bien sûr, marquer dans n'importe quelle cellule libre =SOMME(, sélectionnez tous les nombres avec la souris, fermez la parenthèse ) , mettre un signe de division / , saisissez le chiffre 30 et appuyez sur Entrer. Prêt.

Quant à la mode, son évaluation basée sur des données initiales devient inutilisable. Bien que nous voyions les mêmes nombres parmi eux, mais parmi eux, il peut facilement y avoir cinq ou six ou sept options avec la même fréquence maximale, par exemple la fréquence 2. De plus, les prix peuvent être arrondis. Par conséquent, la valeur modale est calculée en fonction de la série d'intervalles générée (plus à ce sujet plus tard).

Que pouvez-vous dire sur la médiane : brancher sur excel =MÉDIANE(, sélectionnez tous les nombres avec la souris, fermez la parenthèse ) et cliquez Entrer: . De plus, ici, vous n'avez même pas besoin de trier quoi que ce soit.

Mais en Exemple 6 triés par ordre croissant (rappel et tri - lien ci-dessus), et c'est une bonne occasion de répéter l'algorithme formel pour trouver la médiane. Nous divisons l'échantillon en deux :

Et comme il est composé d'un nombre pair d'options, la médiane est égale à la moyenne arithmétique des 15ème et 16ème options ordonné(!) série de variantes :

tanière. unités

Cas deux. Lorsqu'une série d'intervalles prête à l'emploi est donnée (une tâche d'apprentissage typique).

Nous continuons à analyser le même exemple avec des bottes, où, selon les données initiales a été compilé par IVR. Calculer milieu les milieux des intervalles sont requis :

– pour utiliser la formule familière des cas discrets :

- excellent résultat ! L'écart avec la valeur la plus précise () calculée à partir des données primaires n'est que de 0,04.

En fait, ici nous avons approximé la série d'intervalles par une série discrète, et cette approximation s'est avérée très efficace. Cependant, il n'y a pas d'avantage particulier ici, car. sous moderne Logiciel n'est pas difficile à calculer valeur exacte même pour un très large éventail de données primaires. Mais c'est à condition qu'ils nous soient connus :)

Avec d'autres indicateurs centraux, tout est plus intéressant.

Pour trouver la mode, il faut trouver espacement modal (avec fréquence maximale)- dans ce problème, c'est un intervalle avec une fréquence de 11, et utilisez la formule laide suivante :
, où:

est la limite inférieure de l'intervalle modal ;
est la longueur de l'intervalle modal ;
est la fréquence de l'intervalle modal ;
– fréquence de l'intervalle précédent;
– fréquence de l'intervalle suivant.

De cette façon:
tanière. unités - comme vous pouvez le voir, le prix "à la mode" des chaussures est sensiblement différent de la moyenne arithmétique.

Sans entrer dans la géométrie de la formule, je donnerai simplement histogramme des fréquences relatives et notez :


d'où on voit bien que le mode est décalé par rapport au centre de l'intervalle modal vers l'intervalle de gauche avec une fréquence plus élevée. Logiquement.

A titre indicatif, je vais analyser des cas rares :

– si l'intervalle modal est extrême, alors soit ;

- si l'on trouve 2 intervalles modaux proches, par exemple, et , alors on considère l'intervalle modal , tandis que les intervalles proches (gauche et droite), si possible, sont également agrandis de 2 fois.

- s'il y a une distance entre les intervalles modaux, alors on applique la formule à chaque intervalle, obtenant ainsi 2 modes ou plus.

Voici un tel mod de répartition :)

Et la médiane. Si une série d'intervalles toute faite est donnée, alors la médiane est calculée en utilisant une formule un peu moins terrible, mais au début c'est fastidieux (une faute de frappe freudienne :)) de trouver intervalle médian - c'est un intervalle contenant une variante (ou 2 variantes), qui divise la série de variation en deux parties égales.

Ci-dessus, j'ai décrit comment déterminer la médiane, en me concentrant sur fréquences cumulées relatives, ici il est plus pratique de calculer les fréquences cumulées "ordinaires". L'algorithme de calcul est exactement le même - la première valeur est démolie à gauche (flèche rouge), et chaque suite est obtenue comme la somme de la précédente avec la fréquence actuelle de la colonne de gauche (marques vertes à titre d'exemple):

Est-ce que tout le monde comprend la signification des nombres dans la colonne de droite ? - c'est le nombre d'options qui ont réussi à "s'accumuler" sur tous les intervalles "passés", y compris celui en cours.

Puisque nous avons un nombre pair d'options (30 pièces), la médiane sera l'intervalle qui contient 30/2 = 15e et 16e options. Et en se concentrant sur les fréquences accumulées, il est facile de conclure que ces options sont contenues dans l'intervalle .

Formule médiane :
, où:
- le volume de la population statistique ;
est la limite inférieure de l'intervalle médian ;
est la longueur de l'intervalle médian ;
la fréquence intervalle médian ;
fréquence cumulative précédent intervalle.

De cette façon:
tanière. unités – noter que la valeur médiane, au contraire, s'est avérée décalée vers la droite, car au main droite il y a un nombre important d'options:


Et pour les cas particuliers de référence.

Pour calculer la médiane dans MS EXCEL, il existe une fonction spéciale MEDIAN() . Dans cet article, nous allons définir la médiane et apprendre à la calculer pour un échantillon et pour une loi de distribution donnée d'une variable aléatoire.

Commençons avec médianes pour échantillons(c'est-à-dire pour un ensemble fixe de valeurs).

Médiane de l'échantillon

Médian(médiane) est le nombre qui est au milieu de l'ensemble de nombres : la moitié des nombres de l'ensemble sont supérieurs à médian, et la moitié des nombres sont inférieurs à médian .

Calculer médianes nécessaire en premier (valeurs dans échantillonnage). Par example, médian pour l'échantillon (2 ; 3 ; 3 ; 4 ; cinq; 7; 10) sera 4. Depuis. seulement dans échantillonnage 7 valeurs dont trois inférieures à 4 (soit 2 ; 3 ; 3) et trois valeurs supérieures à (soit 5 ; 7 ; 10).

Si l'ensemble contient un nombre pair de nombres, alors il est calculé pour deux nombres au milieu de l'ensemble. Par example, médian pour l'échantillon (2 ; 3 ; 3 ; 6 ; 7; 10) sera de 4,5, car (3+6)/2=4,5.

Pour déterminer médianes dans MS EXCEL, il existe une fonction du même nom MEDIAN() , la version anglaise de MEDIAN().

Médian ne correspond pas forcément. Une correspondance ne se produit que si les valeurs de l'échantillon sont réparties symétriquement autour milieu. Par exemple, pour échantillons (1; 2; 3 ; 4 ; 5; 6) médian et moyenne sont égaux à 3,5.

Si connu fonction de répartition F(x) ou fonction de densité de probabilitép(X), ensuite médian se trouve à partir de l'équation :

Par exemple, en résolvant analytiquement cette équation pour la distribution Log-normale lnN(μ; σ 2), on obtient que médian est calculé par la formule =EXP(μ). Pour μ=0, la médiane est 1.

Faites attention au point Fonctions de répartition, Pour qui F(x)=0.5(voir photo ci-dessus) . L'abscisse de ce point vaut 1. Il s'agit de la valeur de la médiane, qui coïncide naturellement avec la valeur précédemment calculée à l'aide de la formule em.

dans MS EXCEL médian pour distribution log-normale LnN(0;1) peut être calculé à l'aide de la formule =LOGNORM.INV(0,5,0,1) .

Note: Rappelons que l'intégrale de sur toute la zone de réglage, une variable aléatoire est égale à un.

Par conséquent, la ligne médiane (x = médiane) divise la zone sous le graphique fonctions de densité de probabilité en deux parties égales.

La tendance centrale des données peut être considérée non seulement comme une valeur avec un écart total nul (moyenne arithmétique) ou une fréquence maximale (mode), mais aussi comme une marque (valeur dans la population) qui divise les données classées (triées par ordre croissant ou décroissant). commande) en deux parties égales. . La moitié des données d'origine est inférieure à cette marque et l'autre moitié est supérieure. C'est ce que c'est médian.

Ainsi, en statistique, la médiane est le niveau de l'indicateur qui divise l'ensemble de données en deux moitiés égales. Les valeurs dans une moitié sont inférieures et dans l'autre moitié sont supérieures à la médiane. Prenons l'exemple d'un ensemble de nombres aléatoires.

Évidemment, avec une distribution symétrique, le milieu, divisant la population en deux, sera au centre même - au même endroit que la moyenne arithmétique (et le mode). C'est, pour ainsi dire, une situation idéale lorsque le mode, la médiane et la moyenne arithmétique coïncident et que toutes leurs propriétés tombent en un point - fréquence maximale, bissection, somme nulle des écarts - le tout en un seul endroit. Cependant, la vie n'est pas aussi symétrique que la distribution normale.

Supposons que nous ayons affaire à des mesures techniques d'écarts par rapport à la valeur attendue de quelque chose (contenu des éléments, distance, niveau, masse, etc., etc.). Si tout va bien, alors les écarts seront très probablement répartis selon une loi proche de la normale, approximativement, comme sur la figure ci-dessus. Mais s'il existe un facteur important et incontrôlable dans le processus, des valeurs anormales peuvent apparaître, ce qui affectera considérablement la moyenne arithmétique, mais en même temps n'affectera guère la médiane.

La médiane de l'échantillon est une alternative à la moyenne arithmétique, car il est résistant aux déviations anormales (outliers).

mathématique propriété médiane est que la somme des écarts absolus (modulo) par rapport à la valeur médiane donne le minimum signification possible par rapport aux écarts par rapport à toute autre quantité. Encore moins que la moyenne arithmétique, oh combien ! Ce fait trouve son application, par exemple, dans la résolution de problèmes de transport, lorsqu'il est nécessaire de calculer le chantier de construction d'objets à proximité de la route de manière à ce que la durée totale des vols vers celui-ci depuis différents endroits soit minimale (arrêts, stations-service, entrepôts , etc., etc.).

Formule médiane dans les statistiques pour discret les données rappellent quelque peu la formule de la mode. A savoir, le fait qu'il n'existe pas de formule en tant que telle. La valeur médiane est choisie parmi les données disponibles, et seulement si cela n'est pas possible, un calcul simple est effectué.

Tout d'abord, les données sont classées (triées par ordre décroissant). Ensuite, il y a deux options. Si le nombre de valeurs est impair, alors la médiane correspondra à la valeur centrale de la série, dont le nombre peut être déterminé par la formule :

Non. Moi est le numéro de la valeur correspondant à la médiane,

N est le nombre de valeurs dans l'ensemble de données.

La médiane est alors notée

C'est le premier cas où il y a une valeur centrale dans les données. La deuxième option se produit lorsque la quantité de données est paire, c'est-à-dire qu'au lieu d'une, il existe deux valeurs centrales. La solution est simple : on prend la moyenne arithmétique des deux valeurs centrales :

À données d'intervalle il n'est pas possible de choisir une valeur spécifique. La médiane est calculée selon une certaine règle.

Pour commencer (après avoir classé les données), trouvez intervalle médian. Il s'agit de l'intervalle par lequel passe la valeur médiane souhaitée. Déterminé à l'aide de la proportion cumulée d'intervalles classés. Lorsque la part cumulée dépasse pour la première fois 50 % de toutes les valeurs, il existe également un intervalle médian.

Je ne sais pas qui a proposé la formule médiane, mais ils sont évidemment partis de l'hypothèse que la distribution des données dans l'intervalle médian est uniforme (c'est-à-dire que 30 % de la largeur de l'intervalle correspond à 30 % des valeurs, 80 % de la width correspond à 80 % des valeurs, etc.) . Par conséquent, connaître le nombre de valeurs depuis le début de l'intervalle médian jusqu'à 50 % de toutes les valeurs de la population (la différence entre la moitié du nombre de toutes les valeurs et la fréquence cumulée de l'intervalle pré-médian) , vous pouvez trouver quelle part ils occupent dans tout l'intervalle médian. Cette part est exactement transférée à la largeur de l'intervalle médian, indiquant une valeur spécifique, appelée plus tard la médiane.

Passons au schéma visuel.

Cela s'est avéré un peu lourd, mais maintenant, j'espère, tout est clair et compréhensible. Afin de ne pas dessiner un tel graphique à chaque fois pendant le calcul, vous pouvez utiliser formule prête à l'emploi. La formule médiane est :

x Moi- la borne inférieure de l'intervalle médian ;

je moi- largeur de l'intervalle médian ;

∑f/2- le nombre de toutes les valeurs divisé par 2 (deux);

S (Moi-1)- le nombre total d'observations accumulées avant le début de l'intervalle médian, c'est-à-dire fréquence cumulée de l'intervalle prémédian ;

f Moi- nombre d'observations dans l'intervalle médian.

Comme vous pouvez facilement le voir, la formule médiane se compose de deux termes : 1 - la valeur du début de l'intervalle médian et 2 - la partie même qui est proportionnelle à la part accumulée manquante jusqu'à 50 %.

Par exemple, calculons la médiane des données suivantes.

Il est nécessaire de trouver le prix médian, c'est-à-dire le prix qui est moins cher et plus cher que la moitié de la quantité de biens. Pour commencer, faisons des calculs auxiliaires de la fréquence accumulée, de la part accumulée, du nombre total de biens.

Selon la dernière colonne «Part cumulée», nous déterminons l'intervalle médian - 300-400 roubles (la part accumulée pour la première fois est supérieure à 50%). Largeur d'intervalle - 100 roubles. Il reste maintenant à remplacer les données dans la formule ci-dessus et à calculer la médiane.

Autrement dit, pour la moitié des marchandises, le prix est inférieur à 350 roubles, pour l'autre moitié, il est supérieur. Tout est simple. La moyenne arithmétique calculée à partir des mêmes données est de 355 roubles. La différence n'est pas significative, mais elle l'est.

Calcul médian dans Excel

La médiane des données numériques est facile à trouver en utilisant Fonction Excel, qui est appelée - MÉDIAN. Une autre chose est les données d'intervalle. Il n'y a pas de fonction correspondante dans Excel. Par conséquent, la formule ci-dessus doit être utilisée. Que pouvez-vous faire? Mais ce n'est pas très tragique, car le calcul de la médiane à partir de données d'intervalle est un cas rare. Vous pouvez également le calculer sur une calculatrice.

Enfin, je propose un problème. Il existe un ensemble de données. 15, 5, 20, 5, 10. Quelle est la moyenne ? Quatre possibilités :

Le mode, la médiane et la moyenne de l'échantillon sont autrement déterminer la tendance centrale de l'échantillon.

  • Médiane (statistique), dans statistiques mathématiques- un nombre caractérisant l'échantillon (par exemple, un ensemble de nombres). Si tous les éléments de l'échantillon sont différents, alors la médiane est le nombre de l'échantillon tel qu'exactement la moitié des éléments de l'échantillon lui sont supérieurs et l'autre moitié lui sont inférieurs. Dans un cas plus général, la médiane peut être trouvée en ordonnant les éléments de l'échantillon par ordre croissant ou décroissant et en prenant l'élément du milieu. Par exemple, l'échantillon (11, 9, 3, 5, 5) après classement se transforme en (3, 5, 5, 9, 11) et sa médiane est le nombre 5. Si l'échantillon a un nombre pair d'éléments, le la médiane peut ne pas être déterminée de manière unique : pour les données numériques, la demi-somme de deux valeurs adjacentes est le plus souvent utilisée (c'est-à-dire que la médiane de l'ensemble (1, 3, 5, 7) est prise égale à 4).

    En d'autres termes, la médiane en statistique est la valeur qui divise la série en deux de telle sorte que des deux côtés de celle-ci (vers le haut ou vers le bas) se trouve le même nombre d'unités de la population donnée. En raison de cette propriété, cet indicateur porte plusieurs autres noms : le 50e centile ou le 0,5 quantile.

    La médiane est utilisée à la place de la moyenne arithmétique lorsque les variantes extrêmes de la série classée (la plus petite et la plus grande) par rapport au reste s'avèrent trop grandes ou trop petites.

    La fonction MEDIAN mesure la tendance centrale, qui est le centre d'un ensemble de nombres dans une distribution statistique. Il existe trois façons les plus courantes de déterminer la tendance centrale :

    • Valeur moyenne- la moyenne arithmétique, qui est calculée en additionnant un ensemble de nombres, puis en divisant la somme obtenue par leur nombre.
      Par example, la moyenne des nombres 2, 3, 3, 5, 7 et 10 est 5, qui est le résultat de la division de leur somme, qui est 30, par leur nombre, qui est 6.
    • Médian- un nombre qui est au milieu d'un ensemble de nombres : la moitié des nombres ont des valeurs supérieures à la médiane, et la moitié des nombres ont des valeurs plus petites.
      Par example, la médiane des nombres 2, 3, 3, 5, 7 et 10 est 4.
    • Mode- le nombre qui apparaît le plus fréquemment dans un ensemble de nombres donné.
      Par example, le mode pour les nombres 2, 3, 3, 5, 7 et 10 est 3.

    Salaire en diverses industrieséconomie, température et précipitations sur le même territoire pendant des périodes de temps comparables, rendements des cultures dans différentes régions géographiques, etc. Cependant, la moyenne n'est en aucun cas le seul indicateur généralisant - dans certains cas, une valeur telle que la médiane. En statistique, il est largement utilisé comme caractéristique descriptive auxiliaire de la distribution d'une caractéristique dans une seule population. Voyons en quoi il diffère de la moyenne, et aussi ce qui a causé le besoin de l'utiliser.

    Médiane en statistique : définition et propriétés

    Imaginez la situation suivante : 10 personnes travaillent avec le directeur dans une entreprise. Les employés ordinaires reçoivent chacun 1 000 hryvnia et leur directeur, qui est d'ailleurs le propriétaire, reçoit 10 000 hryvnia. Si nous calculons la moyenne arithmétique, il s'avère que le salaire moyen dans cette entreprise est de 1900 UAH. Cette affirmation sera-t-elle vraie ? Ou pour prendre cet exemple, dans la même chambre d'hôpital il y a neuf personnes avec une température de 36,6°C et une personne avec une température de 41°C. La moyenne arithmétique dans ce cas est: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Mais cela ne signifie pas que toutes les personnes présentes sont malades. Tout cela suggère que la moyenne seule ne suffit souvent pas, et c'est pourquoi la médiane est utilisée en complément. En statistique, cet indicateur est appelé une variante qui se situe exactement au milieu d'une série de variations ordonnées. Si vous le calculez pour nos exemples, vous obtenez respectivement 1000 UAH. et 36,6 °C. En d'autres termes, la médiane en statistique est la valeur qui divise la série en deux de telle sorte que des deux côtés de celle-ci (vers le haut ou vers le bas) se trouve le même nombre d'unités de la population donnée. En raison de cette propriété, cet indicateur porte plusieurs autres noms : le 50e centile ou le 0,5 quantile.

    Comment trouver la médiane dans les statistiques

    La méthode de calcul de cette valeur dépend en grande partie du type de série variationnelle dont nous disposons : discrète ou intervalle. Dans le premier cas, la médiane dans les statistiques est assez simple. Tout ce que vous avez à faire est de trouver la somme des fréquences, de diviser par 2, puis d'ajouter ½ au résultat. Il serait préférable d'expliquer le principe de calcul avec l'exemple suivant. Supposons que nous ayons regroupé des données sur la fécondité et que nous souhaitions connaître la médiane.

    Numéro de groupe familial selon le nombre d'enfants

    Nombre de familles

    Après avoir effectué quelques calculs simples, nous obtenons que l'indicateur recherché est égal à : 195/2 + ½ = option. Afin de savoir ce que cela signifie, vous devez accumuler séquentiellement les fréquences, en commençant par les plus petites options. Ainsi, la somme des deux premières lignes nous donne 30. De toute évidence, il n'y a pas 98 options ici. Mais si on ajoute la fréquence de la troisième option (70) au résultat, on obtient une somme égale à 100. Elle contient juste la 98e option, ce qui signifie que la médiane sera une famille qui a deux enfants.

    En ce qui concerne la série d'intervalles, la formule suivante est généralement utilisée ici :

    M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, dans lequel:

    • X Me - la première valeur de l'intervalle médian ;
    • ∑f est le numéro de la série (la somme de ses fréquences) ;
    • i Me - la valeur de la plage médiane ;
    • f Me - fréquence de la plage médiane;
    • S Me-1 - la somme des fréquences cumulées dans les plages précédant la médiane.

    Encore une fois, il est difficile de comprendre cela sans un exemple. Supposons qu'il existe des données sur la valeur

    Salaire, mille roubles

    Fréquences cumulées

    Pour utiliser la formule ci-dessus, nous devons d'abord déterminer l'intervalle médian. En tant que telle plage, on en choisit une dont la fréquence cumulée dépasse ou est égale à la moitié de la somme totale des fréquences. Ainsi, en divisant 510 par 2, nous obtenons que ce critère correspond à un intervalle avec une valeur salariale de 250 000 roubles. jusqu'à 300 000 roubles Vous pouvez maintenant remplacer toutes les données dans la formule :

    M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 mille roubles.

    Nous espérons que notre article vous a été utile, et maintenant vous avez une idée claire de ce qu'est la médiane dans les statistiques et comment elle doit être calculée.

Partager: