[Αρχική σελίδα]

Παράμετροι θέσης

(Ανακατεύθυνση από Μέτρα θέσης)

Αρχική σελίδα | Πρόσφατες αλλαγές | Εμφάνιση κώδικα | Page history | Δημιουργία Λογαριασμού/Είσοδος |

Εκτυπώσιμη έκδοση | Αποποίηση ευθυνών | Privacy policy

Πίνακας περιεχομένων

Αριθμητικός Μέσος

Μέσος αριθμητικός:Ο Μέσος αριθμητικός (ή απλά μέσος) είναι ο συνηθέστερος τρόπος μέτρησης της κεντρικής τάσης και το σπουδαιότερης σημασίας μέτρο, της στατιστικής.Συμβολίζεται με το \bar{X} και υπολογίζεται, ως το πηλίκο των αθροισμάτων των τιμών Xn , διαιρούμενο με το πλήθος των παρατηρήσεων n.


Τύπος:

\bar{X}=\frac {x_1, x_2, \ldots, x_n }{n}

ή

\bar{X}=\frac {\sum^{n} x_i}{n}

'Oταν χρησιμοποιούμε στατιστικά δείγματα και όχι ολόκληρο τον πληθυσμό, τότε αντί για μ χρησιμοποιούμε το \bar{x} και αντί για Ν που είναι ολόκληρος ο πληθυσμός χρησιμοποιούμε το η που είναι ο αριθμός των παρατηρήσεων του δείγματος.


Ιδιότητες αριθμητικού μέσου

1. \sum_{i=1}^{n} \left ( \begin{matrix} X_i - \bar{X} \end{matrix} \right ) = 0

2. Αν X_1 = X_2 = \ldots = X_n = \alpha τότε \bar{X} = \alpha

3. Αν \alpha \leq X_i \leq = \beta τότε \alpha \leq \bar{X} \leq \beta

4. Αν Y = α + β τότε \bar{Y} = \alpha + \beta \bar{X}

5. \sum_{i=1}^{n} \left ( \begin{matrix} X_i - \alpha \end{matrix} \right )^2 \leq \sum_{i=1}^{n} \left ( \begin{matrix} X_i - \bar{X} \end{matrix} \right )

6. Αν σε όλες τις τιμές ποσοτικών δεδομένων προσθέσουμε μια σταθερά α τότε ο μέσος θα αυξηθεί (ή μειωθεί) κατά την ποσότητα αυτή.

7. Αν πολλαπλασιάσουμε όλες τις τιμές ποσοτικών δεδομένων με μια σταθερά α τότε ο αριθμητικός μέσος πολλαπλασιάζεται με την ποσότητα αυτή.

Η μέση τιμή, όπως η διάμεσος και η επικρατούσα τιμή, αποτελούν μέτρα θέσης. Η μέση τιμή επηρεάζεται από τις ακραίες παρατηρήσεις, ενώ η διάμεσος όχι. Η επικρατούσα τιμή δεν επηρεάζεται απο το πλήθος των δεδομένων, σε αντίθεση με τον αριθμητικό μέσο. Επιπλέον ο μέσος όρος, υπολογίζεται μέσω αλγεβρικών τύπων , ενώ η διάμεσος και η επικρατούσα τιμή όχι.

Έμμεση μέθοδος υπολογισμού αριθμητικού μέσου

Θεωρούμε ότι αριθμητικός μέσος θα είναι μια οποιαδήποτε κεντρική τιμή την οποία συμβολίζουμε με X0Στη συνέχεια ορίζουμε μια νέα μεταβλητη ξ από τον τύπο ξ = (x1X0) / δ λοπου δ το πλάτος των τάξεως και xi τα κέντρα των ταξεων.

Λύνουμε ως προς xi, πολλαπλασιαζουμε και τα δύο μέρη της ισότητας με fi, αθροίζουμε για κάθε i=1,2,... k και διαιρώντας με \sum_{i=1}^{\kappa} f_i βρίσκουμε ότι

\bar X = X_0 + \delta (\sum_{i=1}^{\kappa} {f_i \xi _1})/ (\sum_{i=1}^{\kappa} f_i)

ΠΑΡΑΔΕΙΓΜΑ

Δίνονται οι εξής τιμές: 3, 5, 8, 2000 και 3, 5, 8, 11.

Τότε \bar{X1}= 504 και δ1= 6,5 και \bar{X2}= 6,75 και δ2= 6,5

Παρόλο που δ1= δ2 τα \bar{X1}, \bar{X2} διαφέρουν μεταξύ τους.


Παράδειγμα για απλό μέσο αριθμητικό


Έστω οι ετήσιες αποδοχές των 10 υπαλλήλων μιας εταιρίας είναι οι εξής: 25.000, 25.500, 14.000, 50.000, 26.000, 27.000, 28.000, 15.600, 21.000, 23.000

Οι μέσες αποδοχές των εργαζομένων της εταιρίας είναι:

X_{\mu}=\frac{25.000+25.500+14.000+50.000+25.000, 25.500+15.600+21.000+23.000}{10}=25.510


Ο μέσος αριθμητικός που προαναφέραμε ονομάζεται και αστάθμητος μέσος γιατί προκύπτει από το απλό άθροισμα των τιμών του Χσταθμικός μέσος τώρα προκύπει από το άθροισμα των γινομένων των τιμων Χ με το συντελεστή βαρύτητας και μαθηματική έκφραση αυτού διατυπώνεται στον παρακάτω τύπο:


\bar{X} = \sum_{i=1}^{k} X_iw_i


Παράδειγμα για σταθμικό μέσο


Έστω ότι από το προηγούμενο παράδειγμα οι εργαζόμενοι της εταιρίας χωρίζονται σε κάποιες κατηγορίες, ανάλογα με τη θέση που κατέχουν ή την εκπαίδευση.

Ας υποθέσουμε πως αυτοί που αμοίβονται με μισθούς

Xμ,E=(14.000+15.600)/2=14.800


Οι μέσες αποδοχές για τους υπαλλήλους είναι Xμ,Y=(25.000+25.500 26.000+27.000+28.000+21.000+23.000)/7=25.071,428


Επομένως ο μέσος σταθμικός ισούται με:


\bar{X}=\frac{(14.800\times2)+(25.071,428\times7)+(50.000\times1)}{2+7+1}=25.509,999

ΣΤΑΘΜΙΣΜΕΝΟΣ ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ


"Μερικές φορές συνδέουμε τους αριθμους Χ1, Χ2, Χ3,..., Χk με κάποιους συντελεστές βαρύτητας ή βάρη w1, w2, w3,...wk που εξαρτώνται από τη βαρύτητα, δηλαδή τη σημασία, που προσδιορίζουμε στον καθένα αριθμό. Σε αυτή την περίπτωση η ποσότητα:

X= w1*X1+w2*X2+....+wK*XK/w1+w2+...+wk = ΣwX/Σw ονομάζεται σταθμισμένος μέσος.

Ακραίες τιμές στα δεδομένα (εξαιρετικά μεγάλες ή εξαιρετικά μικρές), οι οποίες επηρεάζουν τον αριθμητικό μέσο, συνήθως παραλείπονται, ώστε η θέση του μέσου αυτού, να μην απομακρυνθεί αρκετά απο τον κύριο όγκο των δεδομένων. Έτσι υπολογίζουμε τον αποκομμένο μέσο, ο οποίος ισούται με τον αντίστοιχο αριθμητικό, χωρίς κάποιες απο τις ακραίες τιμές των δεδομένων. πχ. ο κατα 30% αποκομμένος μέσος, στην πραγματικότητα ορίζεται ως ο αριθμητικός μέσος, παραλείποντας το 30% των μεγαλύτερων και των μικρότερων τιμών.

ΠΑΡΑΔΕΙΓΜΑ

Εάν για παράδειγμα η τελική εξέταση ενός μαθήματοσ έχει τριπλάσια βαρύτητα από ένα ωριαίο τέστ και καποιός μαθητής έχει βαθμό γραπτών εξετάσεων 85 και βαθμούς στα ωριαία τεστ 70 και 90, ο τελικός βαθμός του είναι ο εξής: χ= (1)*(70)+(1)*(90)+(3)*(85)/1+1+3=415/5=83":ΚΕΦΑΛΑΙΟ 3,τίτλος βιβλίου: ΣΤΑΤΙΣΤΙΚΗ ,3η ΕΚΔΟΣΗ, MYRRAY R. SPIEGEL- LARRY J. STEPHENS,ΣΕΙΡΑ SCHAYM

ΕΚΔΟΣΕΙΣ ΤΖΙΟΛΑ ΘΕΣΣΑΛΟΝΙΚΗ

ΠΑΡΑΔΕΙΓΜΑ ΓΙΑ ΑΠΛΟ ΜΕΣΟ ΣΤΟ R

Οι ετήσιοι μισθοί πέντε υπαλλήλων ειναι 11.340,11.448,79.650,97200 αντίστοιχα.Να βρείτε τον μεσο αριθμητικό.

Λύση Φτιάχνουμε τον πίνακα στο R

> misthoi=c(11.340,11.448,79.650,97200)

Για αριθμητικό μέσο των ετήσιων μισθών γράφουμε στο R:
>mean(misthoi)

Και παίρνουμε απάντηση
[1] 24325.61

ΠΑΡΑΔΕΙΓΜΑ ΓΙΑ ΑΠΛΟ ΜΕΣΟ ΣΤΟ R (2)

Έστω οι ηλικίες των υπαλλήλων μιας εταιρείας Υ. 35,23,26,27,26,29,30,43,41 Στο R τις θέτουμε ως data και ύστερα δίνουμε εντολή όταν καλούμε χ, να μας εμφανίζονται οι ηλικίες που έχουμε πληκτρολογήσει στο data.

data=c(35,23,26,27,26,29,30,43,41)

> x=data

> x

[1] 35 23 26 27 26 29 30 43 41

Έπειτα, δίνουμε την εντολή mean για να λάβουμε τον μέσο όρο των ηλικιών.

> mean(x)

[1] 31.11111

O μέσος όρος ηλικίας των εργαζομένων στην εταιρεία Υ είναι 31.1.


ΠΑΡΑΔΕΙΓΜΑ ΓΙΑ ΑΠΛΟ ΜΕΣΟ ΣΤΟ R (3)

Η βαθμολογία 10 ελληνικών ομάδων σε ευρωπαϊκό πρωτάθλημα είναι η παρακάτω: 22, 19, 19, 17, 16, 17, 18, 30, 31, 20.

Για να εξετάσουμε ποιος είναι ο μέσος όρος της βαθμολογίας τους στο R θα πράξουμε ως εξής:

- Θέτω ως data τη βαθμολογία τους και τους δίνω ένα όνομα έτσι ώστε όταν τις καλώ να μου εμφανίζεται το διάνυσμά τους.

-Έτσι έχω score=data

> score=data

> score

[1] 22 19 19 17 16 17 18 30 31 20

- H μέση τιμή βρίσκεται δίνοντας την εντολή mean στο R.

> mean(score)

[1] 20.9

Η μέση βαθμολογία λοιπόν των ελληνικών ομάδων είναι 20.9 βαθμοί.

Αριθμητικός Μέσος - Επιπλέον ιδιότητες

Αριθμητικός μέσος ή μέση τιμή (First moment or Mean or Average):

\bar[x]= \frac{x_1+x_2+...+x_n}{n}=\frac{1}{n} \sum_{i=1}^n x_i

εάν οι τιμές χi έχουν συχνότητες ni, i=1, 2, . . . , μ τότε η μέση τιμή δίνεται από τον τύπο: \bar{x}=\frac{n_1 x_1+ n_2 x_2 +...+n_{\mu} x_{\mu}}{n}=\frac{1}{n} \sum_{i=1}^n n_i x_i =\sum_{i=1}^n x_i f_i δοθέντος ότι f_i = \frac{n_i}{n}

Εύκολα αποδεικνύεται ότι εάν στις τιμές της μεταβλητής Χ προσθέσουμε έναν αριθμό α XR τότε και η μέση τιμή μεταβάλλεται κατά α. Δηλαδή \bar{X}\bar{+}\bar{a}=\bar{X} +a με αXR.

Επίσης εάν οι τιμές της Χ πολλαπλασιασθούν επί κXR τότε και η μέση τιμή πολλαπλασιάζεται επί κ. Δηλαδή \bar{k}\bar{X}=k\bar{X} +a με κXR.

Γεωμετρικός Μέσος

Γεωμετρικός Μέσος:


Γεωμετρικός Μέσος (που συνήθως συμβολίζεται με G) μιας ακολουθίας n θετικών αριθμών, ορίζεται ως η n-οστή ρίζα του γινομένου αυτών των αριθμών.

Ο γεωμετρικός μέσος είναι πιο σταθερός από τον αριθμητικό αφού επηρεάζεται λιγότερο από παρατηρήσεις με πολύ μεγάλες τιμές. Για παράδειγμα στο παρακάτω σύνολο δεδομένων 6 8 10 10 10 12 16 ο αριθμητικός μέσος είναι 10,286 και ο γεωμετρικός 9884. Αν ωστόσο αντί της τιμής 16 είχαμε την τιμή 48 τότε ο γεωμετρικός θα ήταν 11,564 και ο αριθμητικός 14,857. Επίσης ο γεωμετρικός μέσος είναι κατάλληλο μέτρο για δεδομένα που αυξάνονται ή ελαττώνονται με γεωμετρική πρόοδο.

Πανάρετος Ι. και Ε. Ξεκαλάκη (1997), “Εισαγωγή στη Στατιστική Σκέψη (Τόμος 1 Περιγραφική Στατιστική)”

Δηλαδή ο γεωμετρικός μέσος G των n θετικών τιμών X1, X2, …, 19 Xn της μεταβλητής Χ είναι:


   Τύπος: G=\sqrt[n]{x_1 \cdot x_2 \cdot \ldots x_n}

Δεν μπορεί να οριστεί για αρνητικές ή μηδενικές τιμές ενώ πάντα είναι μικρότερος από τον αριθμητικό μέσο εκτός αν οι παρατηρήσεις ταυτίζονται οπότε ταυτίζονται και οι δύο μέσοι. Ο γεωμετρικός μέσος είναι πιο σταθερός από τον αριθμητικό αφού επηρεάζεται λιγότερο από παρατηρήσεις με πολύ μεγάλες τιμές. Για παράδειγμα στο παρακάτω σύνολο δεδομένων 6 8 10 10 10 12 16 ο αριθμητικός μέσος είναι 10,286 και ο γεωμετρικός 9884. Αν ωστόσο αντί της τιμής 16 είχαμε την τιμή 48 τότε ο γεωμετρικός θα ήταν 11,564 και ο αριθμητικός 14,857.

   Επίσης ο γεωμετρικός μέσος είναι κατάλληλο μέτρο για δεδομένα που αυξάνονται ή ελαττώνονται με γεωμετρική πρόοδο. Τέτοιο παράδειγμα είναι οι πληθυσμοί. Αν σε μια πόλη ο πληθυσμός το 1980 ήταν 270000 και το 1990 ήταν 510000 και θέλαμε να εκτιμήσουμε το μέγεθος του πληθυσμού το 1985 θα μπορούσαμε να ισχυρισθούμε ότι αυτό είναι σύμφωνα με τον αριθμητικό μέσο 390000. Ωστόσο αυτό θα ήταν λογικό αν ο πληθυσμός αυξανόταν κατά σταθερό αριθμό κάθε χρόνο κάτι το οποίο δεν ισχύει. Η λύση στο πρόβλημα αυτό είναι η χρήση του γεωμετρικού μέσου ο οποίος λαμβάνει την τιμή 363730.

Για να έχει νόημα ο τύπος αυτός θα πρέπει x_1 \cdot x_2 \cdot \ldots x_n >0

Ο γεωμετρικός μέσος χρησιμοποιείται κυρίως στις χρονολογικές σειρές και στουρ αριθμοδείκτες.


Ιδιότητες γεωμετρικού μέσου



Παράδειγμα

Παράδειγμα : Δίνεται στον παρακάτω πίνακα, το κατακεφαλήν εισόδημα της χώρας σε σταθερές τιμές για τα έτη 1975 μέχρι 1984 και ζητείται να βρεθεί η μέση ετήσια αύξηση του.

Έτος	        1975	1976	1977	1978	1979	1980	1981	1982	1983	1984
Εισόδημα	920	980	1020	1025	1040	1100	1110	1230	1380	1620

Η διαφορά του κατακεφαλήν εισοδήματος του 1976 από το 1975 είναι:

980-920=60

και η αύξηση τη χρονιά αυτή είναι: 60/920 = 0.065 = 6.5%

Με τον ίδιο τρόπο βρίσκονται τα ποσοστά αύξησης \bar{\alpha} όλων των ετών όπως παρουσιάζονται στον παρακάτω πίνακα:

Έτος	        1976	1977	1978	1979	1980	1981	1982	1983	1984
Αύξηση α(ΐ)	0.065	0.041	0.005	0.015	0.058	0.009	0.109	0.122	0.174

Το μέσο ετήσιο ποσοστό αύξησης α δίνεται από τον γεωμετρικό μέσο G„ των 9 ετησίων ποσοστών αύξησης:

Ga= \sqrt[9]{(0.065)(0.041)(0.005) (0.122)(0.174)}

Το μέσο ετήσιο ποσοστό αύξησης είναι 4%.

ΣΧΕΣΗ ΑΝΑΜΕΣΑ ΣΤΟΝ ΑΡΙΘΜΗΤΙΚΟ ΚΑΙ ΓΕΩΜΕΤΡΙΚΟ ΜΕΣΟ


"Ο γεωμετρικός μέσος ενός συνόλου θετικών Ν αριθμών Χ1,Χ2,Χ3...,Χκ Είναι μικρότερος ή ίσος του αριθμητικού μέσου τους. Έτσι G<=X.


ΤΟ ΣΥΜΒΟΛΟ ΤΗΣ ΙΣΟΤΗΤΑΣ ΙΣΧΥΕΙ ΕΑΝ ΟΙ ΑΡΙΘΜΟΙ Χ1,Χ2,Χ3,...Χκ ΕΙΝΑΙ ΙΔΙΟΙ":ΚΕΦΑΛΑΙΟ 3,ΣΤΑΤΙΣΤΙΚΗ 3η ΕΚΔΟΣΗ ,MYRRAY R. SPIEGEL-LARRY J. STEPHENS, ΕΚΔΟΣΕΙΣ ΤΖΙΟΛΑ ΘΕΣΣΑΛΟΝΙΚΗ


Παράδειγμα 2

Έστω ότι έχουμε τις παρατηρήσεις: 7, 25, 30, 36, 28

Ο γεωμετρικός μέσος υπολογίζεται ως εξής:

logG= (log7+log25+log30+log36+log28)/5 = 1,348

'Αρα G=22,28

Παράδειγμα 2

Ένα κεφάλαιο αυξάνει ως εξής:

Να βρεθεί η ποσοστιαία μεταβολή του κεφαλαίου.

Λύση: Αν για διαδοχικές χρονικές μονάδες έχουμε τις αντίστοιχες ποσοστιαίες μεταβολές r1,.....,rn ενός κεφαλαίου k0 τότε η μέση ποσοστιαία μεταβολή r δίνεται από τη σχέση:

1+r=\sqrt[n]{(1+r_{1})(1+r_{2})\ldots(1+r_{n})}.

Εδώ r1=0.8 και rn=0.1 επομένως: 1+r=\sqrt{1.8\times1.1}=1.40 δηλ. r=0.40.

Διάμεσος

Διάμεσος (Μ) (Median) είναι η τιμή εκείνη της μεταβλητής που χωρίζει το σύνολο των τιμών σε δυο ίσα μέρη, ώστε ο αριθμός των παρατηρήσεων που είναι μικρότερες από το Μ, να είναι ίσος με τον αριθμό αυτών που είναι μεγαλύτερες από το Μ. Είναι το σημείο της κατανομής που αφήνει 50% των παρατηρήσεων προς τα πάνω και 50% προς τα κάτω.

Για να βρούμε τη διάμεσο, οι παρατηρήσεις κατατάσσονται κατά τη φυσική τους διάταξη. Στην περίπτωση που οι τιμές της μεταβλητής δεν περιέχονται σε πίνακα συχνοτήτων, η διάμεσος δίνεται από τον όρο (Ν+1)/2, όπου Ν το πλήθος των παρατηρήσεων.

Εάν το Ν είναι περιττός αριθμός η διάμεσος είναι η παρατήρηση που βρίσκεται στη (Ν+1)/2 θέση, γιατί αυτή η παρατήρηση αφήνει (Ν-1)/2 παρατηρήσεις προς τα κάτω και (Ν-1)/2 παρατηρήσεις προς τα πάνω. Ενώ εάν το Ν είναι άρτιος, τότε στη μέση των τιμών υπάρχουν δυο τιμές, οπότε η διάμεσος είναι ο μέσος όρος των δυο αυτών μεσαίων τιμών.

Διάμεσος: με λίγα λόγια ονομάζεται η μεσαία τιμή μιας ομάδας τιμών ιεραρχημένων σε αύξουσα τάξη μεγέθους.Εάν δεν υπάρχουν δεσμοί (οι τιμές δεν συμπίπτουν) τοτε η διάμεσος δείχνει την τιμή που χωρίζει τις παρατηρήσεις στην μέση.Ο υπολογισμός της διαμέσου είναι εύκολος και το μόνο που προυποθέτει είναι οι τιμές να βρίσκονται σε αύξουσα τάξη μεγέθους.


  Παράδειγμα:Ας εξετάσουμε εννέα χαμηλόμισθους υπαλλήλους.Οι μισθοί τους είναι 11340 , 11448 , 11664 , 11880 , 12204 , 12744 , 13068 , 13500 , 14148.

Η διάμεσος είναι (n+1)/2=(9+1)/2=5η παρατήρηση δηλαδή 12204


Λύση σε R

Φτιάχνουμε τον πίνακα στο R
> misthoi=c(11340 , 11448 , 11664 , 11880 , 12204 , 12744 , 13068 , 13500 , 14148)

Για να βρούμε τη διάμεσο των μισθών γράφουμε στο R
> median(misthoi)

Και βρίσκουμε το παρακάτω αποτέλεσμα
[1] 12204


  Παράδειγμα:Ας εξετάσουμε οκτώ χαμηλόμισθους υπαλλήλους.Οι μισθοί τους είναι 11340 , 11448 , 11664 , 11880 , 12204 , 12744 , 13068 , 13500.

Η διάμεσος είναι ο μέσος όρος της 4ης και 5ης παρατήρησης [n/2=8/2=4 και (n/2)+1=(8/2)+1=5 δηλαδή (11880+12204)/2=12042


Λύση σε R

Φτιάχνουμε τον πίνακα στο R
> misthoi=c(11340 , 11448 , 11664 , 11880 , 12204 , 12744 , 13068 , 13500)

Για να βρούμε τη διάμεσο των μισθών γράφουμε στο R
> median(misthoi)

Και βρίσκουμε το παρακάτω αποτέλεσμα

[1] 12042

ΠΑΡΑΔΕΙΓΜΑ 2 ΕΥΡΕΣΗ ΔΙΑΜΕΣΟΥ ΗΛΙΚΙΩΝ (ΣΥΝΕΧΕΙΑ ΑΠΟ ΑΡΙΘΜΗΤΙΚΟ ΜΕΣΟ)

Για να βρούμε τη διάμεσο των ηλικιών των εργαζομένων της εταιρείας Υ, δεν έχουμε παρά να πληκτρολογήσουμε την εντολή median.


> median(x)

[1] 29

Παρατηρούμε ότι η διάμεσος δεν συμπίπτει με τον αριθμητικό μέσο (31.1) κάτι που είναι λογικό καθώς η διάμεσος είναι η μεσαία τιμή μιας ομάδας τιμών ιεραρχημένων σε αύξουσα τάξη μεγέθους. Βάζοντας σε αύξουσα τάξη μεγέθους τις ηλικίες(35, 23 ,26 ,27 26 ,29 ,30 ,43, 41) βρίσκουμε ότι όντως το 29 είναι η τιμή που λάβαμε και στο R.


Διάμεσος σε δείγμα με αύξουσα τάση

Διάμεσος δ (Median): ενός δείγματος παρατηρήσεων, οι οποίες έχουν διαταχθεί κατά αύξουσα τάξη, είναι η μεσαία παρατήρηση εάν το πλήθος των παρατηρήσεων είναι περιττό ή ο μέσος όρος των δύο μεσαίων παρατηρήσεων εάν το πλήθος είναι άρτιο. Στην περίπτωση ομαδοποιημένων μεταβλητών η διάμεσος βρίσκεται από το ιστόγραμμα των αθροιστικών συχνοτήτων. Αλγεβρικά η διάμεσος δίνεται από τον τύπο:

    \delta=l_i+\frac{\frac{n}{2}-N_{i-1}}{n_i} c_1

όπου li το κατώτερο όριο της κλάσης που περιέχει την διάμεσο, n1 η συχνότητα και ci το πλάτος της κλάσης αντίστοιχα,Ni − 1 η αθροιστική συχνότητα της προηγούμενης κλάσης και n το μέγεθος του δείγματος. Δηλαδή η διάμεσος είναι το σημείο τομής του ευθυγράμμου τμήματος, που ενώνει το άνω δεξί άκρο της κλάσης που περιέχει τη διάμεσο με το άνω δεξί άκρο της προηγούμενης κλάσης, και της ευθείας y=n/2

ΣΧΗΜΑ 1


Διάμεσος ομαδοποιημένων παρατηρήσεων

1) Εντοπίζουμε την τάξη στην οποία βρίσκεται η διάμεσος. Αυτο το πετυχαίνουμε με την βοήθεια ης δεξιόστροφης αθροιστικής συχνότητας και αφού προσδιορίσουμε σε ποια τάξη βρίσκεται η παρατήρηση XN / 2

2) Yπολογίζουμε τον τύπο

M = xi − 1 + δ / fi(N / 2 − Φi − 1)

όπου xi − 1 το κάτω άκρο της τάξης στην οποία εντοπίζεται η διάμεσος δ= το πλάτος της τάξης στην οποία εντωπίζεται η διάμεσος fi = η συχνότητα της τάξης στην οποία εντοπίζεται η διάμεσος Ν= το ολικό μέγεθος του δείγματος Φi − 1 = η δεξιόστροφη αθροιστική συχνότητα της τάξης που προηγείται αυτής στην οποία εντοπίζεται η διάμεσος

παράδειγμα διαμέσου κατά άυξουσα τιμή

Έστω Χ=αριθμός των εργαζομένων στα μεγάλα εμπορικά καταστήματα μίας πόλης, κάθε ένα από τα οποία απασχολεί 30 ή περισσότερα άτομα. Ας υποθέσουμε ότι υπάρχουν Ν=15 τέτοια καταστήματα στην πόλη και ότι απασχόληση σε αυτά είναι η εξης:

Χ:30, 38, 46, 31. 42. 30, 47. 34, 40, 49, 33, 39, 36, 45, 41.

Κατ' αρχήν, κατασκευάσαμε τις τιμές της Χ κατ' άυξουσα τάξη μεγέθους:

Χ: 30, 31, 33, 34, 36, 38, 39, 40 ,41, 42, 45, 46, 47, 49

Επειδή Ν=15 είναι περιττός αριθμός, Μ είναι εκείνη η τιμή της Χ η οποία κατέχει τη θέση \frac{15+1}{2}=8 δηλαδή Μ=39 εργαζόμενοι. Ας υποθέσουμε τώρα ότι η παρατήρηση 49 δεν υπάρχει, οποτε έχουμε άρτιο αριθμό καταστημάτων, Ν=14. Σε αυτήν την περίπτωση Μ= \frac{38+39}{2} = 38,5 εργαζόμενοι.

Άρα εφόσον δεν είναι δυνατόν να έχουμε 38,5 εργαζόμενους το εύρημα μας έχει μόνο θεωρητική έννοια.


παράδειγμα 2

Σε ένα διαγωνισμό παρατηρήθηκαν οι ακόλουθες επιδόσεις:

8, 8, 9, 10, 10, 11, 11, 12, 12, 12, 13, 13, 13, 13, 14, 18.

Να βρεθεί η διάμεσος.

Λύση: Εδώ \bar{x}_{n/2}=12 (και συγκεκριμένα το 2ο στη σειρά 12 από τα δεδομένα).

Διαγραμματική εκτίμηση της διαμέσου.

Η διάμεσος, εκτός από τον μαθηματικό υπολογισμό της, μπορεί να εκτιμηθεί κατα προσέγγιση και διαγραμματικά σε διάγραμμα αθροιστικών συχνοτήτων.Αυτό μπορεί να γίνει με τον εξής γενικό τύπο:

M=L_m + \delta \cdot \frac {( \frac {n}{2} - F_{m-1})}{F_m}

M = Διάμεσος

L = το κάτω όριο του διαστήματος που εντοπίζεται η διάμεσος

F = η αθροιστική συχνότητα

δ = το πλάτος του διαστήματος

Τεταρτημόρια είναι τα εκατοστιαία σημεία που χωρίζουν τα καταταγμένα δεδομένα σε τέταρτα.Επισής τα τεταρτημόρια καθώς και η διάμεσος ονομάζονται και στατιστικές θέσης γιατί δείχνουν την συγκέντρωση των παρατηρήσεων σε συγκεκριμένα ποσοστά.

Το πρώτο τεταρτημόριο είναι το 25ο εκατοστημόριο. Είναι το σημείο κάτω από το οποίο βρίσκεται το 1/4 των δεδομένων, συμβολίζεται με Q1,

Το δεύτερο τεταρτημόριο είναι το 50ο εκατοστημόριο. Είναι το σημείο κάτω από το οποίο βρίσκεται το 1/2 των δεδομένων. Ονομάζεται διάμεσος και συμβολίζεται με Q2,

Το τρίτο τεταρτημόριο είναι το 75ο εκατοστημόριο. Είναι το σημείο κάτω από το οποιό βρίσκονται τα 3/4 των δεδομένων, συμβολίζεται με Q3,

Επιπλέον παράδειγμαta σε R

Παράδειγμα 1

Έστω ότι τα δεδομένα του πίνακα αντιστοιχούν σε 100 μετρήσεις των ημερήσιων αποβλήτων θείου (σε τόνους) καάποιου εργοστασίου (πηγή:Στατιστικές Μέθοδοι- Ι.Α.Κουτρουβελη,Εκδοσεις Συμμετρία,Πάτρα 1999)

matr1010<-matrix(c(28.5,17.9,27.5,10.5,20.1,24.1,9.4,18.1,15.9,25.9,31.8,11.8,22.3,21.9,25.7,20.0,19.3,13.3,12.3,8.3,18.1,24.3,17.0,29.6,18.4,24.6,22.5,20.8,19.4,14.4,14.5,18.0,20.1,23.0,13.5,7.7,16.2,24.6,18.5,19.0,21.4,26.6,15.2,16.9,21.6,19.2,20.4,22.9,19.1,10.7,20.9,20.5,22.7,16.7,19.4,15.5,11.0,18.0,26.8,23.7,26.1,14.7,9.8,17.6,28.6,12.8,17.5,6.2,22.7,13.2,24.8,11.2,26.4,9.0,13.9,18.7,23.9,17.3,15.8,13.1,20.9,14.8,11.3,19.5,26.4,22.7,21.9,17.2,12.8,14.9,16.7,21.2,17.1,24.4,26.3,19.7,15.5,12.9,20.3,21.4), nrow=10, ncol=10)
matr1010
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 28.5 31.8 18.1 14.5 21.4 20.9 26.1 24.8 20.9  16.7
[2,] 17.9 11.8 24.3 18.0 26.6 20.5 14.7 11.2 14.8  21.2
[3,] 27.5 22.3 17.0 20.1 15.2 22.7  9.8 26.4 11.3  17.1
[4,] 10.5 21.9 29.6 23.0 16.9 16.7 17.6  9.0 19.5  24.4
[5,] 20.1 25.7 18.4 13.5 21.6 19.4 28.6 13.9 26.4  26.3
[6,] 24.1 20.0 24.6  7.7 19.2 15.5 12.8 18.7 22.7  19.7
[7,]  9.4 19.3 22.5 16.2 20.4 11.0 17.5 23.9 21.9  15.5
[8,] 18.1 13.3 20.8 24.6 22.9 18.0  6.2 17.3 17.2  12.9
[9,] 15.9 12.3 19.4 18.5 19.1 26.8 22.7 15.8 12.8  20.3

[10,] 25.9 8.3 14.4 19.0 10.7 23.7 13.2 13.1 14.9 21.4

Για να βρούμε τη μέση τιμή στο R εκτελούμε την εντολή

mean(matr1010)και βρίσκουμε

[1] 18.792

Για να βρούμε τη διάμεσο median(matr1010)και βρίσκουμε [1] 19.05

Για να βρούμε τα ποσοστιαία σημεία χρησιμοποιούμε την εντολή > quantile(matr1010)

   0%    25%    50%    75%   100% 
6.200 14.875 19.050 22.700 31.800


Παράδειγμα 2

Ένα μεγάλο πολυκατάστημα συλλέγει στοιχεία για τις πωλήσεις που πραγματοποιούνται από καθένα από τους πωλητές. Ο αριθμός των πωλήσεων που πραγματοποιούνται σε μια δεδομένη ημέρα από 20 πωλητές εμφανίζεται στον παρακάτω πίνακα. Επιπλέον, τα στοιχεία έχουν τοποθετηθεί σε αύξουσα σειρά. Πωλήσεις [6 9 2 10 10 12 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 24 17 21 18 22 18 18 19 19 20 18 21 20 22 17 24]


Φτιάχνουμε τον πίνακα στο R

>pwlhseis=c(6,9,2,10,10,12,13,13,15,14,16,14,14,15,14,16,16,16,17,16,16,17,24,17,21,18,22,18,18,19,19,20,18,21,20,22,17,24)

Για αριθμητικό μέσο των πωλήσεων γράφουμε στο R:
> mean(pwlhseis)

Και παίρνουμε απάντηση
[1] 16.02632

Για διάμεσο των πωλήσεων γράφουμε στο R:
> median(pwlhseis)

Και παίρνουμε απάντηση
[1] 16


ΠΑΡΑΔΕΙΓΜΑ ΓΙΑ ΔΙΑΜΕΣΟ ΣΕ ΣΥΓΚΡΙΣΗ ΜΕ ΑΡΙΘΜΗΤΙΚΟ ΜΕΣΟ

Ο αριθμός των ημερήσιων συναλλαγών στα ATM μιας πόλης καταγράφηκε σε 13 θέσεις και τα δεδομένα που προέκυψαν ήταν :30, 45, 220, 51, 34, 67, 43, 56, 53, 78, 41, 326, 47.

Να βρείτε :

α)τη διάμεσο β)τον αριθμητικό μέσο


ΛΥΣΗ

α) τα βαζουμέ σε αύξουσα σειρά τα δεδομένα και: 30, 34, 41, 43, 45, 47, 51, 53, 56, 67, 78, 220, 326 , . Εφόσον υπάρχει περιττός αριθμός δεδομένων, υπάρχει μία μεσαια τιμή, που ειναι η τιμή 51 .

β) Το Αθροισμα των 13 τιμών είναι 1091 και επομένως η μέση τιμή είναι 1091/13= 83,92. Ο αριθμητικός μέσος επηρεάζεται απο τις ακραιές τιμές 220 και 326, άρα η διάμεσος παρουσιάζει μια πιο αντιπροσωπευτικότερη εικόνα.

Επικρατούσα τιμή

Η επικρατούσα τιμή των τιμών μίας μεταβλητής είναι εκείνη η τιμή στην οποία αντιστοιχεί η μεγαλύτερη συχνότητα παρατηρήσεων.

Τη συμβολίζουμε με το γράμμα d. Συμβολικά: h(d) = maxjh(a1).

Είναι η τιμή εκείνη των δεδομένων που έχει τη μεγαλύτερη συχνότητα εμφάνισης. Στο παρακάτω σύνολο δεδομένων 1 3 4 3 4 5 4 2 η τιμή αυτή είναι το 4. Όταν υπάρχουν δύο τιμές με την ίδια συχνότητα εμφάνισης τότε λέμε ότι τα δεδομένα έχουν δύο επικρατούσες τιμές. Η κατανομή με μία επικρατούσα τιμή λέγεται μονοκόρυφη (unimodal) ενώ με δύο λέγεται δικόρυφη (bimodal).


π.χ. σε 16 παρατηρηθείσες τιμές: 2, 5,12, 7, 5, 7, 6, 2, 4, 13, 5, 6, 4, 5 , 7 μίας μεταβλητής επικρατούσα τιμή είναι η Τ= 5, γιατί αυτή η τιμή εμφανίζεται συχνότερα από όλες τις άλλες.

Η επικρατούσα τιμή (ΕΤ) είναι ικανοποιητικό μέτρο θέσης αν η κατανομή είναι συμμετρική. Αν όχι δεν μπορεί να θεωρηθεί ως αντιπροσωπευτικός αριθμός της κατανομής.


Σχέση μέσης, διάμεσης και επικρατούσας τιμής

Όταν τα δεδομένα είναι ονομαστικά τότε η επικρατούσα τιμή δηλαδή αυτή με τη μεγαλύτερη συχνότητα είναι το μόνο μέτρο θέσης που μπορούμε να χρησιμοποιήσουμε. Όταν τα δεδομένα είναι διατακτικά έχει νόημα να προσδιορίσουμε εκτός από την επικρατούσα και την διάμεσο τιμή. Όταν τα δεδομένα είναι σε διαστημική ή αναλογική κλίμακα μπορούμε να χρησιμοποιήσουμε την επικρατούσα τιμή, τη διάμεσο και τον αριθμητικό μέσο. Το μέτρο που τελικά θα επιλέξουμε εξαρτάται από τη φύση του προβλήματος και τους σκοπούς της έρευνας. Έτσι π.χ. αν στα δεδομένα έχουμε λίγες, διακριτές τιμές, οι οποίες επαναλαμβάνονται με κάποιες συχνότητες τότε η επικρατούσα τιμή και η διάμεσος δίνουν καλύτερη πληροφόρηση στον μέσο αναγνώστη από τον αριθμητικό μέσο, ο οποίος μπορεί να πάρει και μια τιμή η οποία είναι μη παρατηρήσιμη. Έτσι π.χ. αν τα δεδομένα είναι παρατηρήσεις του αριθμού παιδιών ανά οικογένεια ο μέσος αναγνώστης αντιλαμβάνεται καλύτερα τις προτάσεις «η τυπική οικογένεια έχει 2 παιδιά» και «οι μισές οικογένειες έχουν μέχρι ένα παιδί» από την πρόταση «ο μέσος αριθμός ανά οικογένεια ισούται με 1.55». Ο αριθμητικός μέσος όμως μπορεί να χρησιμοποιηθεί σε περαιτέρω στατιστική ανάλυση. Γενικότερα, από άποψη μαθηματικής δομής τα ονομαστικά δεδομένα βρίσκονται στο κατώτερο επίπεδο μέτρησης, ακολουθούν τα διατακτικά και τέλος τα ποσοτικά. Οι στατιστικές μέθοδοι που έχουν αναπτυχθεί για τα δεδομένα ορισμένου τύπου μπορούν να χρησιμοποιηθούν και στα δεδομένα ανώτερης κλίμακας αλλά όχι στις κατώτερες. Τέλος σημειώνουμε ότι στις συμμετρικές κατανομές οι τιμές των τριών παραμέτρων συμπίπτουν. Στις ασύμμετρες κατανομές οι τιμές των παραμέτρων θέσης διαφέρουν και η διάμεσος βρίσκεται μεταξύ των άλλων δύο. Στην περίπτωση θετικής ασυμμετρίας, ο αριθμητικός μέσος είναι η μεγαλύτερη των τριών παραμέτρων θέσης. Στην περίπτωση αρνητική ασυμμετρίας η επικρατούσα τιμή είναι η μεγαλύτερη των τριών παραμέτρων θέσης.

ΕΜΠΕΙΡΙΚΟΣ ΚΑΝΟΝΑΣ ΑΝΑΜΕΣΑ ΣΤΟΝ ΑΡΙΘΜΗΤΙΚΟ ΜΕΣΟ, ΤΗ ΔΙΑΜΕΣΟ ΚΑΙ ΤΗΝ ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ

Όταν έχουμε μονοκόρυφες καμπύλες που δεν είναι τελείως ασύμμετρες

(στις συμμετρικές καμπύλες ο αριθμητ.μεσος, η επικρατούσα τιμή και η διάμεσος συμπίπτουν),

τότε μπορούμε να εφαρμόσουμε τον παρακάτω εμπειρικό κανόνα:

ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ - ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ = 3*(ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ-ΔΙΑΜΕΣΟΣ)

Ποσοστιαία σημεία

Αν έχουμε n παρατηρήσεις x1,...,xn και τις διατάξουμε σε αύξουσα σειρά μεγέθους, τότε το p-οστό ποσοστιαίο σημείο είναι μια τιμή \tilde{x}_{p}, 0<p<1, κάτω από την οποία υπάρχουν np των παρατηρήσεων, ενώ (1-p)n βρίσκονται άνω.

Υπολογισμος μορίων για ομαδοποιημένες παρατηρήσεις

Qk = Xi − 1 + δ / fi(kN / 4 − Φi − 1) k=1,2,3

Dk = Xi − 1 + δ / fi(kN / 10 − Φi − 1) k=1,2,...,9

Ck = Xi − 1 + δ / fi(kN / 100 − Φi − 1) k=1,2,..., 99


Παράδειγμα

Να υπολογιστούν τα ποσοστιαία σημεία των παρακάτω δεδομένων:

11, 24, 41, 45, 46, 48, 49, 51, 51, 51, 52, 56, 57, 61, 61, 64, 68, 69, 71, 75, 83, 87, 94.

Λύση:

ΠΑΡΑΔΕΙΓΜΑ

ΕΣΤΩ μια εταιρία απασχολεί 65 εργαζόμενους και οι εβδομαδιαίες αποδοχές τους είναι:

200€-210,99€ _8 εργαζόμενοι 1η ΚΛΑΣΗ

211€-221,99€ _10 εργαζόμενοι 2η ΚΛΑΣΗ

222€-232,99€ _16 εργαζόμενοι 3η ΚΛΑΣΗ

233€-243,99€ _14 εργαζόμενοι 4η ΚΛΑΣΗ

244€-254,99€ _10 εργαζόμενοι 5η ΚΛΑΣΗ

255€-265,99€ _5 εργαζόμενοι 6η ΚΛΑΣΗ

266€-276,99€ _2 εργαζόμενοι 7η ΚΛΑΣΗ

ΣΥΝΟΛΟ : 65 ΕΡΓΑΖΟΜΕΝΟΙ

ΤΟ ΠΡΩΤΟ ΤΕΤΑΡΤΗΜΟΡΙΟ ΣΗΜΕΙΟ Q1 ΕΧΟΥΜΕ:

Ν/4= 65/4=16,25

Τις 8 περιπτώσεις θα τις πάρουμε από την πρώτη κλάση τις υπόλοιπες 8,25 (16,25-8) θα τις παρουμε απο τις 10 περιπτώσεις της δεύτερης κλάσης.

Έτσι με τη μέθοδο της γραμμικής παρεμβολής εχουμε:

Q1=210,995€+8,25/10*(10,00€)=219,24€

ΜΕ ΤΟΝ ΙΔΙΟ ΤΡΟΠΟ ΤΟ ΔΕΥΤΕΡΟ ΤΕΤΑΡΤΗΜΟΡΙΟ ΣΗΜΕΙΟ Q2 2Ν/4=Ν/2=65/2=32,5 θα παρουμε περιπτωσεις μεχρι και από την τρίτη κλάση(32,5-18=14,5) έτσι: Q2=221,995€+14,5/16(10,00€)=231,05

ΤΑ ΙΔΙΑ ΒΗΜΑΤΑ ΓΙΑ ΤΟ ΤΡΙΤΟ ΤΕΤΑΡΤΗΜΟΡΙΟ ΣΗΜΕΙΟ Q3 3Ν/4=(0,75)*(65)=48,75 48,75-48=0,75 άρα θα πάρουμε περιπτώσεις και απο την 5η κλαση ΕΠΟΜΕΝΩΣ Q3=243,995+0,75/10*(10,00€)=244,74

ΑΡΑ

   ΤΟ 25% ΤΩΝ ΥΠΑΛΛΗΛΩΝ ΠΑΙΡΝΕΙ 219,24€ ή λιγότερο
   ΤΟ 50% ΤΩΝ ΥΠΑΛΛΗΛΩΝ ΠΑΙΡΝΕΙ 231,05 ή λιγότερο
   ΤΟ 75% ΤΩΝ ΥΠΑΛΛΗΛΩΝ ΠΑΙΡΝΕΙ 244,74 ή λιγότερο

Ανακτήθηκε από το "http://androulakis.bma.upatras.gr/mediawiki/index.php/%CE%A0%CE%B1%CF%81%CE%AC%CE%BC%CE%B5%CF%84%CF%81%CE%BF%CE%B9_%CE%B8%CE%AD%CF%83%CE%B7%CF%82".

Αυτή η σελίδα έχει προσπελαστεί 12.988 φορές. Η σελίδα αυτή τροποποιήθηκε τελευταία φορά στις 16:36, 26 Ιουλίου 2013.