torsdag 23. juli 2015

Quantile und Werte der Streuung

Ein Quantil unterteilt n geordnete Werte in einem bestimmten Verhältnis. Als Interquartilabstand bezeichnet man den Abstand zwischen unterem und oberen Quartil (dQ = y.75-y.25). Die fünf-Punkte-Zusammenfassung fasst die Werte des Minimums (ymin), des unteren Quartils (y.25), des Medians (ymed), des oberen Quartils (y.75) und des Maximums (ymax) zusammen. 
Die Spannweite oder auch Range (dr) bezeichnet den Abstand zwischen dem größten und dem kleinsten Wert eines Datensatzes. Sie ist sehr anfällig für Extremwerte und Ausreißer und somit nicht sehr informationsreich. Die Spannweite errechnet sich als Differenz aus Maximum und Minimum (dr = ymax -ymin)
Als Interqartilabstand (dQ) wird der Abstand zwischen oberem und unterem Quartil bezeichnet, ist robust gegenüber Ausreißern und Extremwerten und errechnet sich aus der Differenz des oberen und unteren Quartils (dQ = y.75-y.25). Das Abweichungsquadrat / Variation bezeichnet die Abweichung der Beobachtung vom Mittelwert und errechnet sich aus der Summe der Abweichungsquadrate (Sum of Squares, SS). Je größer der Wert der Variation ist, um so stärker ist die Streuung um den Mittelwert. Das Abweichungsquadrat ist abhängig von der Stichprobengröße, wohingegen die Varianz unabhängig von der Stichprobengröße ist. Die Varianz ist die mittlere quadratische Abweichung der Beobachtung vom Mittelwert. 

s^2=\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2


Die Standardabweichung ist ebenfalls unabhängig von der Stichprobengröße. Die Standardabweichung wird berechnet indem man die Wurzel aus der Varianz zieht. Somit sind die Werte standardisiert und das Ergebnis ist in der gleichen Einheit, in der ursprünglich gemessen wurde.
σ(X) = √Var(X)
 
   





Ingen kommentarer:

Legg inn en kommentar