Häufigkeitsdaten

In der Statistik bezeichnet man als Häufigkeitsdaten die Zusammenfassung der Ausprägungen a 1 , a 2 , , a k {\displaystyle a_{1},a_{2},\ldots ,a_{k}} der Werte x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}} eines Merkmals X {\displaystyle X} mit den jeweiligen Häufigkeiten h 1 , h 2 , , h k {\displaystyle h_{1},h_{2},\ldots ,h_{k}} bzw. f 1 , f 2 , , f k {\displaystyle f_{1},f_{2},\ldots ,f_{k}} .

Erklärung

Sei h j = h ( a j ) {\displaystyle h_{j}=h(a_{j})} die absolute Häufigkeit der Ausprägungen a j {\displaystyle a_{j}} und damit die Anzahl der Werte für die x i = a j {\displaystyle x_{i}=a_{j}} gilt und sei f j = f ( a j ) = h j / n {\displaystyle f_{j}=f(a_{j})=h_{j}/n} die relative Häufigkeit von a j {\displaystyle a_{j}} , d. h. der Anteil der Werte für die x i = a j {\displaystyle x_{i}=a_{j}} gilt. Die absolute Häufigkeitsverteilung h 1 , h 2 , , h k {\displaystyle h_{1},h_{2},\ldots ,h_{k}} und die relative Häufigkeitsverteilung f 1 , f 2 , , f k {\displaystyle f_{1},f_{2},\ldots ,f_{k}} fasst man oft in einer Häufigkeitstabelle zusammen. Die Ausprägungen a 1 , a 2 , , a k {\displaystyle a_{1},a_{2},\ldots ,a_{k}} zusammen mit den Häufigkeiten h 1 , h 2 , , h k {\displaystyle h_{1},h_{2},\ldots ,h_{k}} bzw. f 1 , f 2 , , f k {\displaystyle f_{1},f_{2},\ldots ,f_{k}} werden auch als Häufigkeitsdaten bezeichnet.[1]

Anwendungsbeispiele

Arithmetisches Mittel für Häufigkeitsdaten

Für Häufigkeitsdaten mit den Ausprägungen a 1 , a 2 , , a k {\displaystyle a_{1},a_{2},\ldots ,a_{k}} und den dazugehörigen relativen Häufigkeiten f 1 , f 2 , , f k {\displaystyle f_{1},f_{2},\ldots ,f_{k}} ergibt sich das arithmetische Mittel als[2]

x ¯ := a 1 f 1 + a 2 f 2 + + a k f k = j = 1 k a j f j {\displaystyle {\overline {x}}:=a_{1}f_{1}+a_{2}f_{2}+\ldots +a_{k}f_{k}=\sum _{j=1}^{k}{a_{j}f_{j}}} .

Empirische Varianz für Häufigkeitsdaten

Für Häufigkeitsdaten mit den Ausprägungen a 1 , a 2 , , a k {\displaystyle a_{1},a_{2},\ldots ,a_{k}} und relativen Häufigkeiten f 1 , f 2 , , f k {\displaystyle f_{1},f_{2},\ldots ,f_{k}} wird die empirische Varianz wie folgt berechnet

s ~ 2 = j = 1 k ( a j x ¯ ) 2 f j {\displaystyle {\tilde {s}}^{2}=\sum \limits _{j=1}^{k}\left(a_{j}-{\overline {x}}\right)^{2}f_{j}} ,[3]

mit x ¯ := j = 1 k f j a j = 1 n j = 1 k h j a j {\displaystyle {\overline {x}}:=\sum _{j=1}^{k}{f_{j}a_{j}}={\frac {1}{n}}\sum _{j=1}^{k}{h_{j}a_{j}}} ,

Einzelnachweise

  1. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2016, ISBN 978-3-662-50371-3, S. 30
  2. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, und Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2016, ISBN 978-3-662-50371-3, S. 50.
  3. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2016, ISBN 978-3-662-50371-3, S. 65.