13 - Grundbegriffe der deskriptiven Statistik
- erhobene Daten: statistische Einheiten, Untersuchungseinheiten oder Merkmalsträger, Versuchseinheiten (durch Experimente gewonnen), Beobachtungseinheiten (Beobachtungsstudien)
- Menge der statistischen Einheiten: Grundgesamtheit oder Population
- Teilauswahl einer Grundgesamtheit: Stichprobe; Stichprobe ist repräsentativ, wenn bezüglich wichtiger Charakteristika strukturgleich zur Grundgesamtheit
- vorgegebene Quoten, die Stichprobe einhalten muss: quotierte Teilauswahl
- (einfache) Zufallsstichprobe: jede Teilmenge der Grundgesamtheit hat gleiche Wahrscheinlichkeit, gezogen zu werden
- interessierende Größen der statistischen Einheiten: Merkmale oder Variablen
- Mögliche Werte eines Merkmals: Merkmalsausprägungen oder (mögliche) Ausprägungen
- nur endlich viele oder abzählbar unendlich viele Ausprägungen möglich: diskretes Merkmal, sonst stetiges Merkmal
Skalen
- Nominalskala: Ausprägungen stehen in keiner Beziehung zueinander; nur zwei Ausprägungen: dichotome oder binäre Variable
- Ordinalskala: Ausprägungen sind vergleichbar
- Metrische Skala (Kardinalskala): Ausprägungen sind Vielfache einer Grundeinheit; Intervallskala: Nullpunkt willkürlich, sonst Verhältnis-, Quotienten- oder Ratioskala
Studiendesigns
- Querschnittstudie (engl.: cross-sectional study): fester Zeitpunkt, interessierende Merkmale werden an statistischen Einheiten erhoben
- Longitudinalstudie: Merkmale werden zu verschiedenen Zeitpunkten an festem Kollektiv (Panel) erhoben
Aufbereitung von Daten
- Rohdaten (Pimärdaten, Urliste) mit \(p\) Merkmalen (Dimension der Daten) an \(n\) statistischen Einheiten (Stichprobenumfang) in \(n\times p\)-Matrix (Datenmatrix) darstellbar
- p=1: univariate Daten, sonst multivariate Daten
- Der Vektor $$\textbf{x}=(x_1,\ldots,x_n) \in \mathbb{R}^n$$ der \(n\) Ausprägungen eines Merkmals heißt Datenvektor.