Meilenstein M2
Lern- und Testfragen Block A
- Was ist der Unterschied zwischen der Ergebnismenge \( \Omega \) und dem dem Stichprobenraum \( \mathcal{X} \)?
- Wie lautet die Definition des Begriffs Statistik? Ist \( T(X_1, \dots, X_n) = \{ 1 \} \) eine Statistik?
- Was versteht man unter einem Verteilungsmodell?
- Erweitern Sie Beispiel 3.2.1 auf den Fall \( \vartheta \in \{ 1/4, 1/2, 3/4 \} \). Geben Sie für alle möglichen Realisationen \( y \) den Maximum-Likelihood-Schätzer an.
- Zu Schätzen sei der Parameter \( \lambda \) im Modell der Exponentialverteilung. Geben Sie die Verteilungsfamilie formal an. Stellen Sie die Likelihood-Funktion auf. Bestimmen Sie den ML-Schätzer. Welchen Wert erhalten Sie, wenn \( \overline{x} = 10 \) beobachtet wird?
- Betrachten Sie den Schätzer \( T(X_1, \dots, X_n) = (X_1 + 2 + X_4)/2 \), wobei \( X_1, \dots, X_n \) eine einfache Zufallsstichprobe vom Umfang \( n \ge 3 \). Bestimmen Sie Bias, Varianz und MSE bzgl. des zu schätzenden Verteilungsparameters \( \mu = E(X_1) \). Geben Sie einen Schätzer an, der stets besser ist.
- Kann ein verzerrter Schätzer konsistent sein? Falls nein, geben Sie ein Gegenbeispiel an.
- Geben sei eine normalverteilte Zufallsstichprobe vom Umfang \( n = 20 \), aus deren Realisation sich die Werte \( \sum_{i=1}^n x_i = 100 \) und \( S^2 = 10 \) ergeben. Geben Sie ein Konfidenzintervall für den Erwartungswert zum Konfidenzniveau \( 0.9 \) an.
- Diskutieren Sie die folgende Interpretation: Ein Konfidenzintervall ist ein Intervall, in dem der wahre Wert des Schätzers mit Wahrscheinlichkeit \( 1 - \alpha \) liegt.
- Führen Sie die auf S. 158 nicht ausgeführten Umformungen, die auf das Konfidenzintervall für den Parameter \( \lambda \) der Poisson-Verteilung führen, konkret durch. Hat das Konfidenzintervall exakt (und bei jedem Stichprobenumfang) das Konfidenzniveau \( 1 - \alpha \)?
Block B
- Welche statistischen Testprobleme für das Binomialmodell kennen Sie? Geben Sie jeweils ein Beispiel an.
- Was versteht man unter den folgenden Begriffen: Fehler 2. Art, Signifikanzniveau, Fehlerwahrscheinlichkeit 1. Art, Schärfe, Nullhypothese.
- Was passiert mit den Fehlerwahrscheinlichkeiten 1. und 2. Art, wenn der Stichprobenumfang erhöht wird?
- Illustrieren Sie an einer Skizze die folgenden Begriffe für einen einseitigen Test: Kritischer Bereich, Signifikanzniveau, \( t_{obs} \), \( P \)-Wert.
- Kann man für das Testproblem \( H_0 : \mu \le 100 \) versus \( H_1 : \mu > 100 \) die Teststatistik $$ T = \sqrt{n} \frac{ |\overline{X}_n - \mu| }{ S } $$ verwenden?
- Sehen Sie sich das Videotutorial zum Zentralen Grenzwertsatz an. Berechnen Sie für den Autohersteller ein Konfidenzintervall für den erwarteten Gewinn zum Konfidenzniveau \( 95\% \), wenn \( \overline{x} = 0.5 \) Mio Euro gegeben ist.
- Für eine normalverteilte Stichprobe ergebe die Berechnung eines Konfidenzintervalls zum Konfidenzniveau \( 95\% \) für den Erwartungswert das Intervall \( [0.5, 3.8] \). Können Sie die Hypothese \( H_0 : \mu = 0 \) auf dem \(5\%\)-Niveau ablehnen?
- Führen Sie eine Fallzahlplanung durch, wenn eine Differenz von \( d = 10 \) als relevant angesehen wird und mit einer Wahrscheinlichkeit von \( 95\% \) aufgedeckt werden soll ( \( n = 36, \alpha = 0.1 \) ).
- In Beispiel 3.7.3 wird offenkundig nicht auf das richtige Beispiel Bezug genommen. Suchen Sie das richtige Beispiel heraus und prüfen Sie, ob die Berechnungen stimmen.
- Wie gehen Sie in Beispiel 3.7.3 vor, wenn die Varianzen ungleich sind? Welches Ergebnis ergibt sich jetzt?
- Wie gehen Sie in Beispiel 3.7.3 vor, wenn zwar angenommen werden kann, dass die Verteilungen in beiden Stichproben dieselbe Form haben, aber keine Normalverteilungen sind?
- Betrachten Sie die Datensätze \( (X_1,X_2,X_3,X_4) = (1.3, 6.5, 2.4, 3.3) \) und \( (Y_1,Y_2,Y_3,Y_4,Y_5) = (2.1, 3.1, 4.8, 6.8, 8.1) \). Markieren Sie beide Datensätze auf der reellen Achse, schreiben Sie über die Beobachtungen die Beobachtungsnummer dazu und notieren Sie unter den Beobachtungen die Rangzahlen. Berechnen Sie die Teststatistik des Wilcoxon-Rangsummentests.
- Formulieren Sie das stochastische Modell der linearen Einfachregression. Warum wird angenommen, dass die Fehlerterme Erwartungswert 0 haben?
- Leiten Sie die Normalgleichungen her und hieraus die Formeln für die KQ-Schätzer im Regressionsmodell.
- Erläutern Sie, warum das Bestimmtheitsmaß \( R^2 \) so bezeichnet wird. Mit welcher grundlegenden Statistik hängt es zusammen?
- Gibt es einen Zusammenhang (bzw. mehrere Zusammenhänge) zwischen dem Wert des Korrelationskoeffizienten und dem Steigungsmaß der Regressionsgerade? Wenn ja, welche(n)?
- Die Teststatistik \( T_b \) für den Test des Steigungskoeffizienten nehmen für einen Datensatz den Wert \( 7.8 \) an. Was können Sie hieraus schließen?