Übungsaufgaben

Effektgrößen und Stichprobenumfangsplanung in der ELR und MLR

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Sonnencremetuben\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Sonnencremetuben), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten1.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Sonnencremetuben), Daten)
    
    summary(fit)
    Residuals:
         Min       1Q   Median       3Q      Max 
    -2.37827 -0.58882 -0.00076  0.70684  2.42757 
    
    Coefficients:
                              Estimate Std. Error t value Pr(>|t|)    
    (Intercept)             -2.514e-18  8.388e-02   0.000   1.0000    
    scale(Freibadkarten)     3.781e-01  8.424e-02   4.488 1.69e-05 ***
    scale(Sonnencremetuben)  1.585e-01  8.424e-02   1.881   0.0624 .  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 0.9189 on 117 degrees of freedom
    Multiple R-squared:  0.1698,   Adjusted R-squared:  0.1556 
    F-statistic: 11.97 on 2 and 117 DF,  p-value: 1.871e-05
    ## KIs ausgeben:
    confint(fit)
                                   2.5 %    97.5 %
    (Intercept)             -0.166128180 0.1661282
    scale(Freibadkarten)     0.211288388 0.5449715
    scale(Sonnencremetuben) -0.008349381 0.3253338

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.211 bis 0.545 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.008 bis 0.325 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.17, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.05633634
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.2949528
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 5.6 bis 29.5 % der Gesamtvarianz der Motorradfahrer in der Population durch die Freibadkarten und die Sonnencremetuben zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.17\) ist.

    Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:

    fit2 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit2)
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      165.1367    12.6735  13.030   <2e-16 ***
    Sonnencremetuben   0.2282     0.1265   1.804   0.0737 .  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 21.4 on 118 degrees of freedom
    Multiple R-squared:  0.02685,  Adjusted R-squared:  0.0186 
    F-statistic: 3.256 on 1 and 118 DF,  p-value: 0.07372

    Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.17 - 0.027 = 0.143.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 14.3 %.



    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.17\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit3 <- lm(Motorradfahrer ~ Freibadkarten, Daten)
    summary(fit3)
    
    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   124.5758    14.2537   8.740 1.87e-14 ***
    Freibadkarten   0.6213     0.1391   4.468 1.82e-05 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.06 on 118 degrees of freedom
    Multiple R-squared:  0.1447,   Adjusted R-squared:  0.1374 
    F-statistic: 19.96 on 1 and 118 DF,  p-value: 1.823e-05

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.17 - 0.145 = 0.025.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Freibadkarten hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 2.5 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Cocktails in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Cocktails, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten2.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Flipflops), Daten)
    
    summary(fit)
    Residuals:
         Min       1Q   Median       3Q      Max 
    -2.42140 -0.49866 -0.03813  0.54175  1.85977 
    
    Coefficients:
                      Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      2.620e-15  7.197e-02   0.000   1.0000    
    scale(Cocktails) 1.678e-01  7.227e-02   2.322   0.0219 *  
    scale(Flipflops) 6.011e-01  7.227e-02   8.317 1.88e-13 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 0.7884 on 117 degrees of freedom
    Multiple R-squared:  0.3889,   Adjusted R-squared:  0.3785 
    F-statistic: 37.23 on 2 and 117 DF,  p-value: 3.069e-13
    ## KIs ausgeben:
    confint(fit)
                           2.5 %    97.5 %
    (Intercept)      -0.14252933 0.1425293
    scale(Cocktails)  0.02470469 0.3109596
    scale(Flipflops)  0.45795510 0.7442101

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.025 bis 0.311 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Cocktails um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.458 bis 0.744 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Cocktails konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.389, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.2427068
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.5151672
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 24.3 bis 51.5 % der Gesamtvarianz der Motorradfahrer in der Population durch die Cocktails und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Cocktails}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.389\) ist.

    Der Schätzwert für \(\rho_{- Cocktails}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Cocktails:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 115.9546    11.3460   10.22  < 2e-16 ***
    Flipflops     0.9139     0.1120    8.16 4.12e-13 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 18.79 on 118 degrees of freedom
    Multiple R-squared:  0.3607,   Adjusted R-squared:  0.3553 
    F-statistic: 66.59 on 1 and 118 DF,  p-value: 4.121e-13

    Ein Schätzwert für die Effektstärke \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Cocktails}^{2}\), in dem Fall also 0.389 - 0.361 = 0.028.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Cocktails erklärt werden kann, beträgt also 2.8 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.389\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Cocktails, Daten)
    summary(fit3)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 184.4552    12.7524  14.464   <2e-16 ***
    Cocktails     0.2291     0.1252   1.831   0.0697 .  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 23.18 on 118 degrees of freedom
    Multiple R-squared:  0.02762,  Adjusted R-squared:  0.01938 
    F-statistic: 3.351 on 1 and 118 DF,  p-value: 0.06967

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.389 - 0.028 = 0.361.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Cocktails hinweg nur durch die Flipflops erklärt werden kann, beträgt also 36.1 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Eiskugeln in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Eiskugeln, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten3.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Flipflops), Daten)
    
    summary(fit)
    Residuals:
         Min       1Q   Median       3Q      Max 
    -2.13372 -0.53842  0.04705  0.48653  2.74771 
    
    Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      -1.437e-15  7.713e-02   0.000 1.000000    
    scale(Eiskugeln)  2.679e-01  7.767e-02   3.449 0.000784 ***
    scale(Flipflops)  4.963e-01  7.767e-02   6.389 3.53e-09 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 0.8449 on 117 degrees of freedom
    Multiple R-squared:  0.2981,   Adjusted R-squared:  0.2861 
    F-statistic: 24.84 on 2 and 117 DF,  p-value: 1.018e-09
    ## KIs ausgeben:
    confint(fit)
                          2.5 %    97.5 %
    (Intercept)      -0.1527551 0.1527551
    scale(Eiskugeln)  0.1140339 0.4216909
    scale(Flipflops)  0.3424226 0.6500796

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.114 bis 0.422 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Eiskugeln um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.342 bis 0.65 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Eiskugeln konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.298, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.1575172
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.4290163
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 15.8 bis 42.9 % der Gesamtvarianz der Motorradfahrer in der Population durch die Eiskugeln und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Eiskugeln}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.298\) ist.

    Der Schätzwert für \(\rho_{- Eiskugeln}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Eiskugeln:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 110.8459    11.5560   9.592  < 2e-16 ***
    Flipflops     0.6706     0.1140   5.882 3.86e-08 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 21.12 on 118 degrees of freedom
    Multiple R-squared:  0.2267,   Adjusted R-squared:  0.2202 
    F-statistic:  34.6 on 1 and 118 DF,  p-value: 3.864e-08

    Ein Schätzwert für die Effektstärke \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Eiskugeln}^{2}\), in dem Fall also 0.298 - 0.227 = 0.071.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Eiskugeln erklärt werden kann, beträgt also 7.1 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.298\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Eiskugeln, Daten)
    summary(fit3)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 134.0071    17.1662   7.806 2.65e-12 ***
    Eiskugeln     0.4373     0.1698   2.575   0.0113 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 23.37 on 118 degrees of freedom
    Multiple R-squared:  0.0532,   Adjusted R-squared:  0.04518 
    F-statistic: 6.631 on 1 and 118 DF,  p-value: 0.01126

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.298 - 0.053 = 0.245.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Eiskugeln hinweg nur durch die Flipflops erklärt werden kann, beträgt also 24.5 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Bademeister erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Bademeister) ~ scale(Freibadkarten) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten4.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Bademeister) ~ scale(Freibadkarten) + scale(Flipflops), Daten)
    
    summary(fit)
    Residuals:
        Min      1Q  Median      3Q     Max 
    -2.8895 -0.6617  0.1225  0.6750  2.5393 
    
    Coefficients:
                           Estimate Std. Error t value Pr(>|t|)  
    (Intercept)          -3.986e-15  8.924e-02   0.000   1.0000  
    scale(Freibadkarten)  7.943e-02  8.972e-02   0.885   0.3778  
    scale(Flipflops)      2.286e-01  8.972e-02   2.548   0.0121 *
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 0.9776 on 117 degrees of freedom
    Multiple R-squared:  0.06033,  Adjusted R-squared:  0.04427 
    F-statistic: 3.756 on 2 and 117 DF,  p-value: 0.02624
    ## KIs ausgeben:
    confint(fit)
                               2.5 %    97.5 %
    (Intercept)          -0.17674209 0.1767421
    scale(Freibadkarten) -0.09826028 0.2571212
    scale(Flipflops)      0.05093520 0.4063167

    Wir gehen davon aus, dass sich die Anzahl der Bademeister im Mittel um -0.098 bis 0.257 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Bademeister im Mittel um 0.051 bis 0.406 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.06, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.1549232
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 15.5 % der Gesamtvarianz der Bademeister in der Population durch die Freibadkarten und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.06\) ist.

    Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:

    fit2 <- lm(Bademeister ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 114.4841    11.6496   9.827   <2e-16 ***
    Flipflops     0.3019     0.1163   2.596   0.0106 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.1 on 118 degrees of freedom
    Multiple R-squared:  0.05404,  Adjusted R-squared:  0.04602 
    F-statistic: 6.741 on 1 and 118 DF,  p-value: 0.01062

    Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.06 - 0.054 = 0.006.
    Der Anteil der Gesamtvarianz der Bademeister, der über die Flipflops hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 0.6 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.06\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Bademeister ~ Freibadkarten, Daten)
    summary(fit3)
    
    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   131.3534    13.3295   9.854   <2e-16 ***
    Freibadkarten   0.1288     0.1305   0.987    0.326    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.56 on 118 degrees of freedom
    Multiple R-squared:  0.008186, Adjusted R-squared:  -0.0002188 
    F-statistic: 0.974 on 1 and 118 DF,  p-value: 0.3257

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.06 - 0.008 = 0.052.
    Der Anteil der Gesamtvarianz der Bademeister, der über die Freibadkarten hinweg nur durch die Flipflops erklärt werden kann, beträgt also 5.2 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Eiskugeln in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Eiskugeln, Sonnencremetuben\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Sonnencremetuben), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten5.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Sonnencremetuben), Daten)
    
    summary(fit)
    Residuals:
         Min       1Q   Median       3Q      Max 
    -2.64810 -0.67088 -0.01471  0.61527  2.15858 
    
    Coefficients:
                              Estimate Std. Error t value Pr(>|t|)   
    (Intercept)             -1.151e-15  8.726e-02   0.000  1.00000   
    scale(Eiskugeln)         1.969e-01  8.776e-02   2.244  0.02671 * 
    scale(Sonnencremetuben)  2.402e-01  8.776e-02   2.737  0.00718 **
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 0.9559 on 117 degrees of freedom
    Multiple R-squared:  0.1016,   Adjusted R-squared:  0.08625 
    F-statistic: 6.616 on 2 and 117 DF,  p-value: 0.001896
    ## KIs ausgeben:
    confint(fit)
                                  2.5 %    97.5 %
    (Intercept)             -0.17281699 0.1728170
    scale(Eiskugeln)         0.02313858 0.3707368
    scale(Sonnencremetuben)  0.06635715 0.4139554

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.023 bis 0.371 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Eiskugeln um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.066 bis 0.414 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Eiskugeln konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.102, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.01606847
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.2130743
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 1.6 bis 21.3 % der Gesamtvarianz der Motorradfahrer in der Population durch die Eiskugeln und die Sonnencremetuben zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Eiskugeln}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.102\) ist.

    Der Schätzwert für \(\rho_{- Eiskugeln}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Eiskugeln:

    fit2 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit2)
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      125.9574    12.6264   9.976  < 2e-16 ***
    Sonnencremetuben   0.3499     0.1243   2.815  0.00571 ** 
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.65 on 118 degrees of freedom
    Multiple R-squared:  0.06294,  Adjusted R-squared:  0.055 
    F-statistic: 7.925 on 1 and 118 DF,  p-value: 0.005714

    Ein Schätzwert für die Effektstärke \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Eiskugeln}^{2}\), in dem Fall also 0.102 - 0.063 = 0.039.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Eiskugeln erklärt werden kann, beträgt also 3.9 %.



    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.102\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit3 <- lm(Motorradfahrer ~ Eiskugeln, Daten)
    summary(fit3)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 130.9024    13.0835  10.005   <2e-16 ***
    Eiskugeln     0.3005     0.1288   2.333   0.0213 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.86 on 118 degrees of freedom
    Multiple R-squared:  0.0441,   Adjusted R-squared:  0.036 
    F-statistic: 5.444 on 1 and 118 DF,  p-value: 0.02133

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.102 - 0.044 = 0.058.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Eiskugeln hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 5.8 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Sonnencremetuben in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Sonnencremetuben, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Sonnencremetuben) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten6.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Sonnencremetuben) + scale(Flipflops), Daten)
    
    summary(fit)
    Residuals:
        Min      1Q  Median      3Q     Max 
    -2.5422 -0.6333 -0.1361  0.7689  2.2022 
    
    Coefficients:
                              Estimate Std. Error t value Pr(>|t|)  
    (Intercept)              2.851e-15  8.981e-02   0.000   1.0000  
    scale(Sonnencremetuben) -8.413e-02  9.057e-02  -0.929   0.3549  
    scale(Flipflops)         2.108e-01  9.057e-02   2.327   0.0217 *
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 0.9839 on 117 degrees of freedom
    Multiple R-squared:  0.04826,  Adjusted R-squared:  0.032 
    F-statistic: 2.967 on 2 and 117 DF,  p-value: 0.05536
    ## KIs ausgeben:
    confint(fit)
                                  2.5 %     97.5 %
    (Intercept)             -0.17787360 0.17787360
    scale(Sonnencremetuben) -0.26349292 0.09524139
    scale(Flipflops)         0.03139731 0.39013163

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.263 bis 0.095 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.031 bis 0.39 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.048, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.136338
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 13.6 % der Gesamtvarianz der Motorradfahrer in der Population durch die Sonnencremetuben und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Sonnencremetuben}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.048\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept)  89.0331    12.3023   7.237 5.03e-11 ***
    Flipflops     0.2765     0.1227   2.253   0.0261 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 18.94 on 118 degrees of freedom
    Multiple R-squared:  0.04125,  Adjusted R-squared:  0.03312 
    F-statistic: 5.076 on 1 and 118 DF,  p-value: 0.0261

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.048 - 0.041 = 0.007.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 0.7 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.048\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit3)
    
    Coefficients:
                      Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      124.84586   11.97704  10.424   <2e-16 ***
    Sonnencremetuben  -0.08427    0.11927  -0.706    0.481    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.3 on 118 degrees of freedom
    Multiple R-squared:  0.004212, Adjusted R-squared:  -0.004227 
    F-statistic: 0.4991 on 1 and 118 DF,  p-value: 0.4813

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.048 - 0.004 = 0.044.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Flipflops erklärt werden kann, beträgt also 4.4 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten7.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Flipflops), Daten)
    
    summary(fit)
    Residuals:
         Min       1Q   Median       3Q      Max 
    -2.32016 -0.65681 -0.01781  0.69420  2.39574 
    
    Coefficients:
                          Estimate Std. Error t value Pr(>|t|)
    (Intercept)          9.930e-16  9.147e-02   0.000    1.000
    scale(Freibadkarten) 6.345e-02  9.256e-02   0.686    0.494
    scale(Flipflops)     1.022e-01  9.256e-02   1.104    0.272
    
    Residual standard error: 1.002 on 117 degrees of freedom
    Multiple R-squared:  0.01287,  Adjusted R-squared:  -0.004003 
    F-statistic: 0.7627 on 2 and 117 DF,  p-value: 0.4687
    ## KIs ausgeben:
    confint(fit)
                               2.5 %    97.5 %
    (Intercept)          -0.18115083 0.1811508
    scale(Freibadkarten) -0.11985797 0.2467593
    scale(Flipflops)     -0.08111578 0.2855015

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.12 bis 0.247 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.081 bis 0.286 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.013, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.06924525
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 6.9 % der Gesamtvarianz der Motorradfahrer in der Population durch die Freibadkarten und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.013\) ist.

    Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 141.2271    14.4977   9.741   <2e-16 ***
    Flipflops     0.1468     0.1426   1.030    0.305    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 22.42 on 118 degrees of freedom
    Multiple R-squared:  0.008906, Adjusted R-squared:  0.0005067 
    F-statistic:  1.06 on 1 and 118 DF,  p-value: 0.3052

    Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.013 - 0.009 = 0.004.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 0.4 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.013\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Freibadkarten, Daten)
    summary(fit3)
    
    Coefficients:
                   Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   147.75292   15.06219   9.810   <2e-16 ***
    Freibadkarten   0.08067    0.14584   0.553    0.581    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 22.49 on 118 degrees of freedom
    Multiple R-squared:  0.002586, Adjusted R-squared:  -0.005867 
    F-statistic: 0.3059 on 1 and 118 DF,  p-value: 0.5812

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.013 - 0.003 = 0.01.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Freibadkarten hinweg nur durch die Flipflops erklärt werden kann, beträgt also 1 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Cocktails in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Cocktails, Sonnencremetuben\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Sonnencremetuben), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten8.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Sonnencremetuben), Daten)
    
    summary(fit)
    Residuals:
         Min       1Q   Median       3Q      Max 
    -2.35692 -0.58126 -0.08511  0.52751  2.49090 
    
    Coefficients:
                              Estimate Std. Error t value Pr(>|t|)
    (Intercept)             -1.077e-15  9.125e-02   0.000    1.000
    scale(Cocktails)         4.579e-03  9.174e-02   0.050    0.960
    scale(Sonnencremetuben)  1.324e-01  9.174e-02   1.443    0.152
    
    Residual standard error: 0.9996 on 117 degrees of freedom
    Multiple R-squared:  0.01762,  Adjusted R-squared:  0.0008244 
    F-statistic: 1.049 on 2 and 117 DF,  p-value: 0.3535
    ## KIs ausgeben:
    confint(fit)
                                  2.5 %    97.5 %
    (Intercept)             -0.18071477 0.1807148
    scale(Cocktails)        -0.17711549 0.1862744
    scale(Sonnencremetuben) -0.04927027 0.3141196

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.177 bis 0.186 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Cocktails um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.049 bis 0.314 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Cocktails konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.018, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.08116234
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 8.1 % der Gesamtvarianz der Motorradfahrer in der Population durch die Cocktails und die Sonnencremetuben zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Cocktails}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.018\) ist.

    Der Schätzwert für \(\rho_{- Cocktails}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Cocktails:

    fit2 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit2)
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      125.1351    12.2312  10.231   <2e-16 ***
    Sonnencremetuben   0.1756     0.1208   1.454    0.149    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.93 on 118 degrees of freedom
    Multiple R-squared:  0.0176,   Adjusted R-squared:  0.009271 
    F-statistic: 2.114 on 1 and 118 DF,  p-value: 0.1487

    Ein Schätzwert für die Effektstärke \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Cocktails}^{2}\), in dem Fall also 0.018 - 0.018 = 0.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Cocktails erklärt werden kann, beträgt also 0 %.



    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.018\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit3 <- lm(Motorradfahrer ~ Cocktails, Daten)
    summary(fit3)
    
    Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 141.34720   11.49318  12.298   <2e-16 ***
    Cocktails     0.01393    0.11523   0.121    0.904    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.11 on 118 degrees of freedom
    Multiple R-squared:  0.0001239,    Adjusted R-squared:  -0.00835 
    F-statistic: 0.01462 on 1 and 118 DF,  p-value: 0.904

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.018 - 0 = 0.018.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Cocktails hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 1.8 %.