Residuals:
Min 1Q Median 3Q Max
-2.37827 -0.58882 -0.00076 0.70684 2.42757
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.514e-18 8.388e-02 0.000 1.0000
scale(Freibadkarten) 3.781e-01 8.424e-02 4.488 1.69e-05 ***
scale(Sonnencremetuben) 1.585e-01 8.424e-02 1.881 0.0624 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.9189 on 117 degrees of freedom
Multiple R-squared: 0.1698, Adjusted R-squared: 0.1556
F-statistic: 11.97 on 2 and 117 DF, p-value: 1.871e-05
Übungsaufgaben
Effektgrößen und Stichprobenumfangsplanung in der ELR und MLR
Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Sonnencremetuben\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Sonnencremetuben), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten1.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Sonnencremetuben), Daten) fit summary(fit)
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.166128180 0.1661282 scale(Freibadkarten) 0.211288388 0.5449715 scale(Sonnencremetuben) -0.008349381 0.3253338
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.211 bis 0.545 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.008 bis 0.325 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.17, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0.05633634 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.2949528 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 5.6 bis 29.5 % der Gesamtvarianz der Motorradfahrer in der Population durch die Freibadkarten und die Sonnencremetuben zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.17\) ist.
Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:<- lm(Motorradfahrer ~ Sonnencremetuben, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 165.1367 12.6735 13.030 <2e-16 *** Sonnencremetuben 0.2282 0.1265 1.804 0.0737 . --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 21.4 on 118 degrees of freedom Multiple R-squared: 0.02685, Adjusted R-squared: 0.0186 F-statistic: 3.256 on 1 and 118 DF, p-value: 0.07372
Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.17 - 0.027 = 0.143.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 14.3 %.
\(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.17\) ist.
Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:<- lm(Motorradfahrer ~ Freibadkarten, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 124.5758 14.2537 8.740 1.87e-14 *** Freibadkarten 0.6213 0.1391 4.468 1.82e-05 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 20.06 on 118 degrees of freedom Multiple R-squared: 0.1447, Adjusted R-squared: 0.1374 F-statistic: 19.96 on 1 and 118 DF, p-value: 1.823e-05
Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.17 - 0.145 = 0.025.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Freibadkarten hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 2.5 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Cocktails in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Cocktails, Flipflops\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Flipflops), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten2.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Flipflops), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.42140 -0.49866 -0.03813 0.54175 1.85977 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.620e-15 7.197e-02 0.000 1.0000 scale(Cocktails) 1.678e-01 7.227e-02 2.322 0.0219 * scale(Flipflops) 6.011e-01 7.227e-02 8.317 1.88e-13 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7884 on 117 degrees of freedom Multiple R-squared: 0.3889, Adjusted R-squared: 0.3785 F-statistic: 37.23 on 2 and 117 DF, p-value: 3.069e-13
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.14252933 0.1425293 scale(Cocktails) 0.02470469 0.3109596 scale(Flipflops) 0.45795510 0.7442101
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.025 bis 0.311 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Cocktails um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.458 bis 0.744 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Cocktails konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.389, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0.2427068 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.5151672 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 24.3 bis 51.5 % der Gesamtvarianz der Motorradfahrer in der Population durch die Cocktails und die Flipflops zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Cocktails}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.389\) ist.
Der Schätzwert für \(\rho_{- Cocktails}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Cocktails:<- lm(Motorradfahrer ~ Flipflops, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 115.9546 11.3460 10.22 < 2e-16 *** Flipflops 0.9139 0.1120 8.16 4.12e-13 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 18.79 on 118 degrees of freedom Multiple R-squared: 0.3607, Adjusted R-squared: 0.3553 F-statistic: 66.59 on 1 and 118 DF, p-value: 4.121e-13
Ein Schätzwert für die Effektstärke \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Cocktails}^{2}\), in dem Fall also 0.389 - 0.361 = 0.028.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Cocktails erklärt werden kann, beträgt also 2.8 %.
\(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.389\) ist.
Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:<- lm(Motorradfahrer ~ Cocktails, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 184.4552 12.7524 14.464 <2e-16 *** Cocktails 0.2291 0.1252 1.831 0.0697 . --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 23.18 on 118 degrees of freedom Multiple R-squared: 0.02762, Adjusted R-squared: 0.01938 F-statistic: 3.351 on 1 and 118 DF, p-value: 0.06967
Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.389 - 0.028 = 0.361.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Cocktails hinweg nur durch die Flipflops erklärt werden kann, beträgt also 36.1 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Eiskugeln in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Eiskugeln, Flipflops\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Flipflops), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten3.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Flipflops), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.13372 -0.53842 0.04705 0.48653 2.74771 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -1.437e-15 7.713e-02 0.000 1.000000 scale(Eiskugeln) 2.679e-01 7.767e-02 3.449 0.000784 *** scale(Flipflops) 4.963e-01 7.767e-02 6.389 3.53e-09 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.8449 on 117 degrees of freedom Multiple R-squared: 0.2981, Adjusted R-squared: 0.2861 F-statistic: 24.84 on 2 and 117 DF, p-value: 1.018e-09
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.1527551 0.1527551 scale(Eiskugeln) 0.1140339 0.4216909 scale(Flipflops) 0.3424226 0.6500796
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.114 bis 0.422 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Eiskugeln um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.342 bis 0.65 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Eiskugeln konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.298, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0.1575172 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.4290163 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 15.8 bis 42.9 % der Gesamtvarianz der Motorradfahrer in der Population durch die Eiskugeln und die Flipflops zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Eiskugeln}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.298\) ist.
Der Schätzwert für \(\rho_{- Eiskugeln}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Eiskugeln:<- lm(Motorradfahrer ~ Flipflops, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 110.8459 11.5560 9.592 < 2e-16 *** Flipflops 0.6706 0.1140 5.882 3.86e-08 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 21.12 on 118 degrees of freedom Multiple R-squared: 0.2267, Adjusted R-squared: 0.2202 F-statistic: 34.6 on 1 and 118 DF, p-value: 3.864e-08
Ein Schätzwert für die Effektstärke \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Eiskugeln}^{2}\), in dem Fall also 0.298 - 0.227 = 0.071.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Eiskugeln erklärt werden kann, beträgt also 7.1 %.
\(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.298\) ist.
Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:<- lm(Motorradfahrer ~ Eiskugeln, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 134.0071 17.1662 7.806 2.65e-12 *** Eiskugeln 0.4373 0.1698 2.575 0.0113 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 23.37 on 118 degrees of freedom Multiple R-squared: 0.0532, Adjusted R-squared: 0.04518 F-statistic: 6.631 on 1 and 118 DF, p-value: 0.01126
Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.298 - 0.053 = 0.245.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Eiskugeln hinweg nur durch die Flipflops erklärt werden kann, beträgt also 24.5 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Bademeister erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Flipflops\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Bademeister) ~ scale(Freibadkarten) + scale(Flipflops), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten4.csv") Daten ## fit-Objekt speichern: <- lm(scale(Bademeister) ~ scale(Freibadkarten) + scale(Flipflops), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.8895 -0.6617 0.1225 0.6750 2.5393 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -3.986e-15 8.924e-02 0.000 1.0000 scale(Freibadkarten) 7.943e-02 8.972e-02 0.885 0.3778 scale(Flipflops) 2.286e-01 8.972e-02 2.548 0.0121 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.9776 on 117 degrees of freedom Multiple R-squared: 0.06033, Adjusted R-squared: 0.04427 F-statistic: 3.756 on 2 and 117 DF, p-value: 0.02624
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.17674209 0.1767421 scale(Freibadkarten) -0.09826028 0.2571212 scale(Flipflops) 0.05093520 0.4063167
Wir gehen davon aus, dass sich die Anzahl der Bademeister im Mittel um -0.098 bis 0.257 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Bademeister im Mittel um 0.051 bis 0.406 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.06, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.1549232 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 0 bis 15.5 % der Gesamtvarianz der Bademeister in der Population durch die Freibadkarten und die Flipflops zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.06\) ist.
Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:<- lm(Bademeister ~ Flipflops, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 114.4841 11.6496 9.827 <2e-16 *** Flipflops 0.3019 0.1163 2.596 0.0106 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 19.1 on 118 degrees of freedom Multiple R-squared: 0.05404, Adjusted R-squared: 0.04602 F-statistic: 6.741 on 1 and 118 DF, p-value: 0.01062
Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.06 - 0.054 = 0.006.
Der Anteil der Gesamtvarianz der Bademeister, der über die Flipflops hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 0.6 %.
\(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.06\) ist.
Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:<- lm(Bademeister ~ Freibadkarten, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 131.3534 13.3295 9.854 <2e-16 *** Freibadkarten 0.1288 0.1305 0.987 0.326 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 19.56 on 118 degrees of freedom Multiple R-squared: 0.008186, Adjusted R-squared: -0.0002188 F-statistic: 0.974 on 1 and 118 DF, p-value: 0.3257
Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.06 - 0.008 = 0.052.
Der Anteil der Gesamtvarianz der Bademeister, der über die Freibadkarten hinweg nur durch die Flipflops erklärt werden kann, beträgt also 5.2 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Eiskugeln in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Eiskugeln, Sonnencremetuben\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Sonnencremetuben), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten5.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Sonnencremetuben), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.64810 -0.67088 -0.01471 0.61527 2.15858 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -1.151e-15 8.726e-02 0.000 1.00000 scale(Eiskugeln) 1.969e-01 8.776e-02 2.244 0.02671 * scale(Sonnencremetuben) 2.402e-01 8.776e-02 2.737 0.00718 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.9559 on 117 degrees of freedom Multiple R-squared: 0.1016, Adjusted R-squared: 0.08625 F-statistic: 6.616 on 2 and 117 DF, p-value: 0.001896
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.17281699 0.1728170 scale(Eiskugeln) 0.02313858 0.3707368 scale(Sonnencremetuben) 0.06635715 0.4139554
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.023 bis 0.371 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Eiskugeln um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.066 bis 0.414 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Eiskugeln konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.102, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0.01606847 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.2130743 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 1.6 bis 21.3 % der Gesamtvarianz der Motorradfahrer in der Population durch die Eiskugeln und die Sonnencremetuben zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Eiskugeln}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.102\) ist.
Der Schätzwert für \(\rho_{- Eiskugeln}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Eiskugeln:<- lm(Motorradfahrer ~ Sonnencremetuben, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 125.9574 12.6264 9.976 < 2e-16 *** Sonnencremetuben 0.3499 0.1243 2.815 0.00571 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 20.65 on 118 degrees of freedom Multiple R-squared: 0.06294, Adjusted R-squared: 0.055 F-statistic: 7.925 on 1 and 118 DF, p-value: 0.005714
Ein Schätzwert für die Effektstärke \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Eiskugeln}^{2}\), in dem Fall also 0.102 - 0.063 = 0.039.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Eiskugeln erklärt werden kann, beträgt also 3.9 %.
\(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.102\) ist.
Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:<- lm(Motorradfahrer ~ Eiskugeln, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 130.9024 13.0835 10.005 <2e-16 *** Eiskugeln 0.3005 0.1288 2.333 0.0213 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 20.86 on 118 degrees of freedom Multiple R-squared: 0.0441, Adjusted R-squared: 0.036 F-statistic: 5.444 on 1 and 118 DF, p-value: 0.02133
Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.102 - 0.044 = 0.058.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Eiskugeln hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 5.8 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Sonnencremetuben in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Sonnencremetuben, Flipflops\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Sonnencremetuben) + scale(Flipflops), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten6.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Sonnencremetuben) + scale(Flipflops), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.5422 -0.6333 -0.1361 0.7689 2.2022 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.851e-15 8.981e-02 0.000 1.0000 scale(Sonnencremetuben) -8.413e-02 9.057e-02 -0.929 0.3549 scale(Flipflops) 2.108e-01 9.057e-02 2.327 0.0217 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.9839 on 117 degrees of freedom Multiple R-squared: 0.04826, Adjusted R-squared: 0.032 F-statistic: 2.967 on 2 and 117 DF, p-value: 0.05536
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.17787360 0.17787360 scale(Sonnencremetuben) -0.26349292 0.09524139 scale(Flipflops) 0.03139731 0.39013163
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.263 bis 0.095 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.031 bis 0.39 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.048, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.136338 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 0 bis 13.6 % der Gesamtvarianz der Motorradfahrer in der Population durch die Sonnencremetuben und die Flipflops zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Sonnencremetuben}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.048\) ist.
Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:<- lm(Motorradfahrer ~ Flipflops, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 89.0331 12.3023 7.237 5.03e-11 *** Flipflops 0.2765 0.1227 2.253 0.0261 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 18.94 on 118 degrees of freedom Multiple R-squared: 0.04125, Adjusted R-squared: 0.03312 F-statistic: 5.076 on 1 and 118 DF, p-value: 0.0261
Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.048 - 0.041 = 0.007.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 0.7 %.
\(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.048\) ist.
Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:<- lm(Motorradfahrer ~ Sonnencremetuben, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 124.84586 11.97704 10.424 <2e-16 *** Sonnencremetuben -0.08427 0.11927 -0.706 0.481 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 19.3 on 118 degrees of freedom Multiple R-squared: 0.004212, Adjusted R-squared: -0.004227 F-statistic: 0.4991 on 1 and 118 DF, p-value: 0.4813
Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.048 - 0.004 = 0.044.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Flipflops erklärt werden kann, beträgt also 4.4 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Flipflops\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Flipflops), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten7.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Flipflops), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.32016 -0.65681 -0.01781 0.69420 2.39574 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 9.930e-16 9.147e-02 0.000 1.000 scale(Freibadkarten) 6.345e-02 9.256e-02 0.686 0.494 scale(Flipflops) 1.022e-01 9.256e-02 1.104 0.272 Residual standard error: 1.002 on 117 degrees of freedom Multiple R-squared: 0.01287, Adjusted R-squared: -0.004003 F-statistic: 0.7627 on 2 and 117 DF, p-value: 0.4687
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.18115083 0.1811508 scale(Freibadkarten) -0.11985797 0.2467593 scale(Flipflops) -0.08111578 0.2855015
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.12 bis 0.247 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.081 bis 0.286 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.013, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.06924525 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 0 bis 6.9 % der Gesamtvarianz der Motorradfahrer in der Population durch die Freibadkarten und die Flipflops zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.013\) ist.
Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:<- lm(Motorradfahrer ~ Flipflops, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 141.2271 14.4977 9.741 <2e-16 *** Flipflops 0.1468 0.1426 1.030 0.305 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 22.42 on 118 degrees of freedom Multiple R-squared: 0.008906, Adjusted R-squared: 0.0005067 F-statistic: 1.06 on 1 and 118 DF, p-value: 0.3052
Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.013 - 0.009 = 0.004.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 0.4 %.
\(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.013\) ist.
Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:<- lm(Motorradfahrer ~ Freibadkarten, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 147.75292 15.06219 9.810 <2e-16 *** Freibadkarten 0.08067 0.14584 0.553 0.581 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 22.49 on 118 degrees of freedom Multiple R-squared: 0.002586, Adjusted R-squared: -0.005867 F-statistic: 0.3059 on 1 and 118 DF, p-value: 0.5812
Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.013 - 0.003 = 0.01.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Freibadkarten hinweg nur durch die Flipflops erklärt werden kann, beträgt also 1 %.
- Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Cocktails in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
Laden sie den Datensatz herunter und lesen Sie ihn als ObjektDaten
ein.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Cocktails, Sonnencremetuben\) in R und interpretieren Sie dieses.
HinweisFür den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion
scale()
z-standardisiert werden. Diese kann direkt in derlm
-Funktion angewandt werden:fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Sonnencremetuben), data = Daten)
LösungSchätzwerte:
library(multcomp) ## Daten einlesen: <- read.csv2("Daten8.csv") Daten ## fit-Objekt speichern: <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Sonnencremetuben), Daten) fit summary(fit)
Residuals: Min 1Q Median 3Q Max -2.35692 -0.58126 -0.08511 0.52751 2.49090 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -1.077e-15 9.125e-02 0.000 1.000 scale(Cocktails) 4.579e-03 9.174e-02 0.050 0.960 scale(Sonnencremetuben) 1.324e-01 9.174e-02 1.443 0.152 Residual standard error: 0.9996 on 117 degrees of freedom Multiple R-squared: 0.01762, Adjusted R-squared: 0.0008244 F-statistic: 1.049 on 2 and 117 DF, p-value: 0.3535
## KIs ausgeben: confint(fit)
2.5 % 97.5 % (Intercept) -0.18071477 0.1807148 scale(Cocktails) -0.17711549 0.1862744 scale(Sonnencremetuben) -0.04927027 0.3141196
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.177 bis 0.186 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Cocktails um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.
Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.049 bis 0.314 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Cocktails konstant bleibt.
Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.
HinweisFür das KI für \(\rho^{2}\) können Sie die Funktion
ci.R2()
aus dem MBESS package verwenden:ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße)
.Lösunglibrary(MBESS) ci.R2(0.018, p = 2, N = 120)
$Lower.Conf.Limit.R2 [1] 0 $Prob.Less.Lower [1] 0.025 $Upper.Conf.Limit.R2 [1] 0.08116234 $Prob.Greater.Upper [1] 0.025
Wir gehen davon aus, dass 0 bis 8.1 % der Gesamtvarianz der Motorradfahrer in der Population durch die Cocktails und die Sonnencremetuben zusammen erklärt werden können.
Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Cocktails}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.
Lösung\(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.018\) ist.
Der Schätzwert für \(\rho_{- Cocktails}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Cocktails:<- lm(Motorradfahrer ~ Sonnencremetuben, Daten) fit2 summary(fit2)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 125.1351 12.2312 10.231 <2e-16 *** Sonnencremetuben 0.1756 0.1208 1.454 0.149 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 19.93 on 118 degrees of freedom Multiple R-squared: 0.0176, Adjusted R-squared: 0.009271 F-statistic: 2.114 on 1 and 118 DF, p-value: 0.1487
Ein Schätzwert für die Effektstärke \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Cocktails}^{2}\), in dem Fall also 0.018 - 0.018 = 0.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Cocktails erklärt werden kann, beträgt also 0 %.
\(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)
Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.018\) ist.
Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:<- lm(Motorradfahrer ~ Cocktails, Daten) fit3 summary(fit3)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 141.34720 11.49318 12.298 <2e-16 *** Cocktails 0.01393 0.11523 0.121 0.904 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 20.11 on 118 degrees of freedom Multiple R-squared: 0.0001239, Adjusted R-squared: -0.00835 F-statistic: 0.01462 on 1 and 118 DF, p-value: 0.904
Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.018 - 0 = 0.018.
Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Cocktails hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 1.8 %.