length(prijs_in_euro)
[1] 464
summary(prijs_in_euro)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.23 13.95 26.79 27.84 41.09 55.97
sd(prijs_in_euro)
[1] 15.81255
Hieronder volgen een paar opgaven die een beeld geven van het soort vragen dat je op het tentamen kunt verwachten.
Deze voorbeelden bestrijken niet de gehele stof en alle leerdoelen, maar geven hopelijk een beeld van de manier waarop we de stof binnen Remindo kunnen toetsen.
Oefening 1 (Prijzen van producten)
De vector prijs_in_euro
bevat de prijs van een aselecte steekproef van producten die verkocht worden in een grote webwinkel. We analyseren de lijst met R:
length(prijs_in_euro)
[1] 464
summary(prijs_in_euro)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.23 13.95 26.79 27.84 41.09 55.97
sd(prijs_in_euro)
[1] 15.81255
Hoeveel producten hebben in deze steekproef een prijs tussen €13,95 en €41,09?
464
232
316
317
Je bent geïnteresseerd in de gemiddelde prijs van producten in deze webwinkel. Bereken een 95%-betrouwbaarheidsinterval voor dat gemiddelde. Maar daarbij gebruik van de gegevens hierboven, en van de gegevens hieronder. Je mag aannemen dat de prijzen in de winkel ongeveer normaal verdeeld zijn.
pt(0.95, df = 232)
[1] 0.8284496
qt(0.95, df = 464)
[1] 1.648144
qt(0.975, df = 463)
[1] 1.965101
pt(0.975, df = 232)
[1] 0.8347121
Geef je antwoord in tenminste 2 decimalen.
Ondergrens van het interval: …
Bovengrens van het interval: …
Oefening 2 (Risk)
Bij het bordspel Risk gooit de aanvallende speler met een rode dobbelsteen en de verdedigende speler met een blauwe. De aanvaller wint als het aantal ogen van de rode dobbelsteen groter is dan het aantal ogen van de blauwe dobbelsteen. (Bij een gelijk aantal ogen wint de verdedigende speler.)
Wat is de kans dat de aanvaller wint?
Antwoord: …
Oefening 3 (Gewicht)
Een huisarts weegt zijn patiënten elke keer dat hij ze op zijn spreekuur krijgt. Daarbij mogen ze hun kleren aanhouden. Door die kleren wordt mogelijk een meetfout geïntroduceerd. Welke?
Oefening 4 (Steekproefgemiddelde)
Variabele \(X\) is in een populatie (ongeveer) normaal verdeeld met gemiddelde \(\mu_X = 100\) en standaarddeviatie \(\sigma_X = 10\). We nemen een steekproef van \(n = 4\) eenheden.
Wat is de kans dat het steekproefgemiddelde \(\overline{X}\) groter is dan 110?
Oefening 5 (Schoolkeuze) In een studie wordt onderzocht wat het effect is van de kwaliteit van het onderwijs op een school (Quality Education
) op de leerprestaties (Academic_Performance
). Daarbij wordt het volgende causale diagram gebruikt:
graph TD Parental_Income --> School_Choice Parental_Income --> Neighborhood Neighborhood --> School_Choice Parental_Income --> Cognitive_Skills School_Choice --> Quality_Education Quality_Education --> Academic_Performance School_Choice --> Peer_Group Quality_Education --> Motivation Peer_Group --> Motivation Cognitive_Skills --> Academic_Performance Motivation --> Academic_Performance
Welke van de volgende variabelen is dan een confounder?
De onderzoekers merken op dat er een sterke associatie is tussen de school (School_choice
) en motivatie (Motivation
). Kunnen we daaruit concluderen dat de kwaliteit van het onderwijs (Quality_Education
) blijkbaar een groot effect heeft op de motivatie van studenten? Motiveer je antwoord!
Antwoord: …
Oefening 6 (Stofwisselingssnelheid en lichaamsgewicht bij zoogdieren)
De stofwisselingssnelheid van zoogdieren hangt sterk samen met hun gemiddelde lichaamsgewicht. We gebruiken de dataset AnimalTraits om dit te onderzoeken.
We plotten eerst de logaritme van de stofwisselingssnelheid (metabolic rate) in Watt tegen de logaritme van gewicht (mass) in kg. (We gebruiken de functie log()
, die de log met basisgetal \(e\) uitvoert, oftewel, de natuurlijke logaritme.)
$log.body.mass <- log(AnimalTraits$body.mass)
AnimalTraits$log.metabolic.rate <- log(AnimalTraits$metabolic.rate)
AnimalTraitsplot(AnimalTraits$log.body.mass, AnimalTraits$log.metabolic.rate)
We willen dit verband graag beschrijven met een rechte lijn. Daarom voeren we deze code uit:
<- lm(log.metabolic.rate ~ log.body.mass, data = AnimalTraits)
resultaat summary(resultaat)
Call:
lm(formula = log.metabolic.rate ~ log.body.mass, data = AnimalTraits)
Residuals:
Min 1Q Median 3Q Max
-1.30117 -0.24166 -0.02736 0.24073 1.12780
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.09765 0.04129 26.58 <2e-16 ***
log.body.mass 0.67073 0.01590 42.18 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.4217 on 175 degrees of freedom
Multiple R-squared: 0.9104, Adjusted R-squared: 0.9099
F-statistic: 1779 on 1 and 175 DF, p-value: < 2.2e-16
Wat is het startgetal van de regressielijn tussen de log van stofwisselingssnelheid en de log van lichaamsgewicht?
Antwoord: …
Wat is de richtingscoëfficiënt van die regressielijn?
Antwoord: …
Een bosduivel (ook wel zwarte slingeraap of kwatta genoemd) weegt gemiddeld 5,1 kg. Voorspel de stofwisselingssnelheid in W. Geef het antwoord in tenminste 3 decimalen.
Antwoord: …
Gebruik de volgende gegevens om de correlatiecoëfficiënt tussen log.metabolic.rate
en log.body.mass
te berekenen:
sd(AnimalTraits$log.body.mass)
[1] 1.999145
sd(AnimalTraits$log.metabolic.rate)
[1] 1.405284
Geef het antwoord in tenminste 3 decimalen.
\(r = \ldots\)