Voorbeeldopgaven

Hieronder volgen een paar opgaven die een beeld geven van het soort vragen dat je op het tentamen kunt verwachten.

Deze voorbeelden bestrijken niet de gehele stof en alle leerdoelen, maar geven hopelijk een beeld van de manier waarop we de stof binnen Remindo kunnen toetsen.

Oefening 1 (Prijzen van producten)

De vector prijs_in_euro bevat de prijs van een aselecte steekproef van producten die verkocht worden in een grote webwinkel. We analyseren de lijst met R:

length(prijs_in_euro)
[1] 464
summary(prijs_in_euro)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   0.23   13.95   26.79   27.84   41.09   55.97 
sd(prijs_in_euro)
[1] 15.81255
  1. Hoeveel producten hebben in deze steekproef een prijs tussen €13,95 en €41,09?

    1. 464

    2. 232

    3. 316

    4. 317

  2. Je bent geïnteresseerd in de gemiddelde prijs van producten in deze webwinkel. Bereken een 95%-betrouwbaarheidsinterval voor dat gemiddelde. Maar daarbij gebruik van de gegevens hierboven, en van de gegevens hieronder. Je mag aannemen dat de prijzen in de winkel ongeveer normaal verdeeld zijn.

    pt(0.95, df = 232)
    [1] 0.8284496
    qt(0.95, df = 464)
    [1] 1.648144
    qt(0.975, df = 463)
    [1] 1.965101
    pt(0.975, df = 232)
    [1] 0.8347121

    Geef je antwoord in tenminste 2 decimalen.

    Ondergrens van het interval: …

    Bovengrens van het interval: …

  1. De waarden €13,95 en €41,09 zijn precies het eerste en het derde kwartiel, zoals je aan de uitvoer kunt zien. Dat wil zeggen dat 50% van de gegevens binnen die grenzen valt. Dat is de helft van 464 producten, dus 232.

  2. Gegeven is \(s = 15{,}81\), \(\overline{X} = 27{,}84\), \(n = 464\). De kritieke waarde \(t_{0{,}05(2)n-1}\) is gegeven door qt(0.975, df = 463), dus 1,965. Daarmee kun je de formule invullen:

    Ondergrens: \(27{,}84 - 1{,}965 \times 15{,}81/\sqrt{464} = 26{,}40.\)

    Bovengrens: \(27{,}84 + 1{,}965 \times 15{,}81/\sqrt{464} = 29{,}28.\)

Oefening 2 (Risk)

Bij het bordspel Risk gooit de aanvallende speler met een rode dobbelsteen en de verdedigende speler met een blauwe. De aanvaller wint als het aantal ogen van de rode dobbelsteen groter is dan het aantal ogen van de blauwe dobbelsteen. (Bij een gelijk aantal ogen wint de verdedigende speler.)

Wat is de kans dat de aanvaller wint?

Antwoord: …

Het is redelijk aan te nemen dat de uitkomsten van beide dobbelstenen onafhankelijk zijn. Dan is iedere combinatie van uitkomsten even waarschijnlijk.

De figuur hieronder geeft de kansruimte. Oranje punten geven alle uitkomsten aan waarbij de aanvaller wint. Dat zijn 15 uitkomsten uit 36, en dus is de kans \(\textrm{Pr}\!\left[\text{aanvaller wint}\right]=15/36\).

Oefening 3 (Gewicht)

Een huisarts weegt zijn patiënten elke keer dat hij ze op zijn spreekuur krijgt. Daarbij mogen ze hun kleren aanhouden. Door die kleren wordt mogelijk een meetfout geïntroduceerd. Welke?

  1. Een toevallige fout.
  2. Een systematische fout.
  3. Een toevallige fout en een systematische fout.
  4. Geen van beide.

Het antwoorde is C. De kleding zorgt ervoor dat de meting altijd te hoog uitvalt; dat is een systematische fout. maar daarnaast verschilt het gewicht van de kleding per meting, en dus is er ook een toevallige fout.

Oefening 4 (Steekproefgemiddelde)

Variabele \(X\) is in een populatie (ongeveer) normaal verdeeld met gemiddelde \(\mu_X = 100\) en standaarddeviatie \(\sigma_X = 10\). We nemen een steekproef van \(n = 4\) eenheden.

Wat is de kans dat het steekproefgemiddelde \(\overline{X}\) groter is dan 110?

  1. Ongeveer 0,046.
  2. Ongeveer 0,023.
  3. Ongeveer 0,954.
  4. Ongeveer 0,683.

Het juiste antwoord is B.

Als \(X\) normaal verdeeld is met gemiddelde \(\mu_X = 100\) en standaarddeviatie \(\sigma_X = 10\), dan is \(\overline{X}\) ook normaal verdeeld, met gemiddelde \(\mu_X\) en een standaarddeviatie van \(\sigma_\overline{X} = \sigma_X / \sqrt{n} = 5\).

Dat wil zeggen dat 110 twee keer \(\sigma_\overline{X}\) boven het gemiddelde ligt. De vuistregel zegt dat de kans op een waarneming die meer dan twee standaarddeviaties afwijkt van het gemiddelde gelijk is aan \(1 - 0{,}954 = 0{,}046\). Maar omdat we alleen de kans op \(\overline{X} > 110\) willen meenemen (de rechterstaart), en niet de kans op \(\overline{X} < 90\) (de linkerstaart), moeten we die kans door twee delen. Het resultaat is 0,046/2 = 0,023.

Oefening 5 (Schoolkeuze) In een studie wordt onderzocht wat het effect is van de kwaliteit van het onderwijs op een school (Quality Education) op de leerprestaties (Academic_Performance). Daarbij wordt het volgende causale diagram gebruikt:

graph TD

Parental_Income --> School_Choice
Parental_Income --> Neighborhood
Neighborhood --> School_Choice
Parental_Income --> Cognitive_Skills
School_Choice --> Quality_Education
Quality_Education --> Academic_Performance
School_Choice --> Peer_Group
Quality_Education --> Motivation
Peer_Group --> Motivation
Cognitive_Skills --> Academic_Performance
Motivation --> Academic_Performance

  1. Welke van de volgende variabelen is dan een confounder?

  2. De onderzoekers merken op dat er een sterke associatie is tussen de school (School_choice) en motivatie (Motivation). Kunnen we daaruit concluderen dat de kwaliteit van het onderwijs (Quality_Education) blijkbaar een groot effect heeft op de motivatie van studenten? Motiveer je antwoord!

    Antwoord: …

  1. Alleen School_Choice, want die variabele is een oorzaak voor beide variabelen.

  2. Nee, want het effect van School_Choice op Motivation kan ook komen door het effect van School_choice op Peer_Group. Het hoeft dus niet zo te zijn dat Quality_Education een grote rol speelt in het effect van School_Choice op Motivation.

Oefening 6 (Stofwisselingssnelheid en lichaamsgewicht bij zoogdieren)

De stofwisselingssnelheid van zoogdieren hangt sterk samen met hun gemiddelde lichaamsgewicht. We gebruiken de dataset AnimalTraits om dit te onderzoeken.

We plotten eerst de logaritme van de stofwisselingssnelheid (metabolic rate) in Watt tegen de logaritme van gewicht (mass) in kg. (We gebruiken de functie log(), die de log met basisgetal \(e\) uitvoert, oftewel, de natuurlijke logaritme.)

AnimalTraits$log.body.mass <- log(AnimalTraits$body.mass)
AnimalTraits$log.metabolic.rate <- log(AnimalTraits$metabolic.rate)
plot(AnimalTraits$log.body.mass, AnimalTraits$log.metabolic.rate)

We willen dit verband graag beschrijven met een rechte lijn. Daarom voeren we deze code uit:

resultaat <- lm(log.metabolic.rate ~ log.body.mass, data = AnimalTraits)
summary(resultaat)

Call:
lm(formula = log.metabolic.rate ~ log.body.mass, data = AnimalTraits)

Residuals:
     Min       1Q   Median       3Q      Max 
-1.30117 -0.24166 -0.02736  0.24073  1.12780 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)    1.09765    0.04129   26.58   <2e-16 ***
log.body.mass  0.67073    0.01590   42.18   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.4217 on 175 degrees of freedom
Multiple R-squared:  0.9104,    Adjusted R-squared:  0.9099 
F-statistic:  1779 on 1 and 175 DF,  p-value: < 2.2e-16
  1. Wat is het startgetal van de regressielijn tussen de log van stofwisselingssnelheid en de log van lichaamsgewicht?

    Antwoord: …

  2. Wat is de richtingscoëfficiënt van die regressielijn?

    Antwoord: …

  3. Een bosduivel (ook wel zwarte slingeraap of kwatta genoemd) weegt gemiddeld 5,1 kg. Voorspel de stofwisselingssnelheid in W. Geef het antwoord in tenminste 3 decimalen.

    Antwoord: …

  4. Gebruik de volgende gegevens om de correlatiecoëfficiënt tussen log.metabolic.rate en log.body.mass te berekenen:

    sd(AnimalTraits$log.body.mass)
    [1] 1.999145
    sd(AnimalTraits$log.metabolic.rate)
    [1] 1.405284

    Geef het antwoord in tenminste 3 decimalen.

    \(r = \ldots\)

  1. Aflezen uit de tabel: \(a = 1{,}098\).

  2. Aflezen uit de tabel: \(b = 0{,}671\).

  3. Als \(X = 5{,}1\textrm{\,kg}\), dan is \(\log(X) = 1{,}629\). De regressielijn zegt dan:

    \(\log(Y) = 1{,}098 + 0{,}671 \times 1{,}629241 = 2{,}190.\)

    Hieruit volgt dat:
    \(Y = \text{e}^{\log(Y)} = \text{e}^{2{,}190} = 8{,}939\textrm{\,W}.\)

  4. Gebruik dat \(r = \left(s_X / s_Y\right) b = (1{,}999/1{,}405)\times 0{,}671 = 0{,}954\).