Stochastiek 2: statistiek

Stochastics 2: statistics

6 EC

Semester 1, periode 1, 2

51222STO6Y

Eigenaar Bachelor Wiskunde
Coördinator prof. dr. J.M. Mooij
Onderdeel van Bachelor Wiskunde, jaar 2Dubbele bachelor Wiskunde en Informatica, jaar 2Bachelor Bèta-gamma, major Wiskunde, jaar 3

Studiewijzer 2021/2022

Globale inhoud

In de mathematische statistiek vatten we geobserveerde data op als realizaties van stochastische variabelen. Een statistisch model is een collectie kansverdelingen die we beschouwen als mogelijke verdelingen van de waarnemingen. Het doel van een statistische procedure is om op basis van de waarnemingen een uitspraak te doen over welke verdeling in het model de data gegenereerd heeft.
Na het opzetten van dit wiskundige raamwerk voor het bestuderen van statistische problemen wordt in dit college een aantal statistische procedures behandeld: het schatten van parameters, het toetsen van hypotheses en het maken van betrouwbaarheidsintervallen. Er worden klassieke voorbeelden behandeld en wiskundige theorie om de prestaties van statistische procedures te beoordelen en te vergelijken.

Studiemateriaal

Literatuur

  • F. Bijma, M. Jonker, A. van der Vaart, 'Inleiding in de Statistiek', Epsilon Uitgaven, Utrecht, 2016.

Leerdoelen

  • De student kan gegeven een experiment een statistisch model formuleren
  • De student kent de definities van het steekproefgemiddelde, steekproefvariantie, steekproefcorrelatie, correlatiecoëfficiënt, en kwantielfuncties
  • De student kan bij een gegeven dataset een histogram, een QQ-plot en een auto-correlatieplot maken
  • De student kent de definities van de maximum-likelihoodschatter en de momentenschatter, en kan gegeven een steekproef uit een bepaalde kansverdeling deze bepalen
  • De student kent de Bayesiaanse handelswijze, de definities van de posterior en de Bayes schatter, en kan gegeven een prior en statistisch model de posterior en de Bayes schatter bepalen
  • De student kent de definities van voldoende en volledige statistieken, de factorisatiestelling, en kan voor een gegeven statistisch model een voldoende en volledige statistiek bepalen
  • De student kent de definitie van een exponentiële familie en kan hiermee een voldoende en volledige statistiek bepalen
  • De student kan UMVZ-schatters construeren aan de hand van voldoende en volledige statistieken
  • De student kan voor een gegeven steekproef de Fisher-informatie en de Cramér-Rao ondergrens bepalen, en hiermee een UMVZ-schatter herkennen
  • De student kent de definities van de volgende begrippen m.b.t. statistische toetsen: nulhypothese, alternatieve hypothese, fouten van de eerste en tweede soort, toetsingsgrootheid, kritiek gebied, onderscheidend vermogen, onbetrouwbaarheid, en kan bij een gegeven probleem een statistische toets construeren bestaande uit bovenstaande begrippen bij een gegeven onbetrouwbaarheidsdrempel
  • De student kan van een gegeven toets het onderscheidend vermogen en de onbetrouwbaarheid bepalen
  • De student kan overschrijdingskansen bepalen en hiermee statistische toetsen uitvoeren
  • De student kent de definitie van de chi-kwadraat- en de t-verdeling en weet welke bijzondere grootheden deze verdelingen bezitten
  • De student kan de eensteekproef t-toets, de tweesteekproeven t-toets voor zowel gepaarde als ongepaarde waarnemingen, de Kolmogorov-Smirnovtoets uitvoeren
  • De student kan de likelihood-ratio statistiek bepalen voor een gegeven steekproef en hiermee de likelihood-ratiotoets uitvoeren
  • De student kan uniform meest onderscheidende toetsen bepalen met het Lemma van Neyman-Pearson
  • De student kan op basis van een pivot betrouwbaarheidsinterval construeren voor een gegeven statistisch model
  • De student kan op basis van bijna-pivots (i.h.b. de maximum-likelihoodschatter) een benaderend betrouwbaarheidsinterval construeren
  • De student kent de link tussen statistische toetsen en betrouwbaarheidsgebieden
  • De student kan likelihood-ratiogebieden als benaderend betrouwbaarheidsgebieden construeren
  • De student is bekend met enkelvoudige regressie en de OLS (ordinary least squares / kleinste-kwadraten) schatter

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • Zelfstudie

Verdeling leeractiviteiten

Activiteit

Aantal uur

Hoorcollege

28

Tentamen

3

Tussentoets

2

Werkcollege

28

Zelfstudie

106

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Van elke student wordt actieve deelname verwacht aan het onderdeel waarvoor hij/zij staat ingeschreven.
  • Als een student door persoonlijke omstandigheden niet aanwezig kan zijn bij een verplicht onderdeel van het programma, dient hij/zij dit zo snel mogelijk schriftelijk te melden bij de betreffende docent en de studieadviseur.
  • Het is niet toegestaan om verplichte onderdelen van een onderdeel te missen als er geen sprake is van overmacht.
  • Bij kwalitatief of kwantitatief onvoldoende deelname, kan de examinator de student uitsluiten van verdere deelname aan het onderdeel of een gedeelte daarvan. Voorwaarden voor voldoende deelname worden van te voren vastgelegd in de studiewijzer en op Canvas.
  • Bij alle onderwijseenheden van jaar 1 en 2 is een student verplicht bij minimaal 80% van de werkcolleges en tutoraten aanwezig te zijn. Bovendien moet worden deelgenomen aan eventuele tussentoetsen en verplicht gesteld huiswerk. Als niet aan deze verplichting is voldaan, wordt de student uitgesloten voor de herkansing van de onderwijseenheid. In geval van persoonlijke omstandigheden, zoals in OER-A Artikel A-6.4 omschreven, wordt in overleg met de studieadviseur een afwijkende regeling voorgesteld.

Aanvullende eisen voor dit vak:

Aanwezigheid bij de werkcolleges is verplicht. Als je niet bij minstens 80% van de werkcolleges aanwezig bent geweest dan vervalt je recht op het hertentamen, zoals vermeldt in het OER-B artikel 4.9 lid 2. (Het zou echter kunnen dat deze regel niet   zal worden gehandhaafd).

Toetsing

Onderdeel en weging Details

Eindcijfer

10%

Huiswerk

Bonus

40%

Deeltoets

60%

Tentamen

Eindcijfer na herkansing

1 (100%)

Hertentamen

Inzage toetsing

De manier van inzage wordt via de digitale leeromgeving gecommuniceerd.

Het huiswerk zal op het werkcollege worden besproken.

Opdrachten

De studenten maken wekelijks huiswerkopdrachten waarin ze oefenen met de stof. Ze kunnen hun antwoorden inleveren bij de werkcollegeassistenten, en die kijken een gedeelte van de opdrachten na. Welke van de huiswerkopdrachten worden nagekeken is van tevoren niet bekend bij de studenten (maar wel voor alle studenten gelijk). Het gemiddelde cijfer hiervoor telt als maximaal 1 bonuspunt mee in het eindcijfer.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

Voorlopige planning. Wijzigingen voorbehouden.

Let op! Er zijn drie edities van het boek in omloop. In H4 zijn de opgavenummers in de 2013 editie verschillend van de 2016 editie en 2018 editie. De opgavenummers van de 2013 editie staan tussen haakjes.

Weeknummer Onderwerpen Studiestof
(onderdelen met een * overslaan)
Opgaven (* zal niet worden nagekeken)
1 Elementen uit de kansrekening, statistische modellen Appendix A, H1 A.8, A.10, A.12, A.13, 1.1, 1.2, 1.3
2 Verdelingsonderzoek H2 2.1, 2.2, 2.5, 2.8 i+ii+iii*+iv*, 2.11
3 Schatters, mean square error, maximum-likelihoodschatters §3.1, §3.2, §3.3 3.1, 3.2, 3.3, 3.5, 3.8, 3.9, 3.10
4 Maximum-likelihoodschatters, momentenschatters en Bayes schatters §3.3, §3.4, §3.5 3.12*, 3.14, 3.16, 3.20*, 3.23, 3.25, 3.33, 3.39
5 Bayes-schatters, voldoende en volledige statistieken §3.5, §6.1, 6.2, §6.3.0 3.37*, 3.40, 6.1, 6.2*, 6.4, 6.7*
6 UMVZ-schatters, Cramer-Rao ondergrenzen §6.3.1, §6.3.2, Lemma 5.10

6.13, 6.14*, 6.18*, 6.22, 6.26*, 6.28*, 6.29

7 Uitloop/tussentoets voorbereiden    
8 Tussentoets H1, H2, H3, §6.1, §6.2, §6.3, Lemma 5.10, A.7  (onderdelen met een * overslaan)  
9 Toetsingsproblemen, kritiek gebied, onbetrouwbaarheid §4.1 t/m §4.3.1 4.1*, 4.2, 4.4*, 4.7*, 4.8(i, ii, iii)
10 Overschrijdingskansen, t-toetsen §4.3.2 t/m §4.6.3 4.9, 4.11, 4.12(i)*, 4.17*, 4.22* (), 4.23* (4.22), 4.36 (4.35)
11 Kolmogorov-Smirnovtoets, likelihood-ratiotoetsen, Lemma van Neyman-Pearson §4.6.4, §4.7, §6.4 4.40 (4.38), 4.45* (4.41), 4.46* (4.42), 4.47* (4.43), 4.50 (4.46), 6.32(i)
12 Betrouwbaarheidsintervallen, pivots, bijna-pivots §5.1 t/m 5.4 5.3, 5.4*, 5.7, 5.13*, 5.21*
13 Relatie tussen toetsen en betrouwbaarheidsgebieden, likelihood-ratiogebieden §5.5, 5.6 5.16*, 5.17, 5.18*, 5.22*
14 Lineaire regressie §7.1, §7.2.1 7.4*, 7.5*, 7.8
15 Uitloop/tussentoets voorbereiden    
16 Tentamen Behandelde paragrafen (zie boven) van H1 t/m H7 en A.7 (onderdelen met een * overslaan)  

 

Rooster

Het rooster van dit vak is in te zien op DataNose.

Honoursinformatie

Op dit vak is een honoursuitbreiding mogelijk.

Aanvullende informatie

Vanwege de maatregelen in verband met covid kan het zijn dat er aanpassingen volgen op de inhoud van deze studiewijzer (in het bijzonder wat betreft hoe het eindcijfer tot stand zal komen). Dit zal worden aangekondigd via canvas.

Contactinformatie

Coördinator

  • prof. dr. J.M. Mooij

Docenten

  • prof. dr. J.M. Mooij
  • Thomas Loots
  • Hidde Fokkema