Studiewijzer 2017/2018

Globale inhoud

In de mathematische statistiek vatten we geobserveerde data op als realizaties van stochastische variabelen. Een statistisch model is een collectie kansverdelingen die we beschouwen als mogelijke verdelingen van de waarnemingen. Het doel van een statistische procedure is om op basis van de waarnemingen een uitspraak te doen over welke verdeling in het model de data gegenereerd heeft.
Na het opzetten van dit wiskundige raamwerk voor het bestuderen van statistische problemen wordt in dit college een aantal statistische procedures behandeld: het schatten van parameters, het toetsen van hypotheses en het maken van betrouwbaarheidsintervallen. Er worden klassieke voorbeelden behandeld en wiskundige theorie om de prestaties van statistische procedures te beoordelen en te vergelijken.

Studiemateriaal

Literatuur

  • F. Bijma, M. Jonker, A. van der Vaart, 'Inleiding in de Statistiek', Epsilon Uitgaven, Utrecht, 2016.

  • Handout: Asymptotisch gedrag van de Maximum Likelihood-schatter.

  • Handout: Asymptotisch gedrag van de a-posteriori verdeling: BvM.

Leerdoelen

Aan het eind van het vak kent/kan de student:

  • gegeven een experiment een statistisch model formuleren
  • de definities van het steekproefgemiddelde, steekproefvariantie, steekproefcorrelatie, correlatiecoëfficiënt, en kwantielfuncties
  • bij een gegeven dataset een histogram, een QQ-plot en een auto-correlatieplot maken
  • de definities van de maximum-likelihoodschatter en de momentenschatter, en kan gegeven een steekproef uit een bepaalde kansverdeling deze bepalen
  • de Bayesiaanse handelswijze, de definities van de posterior en de Bayes schatter, en kan gegeven een prior en statistisch model de posterior en de Bayes schatter bepalen
  • de definities van voldoende en volledige statistieken, de factorisatiestelling, en kan voor een gegeven statistisch model een voldoende en volledige statistiek bepalen
  • de definitie van een exponentiële familie en kan hiermee een voldoende en volledige statistiek bepalen
  • UMVZ-schatters construeren aan de hand van voldoende en volledige statistieken
  • voor een gegeven steekproef de Fisher-informatie en de Cramér-Rao ondergrens bepalen, en hiermee een UMVZ-schatter bepalen
  • de definities van de volgende begrippen m.b.t. statistische toetsen: nulhypothese, alternatieve hypothese, fouten van de eerste en tweede soort, toetsingsgrootheid, kritiek gebied, onderscheidend vermogen, onbetrouwbaarheid, en kan bij een gegeven probleem een statistische toets construeren bestaande uit bovenstaande begrippen bij een gegeven onbetrouwbaarheidsdrempel
  • van een gegeven toets het onderscheidend vermogen en de onbetrouwbaarheid bepalen
  • overschrijdingskansen bepalen en hiermee statistische toetsen uitvoeren
  • de definitie van de chi-kwadraat- en de t-verdeling en weet welke bijzondere grootheden deze verdelingen bezitten
  • de eensteekproef t-toets, de tweesteekproeven t-toets voor zowel gepaarde als ongepaarde waarnemingen, de Kolmogorov-Smirnovtoets uitvoeren
  • de likelihood-ratio statistiek bepalen voor een gegeven steekproef en hiermee de likelihood-ratiotoets uitvoeren
  • uniform meest onderscheidende toetsen bepalen met het Lemma van Neyman-Pearson
  • op basis van een pivot betrouwbaarheidsinterval construeren voor een gegeven statistisch model
  • op basis van bijna-pivots (i.h.b. de maximum-likelihoodschatter) een benaderend betrouwbaarheidsinterval construeren
  • de link tussen statistische toetsen en betrouwbaarheidsgebieden
  • likelihood-ratiogebieden als benaderend betrouwbaarheidsgebieden construeren
  • de definitie van een credible set en de stelling van Bernstein-von Mises

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • (Computer)practicum

Verdeling leeractiviteiten

Activiteit

Aantal uur

Hoorcollege

28

Tentamen

3

Tussentoets

3

Werkcollege

28

Zelfstudie

106

Academische vaardigheden

De studenten maken enkele opdrachten met de programmeertaal R. Deze opdrachten zijn onderdeel van de drie inleveropdrachten, zie Toetsing en Opdrachten.

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Van elke student wordt actieve deelname verwacht aan het onderdeel waarvoor hij/zij staat ingeschreven.
  • Als een student door overmacht niet aanwezig kan zijn bij een verplicht onderdeel van het onderdeel, dient hij/zij dit zo snel mogelijk schriftelijk te melden bij de betreffende docent. De docent kan dan, eventueel na overleg met de studieadviseur, besluiten om de student een vervangende opdracht op te leggen.
  • Het is niet toegestaan om verplichte onderdelen van een onderdeel te missen als er geen sprake is van overmacht.
  • Bij kwalitatief of kwantitatief onvoldoende deelname, kan de examinator de student uitsluiten van verdere deelname aan het onderdeel of een gedeelte daarvan.
  • Bij alle onderwijseenheden van jaar 1 en 2 is een student verplicht bij minimaal 80% van de werkcolleges en tutoraten aanwezig te zijn. Bovendien moet worden deelgenomen aan eventuele tussentoetsen en verplicht gesteld huiswerk. Als niet aan deze verplichting is voldaan, wordt de student uitgesloten voor de herkansing van de onderwijseenheid.

Aanvullende eisen voor dit vak:

Aanwezigheid bij de werkcolleges is verplicht. Als je niet bij minstens 80% van de werkcolleges aanwezig bent geweest dan vervalt je recht op het hertentamen, zoals vermeldt in het OER-B artikel 4.9 lid 2.

Toetsing

Onderdeel en weging Details

Eindcijfer

30%

Tussentoets

50%

Tentamen

20%

Inleveropgaven

Gedurende het vak wordt driemaal een set inleveropgaven opgegeven. Deze opgaven bestaan uit reguliere vraagstukken (zoals op het werkcollege) en opgaven waarbij de studenten aan de slag gaan met de programmeertaal R. Het gemiddelde van deze drie sets telt voor 20% mee in het eindcijfer.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: www.uva.nl/plagiaat

Weekplanning

Weeknummer Onderwerpen Studiestof
(onderdelen met een * overslaan)
1 Elementen uit de kansrekening, statistische modellen Appendix A, H1
2 Verdelingsonderzoek H2
3 Schatters, mean square error, maximum-likelihoddschatters Secties 3.1, 3.2 ,3.3
4 Maximum-likelihoddschatters, momentenschatters en Bayes schatters Secties 3.3, 3.4 ,3.5
5 Bayes-schatters, voldoende en volledige statistieken Secties 3.5, 6.1 t/m 6.3.1
6 UMVZ-schatters, Cramer-Rao ondergrenzen Sectie 6.3.2, handout MLS
7 Toetsingsproblemen, kritiek gebied, onbetrouwbaarheid Secties 4.1 t/m 4.3.1
8 Tussentoets H1, H2, H3, secties 4.1 t/m 4.3.1 6.1, 6.2, 6.3, A.7  (onderdelen met een * overslaan)
9 Overschrijdingskansen, t-toetsen Secties 4.3.2 t/m 4.6.3
10 Kolmogorov-Smirnovtoets, likelihood-ratiotoetsen, Lemma van Neyman-Pearson Secties 4.6.4, 4.7, 6.4
11 Betrouwbaarheidsintervallen, pivots, bijna-pivots Secties 5.1 t/m 5.4
12 Geen college  
13 Relatie tussen toetsen en betrouwbaarheidsgebieden, likelihood-ratiogebieden Secties 5.5, 5.6
14 Geen college   
15  Credible sets en Bernstein-von Mises Sectie 5.7, handout BvM
16 Tentamen H1, H2, secties t/m H6, sectie A.7 (onderdelen met een * overslaan)

 

Rooster

Het rooster van dit vak is in te zien op DataNose.

Honoursinformatie

Op dit vak is geen honoursuitbreiding mogelijk.

Contactinformatie

Coördinator

  • prof. dr. J.H. van Zanten

Docenten

  • prof. dr. J.H. van Zanten
  • G.A.E. Jager BSc
  • Femke Madsen BSc
  • Mariska Heemskerk MSc