Studiewijzer 2018/2019
Globale inhoud
In de mathematische statistiek vatten we geobserveerde data op als realizaties van stochastische variabelen. Een statistisch model is een collectie kansverdelingen die we beschouwen als mogelijke verdelingen van de waarnemingen. Het doel van een statistische procedure is om op basis van de waarnemingen een uitspraak te doen over welke verdeling in het model de data gegenereerd heeft.
Na het opzetten van dit wiskundige raamwerk voor het bestuderen van statistische problemen wordt in dit college een aantal statistische procedures behandeld: het schatten van parameters, het toetsen van hypotheses en het maken van betrouwbaarheidsintervallen. Er worden klassieke voorbeelden behandeld en wiskundige theorie om de prestaties van statistische procedures te beoordelen en te vergelijken.
Studiemateriaal
Literatuur
F. Bijma, M. Jonker, A. van der Vaart, 'Inleiding in de Statistiek', Epsilon Uitgaven, Utrecht, 2016.
Leerdoelen
Aan het eind van het vak kent/kan de student:
- gegeven een experiment een statistisch model formuleren
- de definities van het steekproefgemiddelde, steekproefvariantie, steekproefcorrelatie, correlatiecoëfficiënt, en kwantielfuncties
- bij een gegeven dataset een histogram, een QQ-plot en een auto-correlatieplot maken
- de definities van de maximum-likelihoodschatter en de momentenschatter, en kan gegeven een steekproef uit een bepaalde kansverdeling deze bepalen
- de Bayesiaanse handelswijze, de definities van de posterior en de Bayes schatter, en kan gegeven een prior en statistisch model de posterior en de Bayes schatter bepalen
- de definities van voldoende en volledige statistieken, de factorisatiestelling, en kan voor een gegeven statistisch model een voldoende en volledige statistiek bepalen
- de definitie van een exponentiële familie en kan hiermee een voldoende en volledige statistiek bepalen
- UMVZ-schatters construeren aan de hand van voldoende en volledige statistieken
- voor een gegeven steekproef de Fisher-informatie en de Cramér-Rao ondergrens bepalen, en hiermee een UMVZ-schatter bepalen
- de definities van de volgende begrippen m.b.t. statistische toetsen: nulhypothese, alternatieve hypothese, fouten van de eerste en tweede soort, toetsingsgrootheid, kritiek gebied, onderscheidend vermogen, onbetrouwbaarheid, en kan bij een gegeven probleem een statistische toets construeren bestaande uit bovenstaande begrippen bij een gegeven onbetrouwbaarheidsdrempel
- van een gegeven toets het onderscheidend vermogen en de onbetrouwbaarheid bepalen
- overschrijdingskansen bepalen en hiermee statistische toetsen uitvoeren
- de definitie van de chi-kwadraat- en de t-verdeling en weet welke bijzondere grootheden deze verdelingen bezitten
- de eensteekproef t-toets, de tweesteekproeven t-toets voor zowel gepaarde als ongepaarde waarnemingen, de Kolmogorov-Smirnovtoets uitvoeren
- de likelihood-ratio statistiek bepalen voor een gegeven steekproef en hiermee de likelihood-ratiotoets uitvoeren
- uniform meest onderscheidende toetsen bepalen met het Lemma van Neyman-Pearson
- op basis van een pivot betrouwbaarheidsinterval construeren voor een gegeven statistisch model
- op basis van bijna-pivots (i.h.b. de maximum-likelihoodschatter) een benaderend betrouwbaarheidsinterval construeren
- de link tussen statistische toetsen en betrouwbaarheidsgebieden
- likelihood-ratiogebieden als benaderend betrouwbaarheidsgebieden construeren
- de definitie van een credible set en de stelling van Bernstein-von Mises
Onderwijsvormen
- Hoorcollege
- Werkcollege
- (Computer)practicum
Verdeling leeractiviteiten
Activiteit | Aantal uur |
Hoorcollege | 28 |
Tentamen | 3 |
Tussentoets | 3 |
Werkcollege | 28 |
Zelfstudie | 106 |
Academische vaardigheden
De studenten maken enkele opdrachten met de programmeertaal R. Deze opdrachten zijn onderdeel van de drie inleveropdrachten, zie Toetsing en Opdrachten.
Aanwezigheid
Aanwezigheidseisen opleiding (OER-B):
-
Van elke student wordt actieve deelname verwacht aan het onderdeel waarvoor hij/zij staat ingeschreven.
-
Als een student door persoonlijke omstandigheden niet aanwezig kan zijn bij een verplicht onderdeel van het programma, dient hij/zij dit zo snel mogelijk schriftelijk te melden bij de betreffende docent en de studieadviseur.
-
Het is niet toegestaan om verplichte onderdelen van een onderdeel te missen als er geen sprake is van overmacht.
-
Bij kwalitatief of kwantitatief onvoldoende deelname, kan de examinator de student uitsluiten van verdere deelname aan het onderdeel of een gedeelte daarvan. Voorwaarden voor voldoende deelname worden van te voren vastgelegd in de studiewijzer en op Canvas.
-
Bij alle onderwijseenheden van jaar 1 en 2 is een student verplicht bij minimaal 80% van de werkcolleges en tutoraten aanwezig te zijn. Bovendien moet worden deelgenomen aan eventuele tussentoetsen en verplicht gesteld huiswerk. Als niet aan deze verplichting is voldaan, wordt de student uitgesloten voor de herkansing van de onderwijseenheid. In geval van persoonlijke omstandigheden, zoals in OER-A Artikel 6.4 omschreven, wordt in overleg met de studieadviseur een afwijkende regeling voorgesteld.
Aanvullende eisen voor dit vak:
Aanwezigheid bij de werkcolleges is verplicht. Als je niet bij minstens 80% van de werkcolleges aanwezig bent geweest dan vervalt je recht op het hertentamen, zoals vermeldt in het OER-B artikel 4.9 lid 2.
Toetsing
| Onderdeel en weging
|
Details
|
|
| |
|
| |
|
| |
Gedurende het vak wordt driemaal een set inleveropgaven opgegeven. Deze opgaven bestaan uit reguliere vraagstukken (zoals op het werkcollege) en opgaven waarbij de studenten aan de slag gaan met de programmeertaal R. Het gemiddelde van deze drie sets telt voor 20% mee in het eindcijfer.
Fraude en plagiaat
Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl
Weekplanning
Voorlopige planning. Wijzigingen voorbehouden.
| Weeknummer |
Onderwerpen |
Studiestof (onderdelen met een * overslaan) |
| 1 |
Elementen uit de kansrekening, statistische modellen |
Appendix A, H1 |
| 2 |
Verdelingsonderzoek |
H2 |
| 3 |
Schatters, mean square error, maximum-likelihoddschatters |
Secties 3.1, 3.2 ,3.3 |
| 4 |
Maximum-likelihoddschatters, momentenschatters en Bayes schatters |
Secties 3.3, 3.4 ,3.5 |
| 5 |
Bayes-schatters, voldoende en volledige statistieken |
Secties 3.5, 6.1 t/m 6.3.1 |
| 6 |
UMVZ-schatters, Cramer-Rao ondergrenzen |
Sectie 6.3.2, handout MLS |
| 7 |
Toetsingsproblemen, kritiek gebied, onbetrouwbaarheid |
Secties 4.1 t/m 4.3.1 |
| 8 |
Tussentoets |
H1, H2, H3, secties 4.1 t/m 4.3.1 6.1, 6.2, 6.3, A.7 (onderdelen met een * overslaan) |
| 9 |
Overschrijdingskansen, t-toetsen |
Secties 4.3.2 t/m 4.6.3 |
| 10 |
Kolmogorov-Smirnovtoets, likelihood-ratiotoetsen, Lemma van Neyman-Pearson |
Secties 4.6.4, 4.7, 6.4 |
| 11 |
Betrouwbaarheidsintervallen, pivots, bijna-pivots |
Secties 5.1 t/m 5.4 |
| 12 |
Geen college |
|
| 13 |
Relatie tussen toetsen en betrouwbaarheidsgebieden, likelihood-ratiogebieden |
Secties 5.5, 5.6 |
| 14 |
Geen college |
|
| 15 |
Credible sets en Bernstein-von Mises |
Sectie 5.7, handout BvM |
| 16 |
Tentamen |
H1, H2, secties t/m H6, sectie A.7 (onderdelen met een * overslaan) |
Rooster
Het rooster van dit vak is in te zien op DataNose.
Op dit vak is een honoursuitbreiding mogelijk.
Verwerking vakevaluaties
Hieronder vind je de aanpassingen in de opzet van het vak naar aanleiding van de vakevaluaties.
Coördinator
-
prof. dr. J.H. van Zanten
Docenten
- prof. dr. J.H. van Zanten
- Raviar Karim BSc
- Nikki Levering BSc
- Femke Madsen BSc