Verzamelen, Visualiseren en Analyseren

Data Collection, Visualisation and Analysis

6 EC

Semester 2, periode 4, 5

5132VEVA6Y

Eigenaar Bachelor Future Planet Studies
Coördinator dr. ir. E.E. van Loon
Onderdeel van Bachelor Future Planet Studies, jaar 1

Studiewijzer 2021/2022

Globale inhoud

De theorie van beschrijvende statistiek, visualisatie, kansberekening en toetsende statistiek wordt via de SOWISO leeromgeving  geïntroduceerd en toegepast via interactieve oefeningen in de R software-omgeving (zelfstudie).

Daarna wordt de theorie in hoorcolleges besproken en in werkcolleges toegepast op concrete en meer uitdagende opdrachten. Bij de opdrachten binnen de werkcolleges worden verschillende typen gegevens verwerkt en geanalyseerd in R.

Het vak is opgesplitst in twee delen van gelijke omvang en ieder van deze delen wordt afgesloten met een deeltoets. In het eerste deel worden beschrijvende statistiek, kansberekening & kansverdelingen behandeld, in het tweede deel komt toetsende statistiek aan bod.

 

Studiemateriaal

Syllabus

  • https://uva.sowiso.nl/

Practicummateriaal

  • https://uva.sowiso.nl/

Software

Leerdoelen

  • 1. gebruiken van R voor het uitvoeren van algemene berekeningen, eenvoudige dataverwerking datavisualisaties en statistische analyses behorend bij deze cursus
  • 2. selecteren, berekenen en rapporteren van juiste samenvattingsmaten voor het beschrijven van één variabele
  • 3. selecteren, berekenen en rapporteren van juiste samenhangsmaten voor het beschrijven van de relatie tussen twee (numerieke en/of categorische) variabelen
  • 4. correct toepassen van de rekenregels binnen de kansrekening om kansuitspraken te kunnen doen over een populatieparameter
  • 5. uitrekenen en interpreteren van kansdichtheid, kans en kwantiel voor een random variabele met gegeven kansverdeling (uniforme, binomiaal en normaal verdeling)
  • 6. beschrijven van de sterke en zwakke punten van de verschillende steekproefmethoden
  • 7. uitrekenen en interpreteren van betrouwbaarheidsintervallen van een populatiegemiddelde en een proportie
  • 8. beschrijven hoe de toetsconcepten bij klassieke statistische hypothese toets samenhangen (nul- en alternatieve hypothese, significantie, power, Type-I fout en Type-II fout)
  • 9. selecteren, uitvoeren en interpreteren van toets voor populatiegemiddelde en proportie voor 1 of 2 groepen (z-toets en t-toets)
  • 10. selecteren, uitvoeren en interpreteren van toets voor samenhang tussen twee numerieke variabelen (enkelvoudige lineaire regressie)
  • 11. selecteren, uitvoeren en interpreteren van toets voor de overeenkomst tussen twee discrete kansverdelingen (chi-kwadraat toets voor 'goodness of fit') en samenhang tussen twee categorische variabelen (chi-kwadraat toets voor samenhang)

Onderwijsvormen

  • Werkcollege
  • Zelfstudie
  • Hoorcollege
  • (Computer)practicum

Hoorcolleges en werkcolleges/computerpractica (beide op campus) waarin vaardigheden worden geoefend met gegevensverwerking en analyse.

Verdeling leeractiviteiten

In de eerste week starten we met een hoorcollege en werkcollege (in totaal 4 uur) waarin het werken met R/RStudio wordt uitgelegd en geoefend.

Daarna volgt het statistische deel van de cursus. Dat statistische deel bestaat uit twee stukken van 5 weken, gevolgd door een toets in week 6. Ieder deel is 3 EC in omvang en in beide delen is de verdeling tussen de activiteiten gelijk:

Deel 1

 

Activiteit

Uren

Digitale Toets

2

Hoorcollege

10 (5x 2)

Werkcollege

10 (5x 2)

Zelfstudie

60 (5x 12)

Totaal

82

 

 Deel 2

 

Activiteit

Uren

Digitale Toets

2

Hoorcollege

10 (5x 2)

Werkcollege

10 (5x 2)

Zelfstudie

60 (5x 12)

Totaal

82

 

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Deelname aan veldwerk is verplicht en niet vervangbaar door opdrachten of andere cursussen.
  • In geval van een practicum is de student verplicht ten minste 90% van de practicumbijeenkomsten bij te wonen en zich op deze bijeenkomsten terdege voor te bereiden, tenzij anders aangegeven in de studiewijzer van het vak. Indien de student minder dan 90% heeft bijgewoond dient het practicum opnieuw te worden gevolgd.
  • In geval van werkgroepbijeenkomsten is de student verplicht tenminste 7 van elke 8 werkgroepbijeenkomsten bij te wonen en zich op deze bijeenkomsten terdege voor te bereiden, tenzij anders aangegeven in de studiewijzer. Bij meer dan 8 werkgroepbijeenkomsten geldt dat de student steeds per (deel van) 8 bijeenkomsten maximaal 1 bijeenkomst mag missen. Indien de student minder dan het verplichte aantal heeft bijgewoond, kan het vak niet worden afgerond.

Aanvullende eisen voor dit vak:

Iedereen die het vak voor de eerste keer volgt moet aan de volgende verplichtingen voldoen om deel te mogen nemen aan de deeltentamens:

  • de online lesstof van het vak (theorie met oefeningen) doorlopen die voor de betreffende week geroosted staat;
  • de weektoets over de lesstof met een voldoende score maken;
  • aanwezig zijn en actief deelnemen aan de werkcolleges.

Voor Herkansers gelden de volgende verplichtingen:

  • de online lesstof van het vak (theorie met oefeningen) doorlopen die voor de betreffende week geroosted staat;
  • de weektoets over de lesstof met een voldoende score maken.

Herkansers hoeven niet aanwezig te zijn bij de werkcolleges.

 

Toetsing

Onderdeel en weging Details

Eindcijfer

tentamen VVA Deel 1

Moet ≥ 5.5 zijn, NAP bij geen cijfer

tentamen VVA Deel 2

Moet ≥ 5.5 zijn, NAP bij geen cijfer

De deeltentamens worden afgenomen in dezelfde leeromgeving (SOWISO) gemaakt waarin ook de wekelijkse toetsen zijn gemaakt. Gedurende de tentamens wordt gebruikt gemaakt van R en zijn (naast de help-functionaliteit binnen R) alleen de volgende digitale formulieren met formules beschikbaar als ondersteuning:

Formuleblad voor VVA deel 1
Formuleblad voor VVA deel 2
Overzicht van R commando's  

Verder wordt voorzien in kladpapier tijdens de tentamens. Overige hulpmiddelen zoals rekenmachine, eigen R-scripts of aantekeningen zijn niet toegestaan bij het tentamen.

Het eindcijfer is het gemiddelde van de cijfers voor de twee deeltentamen, waarbij voor ieder deeltentamen minimaal 5.5 moet worden gescoord. Beide deeltentamens zijn afzonderlijk te herkansen.

De deelcijfers blijven niet staan tot volgend jaar. Dus als één van de deeltentamens na de herkansing niet is gehaald is het vak niet gehaald en moet het hele vak het volgende jaar opnieuw worden gevolgd.

Toetsmatrijs (studentenversie)

 

Leerdoel:   Deeltentamen 1:   Deeltentamen 2:
2 t/m 6 ieder 20 %  
7 t/m 11   ieder 20 %

Studenten die het vak al eerder hebben gevolgd

Studenten die het vak al eerder hebben gevolgd hoeven niet aanwezig te zijn bij het werkcollege, maar moeten aan dezelfde regels voldoen als de andere studenten wat betreft het doorlopen van de online lesstof en de wekelijkse deeltoetsen.

De deelcijfers blijven niet staan tot volgend jaar - dus als het vak na herkansingen niet is gehaald moet het hele vak het volgende jaar opnieuw worden gevolgd.

Opdrachten

Er zijn iedere week verplichte opdrachten bij deze cursus, bestaand uit:

  • het doorlopen van de online lesstof van het vak (theorie met eenvoudige oefeningen in SOWISO) -  zelfstudie
  • het maken van revisie-oefeningen (vaak gebruik makend van R) - in de werkcolleges en zelfstudie
  • het maken van een weektoets over de lesstof (mag 2 keer worden gedaan en moet met een voldoende score worden gemaakt) - zelfstudie

Feedback op de oefeningen en weektoets wordt gegeven binnen de leeromgeving, en vragen hierover worden tijdens werkcolleges beantwoord. Vragen naar aanleiding van de online theorie worden in hoor- en werkcolleges beantwoord.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

 

Deel 1: Beschrijvende statistiek, kansberekening & kansverdelingen

Weeknummer
(datum van hoorcollege)

Onderwerpen Studiestof
7 (14 feb) Leren werken met R & RStudio Hoofdstuk 0
7 (18 feb) Beschrijven van variabelen Hoofdstuk 1
8 (25 feb) Samenhang tussen variabelen Hoofdstuk 2
9 (4 feb) Kansberekening Hoofdstuk 3
10 (11 maart) Kansverdelingen Hoofdstuk 4
11 (18 maart) Steekproeven en Steekproef Kansverdelingen Hoofdstuk 5
13 Digitale Toets 1 (31 maart)
H. 1 t/m 5

 

Deel 2: Toetsende statistiek

Weeknummer (datum van hoorcollege)

Onderwerpen Studiestof
15 (8 april) parameterschatting & betrouwbaarheidsintervallen Hoofdstuk 6
16 (14 april) hypothese toetsen Hoofdstuk 7
17 (22 april) toets voor gemiddelde en proportie Hoofdstuk 8
19 (29 april) enkelvoudige regressie Hoofdstuk 9
20 (13 mei) associatie tussen categorische variabelen Hoofdstuk 10
21 Digitale Toets (24 mei)
H. 6 t/m 10

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

Al het lesmateriaal (en ook de toets) is in het Engels.

 

Vakevaluatie afgelopen jaar

Vanaf 2013-2014 hebben we ervoor gekozen om d.m.v. onderstaande tabel de studenten meer inzicht te geven in de kwaliteitszorg. Daarom nemen we een korte weergave van de studentenevaluatie op en de daaruit voortvloeiende acties ter verbetering van het vak.

VVA (6 EC)        
Sterke punten
  • duidelijke uitleg
  • veel oefenmateriaal beschikbaar
  • verplichte weektoetsen zijn belangrijk ivm bijhouden van stof
  • sowiso werkt heel goed
Suggesties ter verbetering
  • de tentamens waren moeilijker dan de weektoetsen en uiteindelijke tentamens: zorg dat ze van hetzelfde niveau zijn
Belangrijkste opmerkingen Opleidingscommissie:
  • maak weektoetsen / voorbeeld tentamen van zelfde niveau
  • maak meer oefenmateriaal om met R/echte data te kunnen oefenen
Reactie docent:
  • De weektoetsen zijn formatief , bedoeld om ervoor te zorgen dat iedereen bij blijft met het doornemen van de stof. De toetsen gaan na of het materiaal van de afgelopen week is bestudeerd en bevatten dus om die reden voor een deel opgaven die voorkomen in de lesstof van die week - er worden bewust geen opgaven uit andere hoofdstukken opgenomen
  • De tentamens zijn summatief, bedoeld om te meten hoe goed de verschillende onderdelen van de stof worden beheerst, hierbij is het belangrijk dat het eindniveau wordt getoetst (bijv. dus ook verbanden tussen hoofdstukken).
  • De vragen op het tentamen moeten natuurlijk qua niveau overeenkomen met de vragen uit de lesstof. Dus dat gaan we dit jaar goed testen voordat het tentamen wordt afgenomen.
  • We maken oefententamens beschikbaar die hetzelfde niveau hebben als de summatieve tentamens.

Uitleg waarom de tentamens afgelopen jaar moeilijker uitpakten (en misschien ook moeilijker leken dan de lesstof):

De uiteindelijke oorzaak is het online-toetsen en de daaruit voorkomende maatregelen om fraude te voorkomen: het online-toetsen betekent dat de toets volledig 'open boek' was en zonder de mogelijkheid om communicatie tussen studenten na te gaan. Die maatregelen bestonden uit:

    • het hanteren van een relatief hoge tijdsdruk,
    • ervoor zorgen dat de toetsopgaven anders zijn qua vorm en vraagstelling dan die in de lesstof (anders kunnen de antwoorden gewoon uit de lesstof worden gekopieerd en wordt geen kennis/inzicht getoetst)
    • het volledig randomiseren van de opgaven (om fraude door communicatie tussen studenten over mogelijke antwoorden de voorkomen) - dit veroorzaakt soms een onlogische volgorde in de stof.

Bij een toets op campus zijn al deze maatregelen niet nodig en is er dus meer tijd, komen de toetsvragen qua vorm en vraagstelling meer overeen met die uit de stof en wordt volgorde van de vragen iets logischer opgebouwd.

 

 

Contactinformatie

Coördinator

  • dr. ir. E.E. van Loon

e.e.vanloon@uva.nl