Data Verzamelen en Analyseren

Data Collection and Analysis

6 EC

Semester 1, periode 1, 2

5042DAVA6Y

Eigenaar Bachelor Biologie
Coördinator drs. Peter Assink
Onderdeel van Bachelor Biologie, jaar 1Pre-master Biological Sciences, jaar 1

Studiewijzer 2023/2024

Globale inhoud

Data Verzamelen en Analyseren is een zestienweekse cursus die plaatsvindt gedurende de eerste vier maanden (sep-dec) van het eerste studiejaar. In de cursus wordt (1) aandacht besteed aan op welke wijze je onderzoeksgegevens moet verzamelen om ze zinvol te kunnen analyseren, en worden (2) enige eenvoudige analysetechnieken besproken en geoefend, zowel met pen en papier als met statistiekprogramma 'R'. Veel van deze analysetechnieken worden in latere cursussen van de bachelor regelmatig toegepast.

In onderstaand overzicht staan de onderwerpen met hun Engelse term aangegeven (o.a. vanwege het Engelstalige cursusboek), maar de cursus wordt in het Nederlands gegeven.

Periode 1

  • Why learning statistics?  
  • Populations and samples
  • Variables and measurement levels
  • Types of study
  • Displaying data 
  • Describing data
  • Sampling distributions
  • Probability 
  • Binomial distribution
  • Normal distribution
  • Confidence intervals
  • Basics of Excel
  • Basics of R

Periode 2

  • Testing hypotheses
  • One-sample binomial test
  • Poisson distribution
  • Chi-square distribution and goodness-of-fit test 
  • Student's t-distribution and t-tests (one-sample, two-sample, paired)
  • Checking assumptions, checking normality
  • Transforming data
  • One-way ANOVA
  • Several non-parametric tests
  • Analysing data using R

Studiemateriaal

Literatuur

  • The Analysis of Biological Data. Whitlock and Schluter, 3rd edition, 2019.  ISBN: 9 781319 325343
    LET OP: dit mag NIET de 2nd of 1st edition zijn!

Syllabus

  • 'R Companion bij het cursusboek' (hoe doe je de berekeningen uit het cursusboek met R);  'R Handleiding bij de laptopcolleges' (data opslaan in R, grafieken maken met R, statistische analyses uitvoeren in R; 3 delen).
    Deze (gratis) syllabi komen digitaal beschikbaar tijdens de cursus.

Practicummateriaal

  • Laptop met als besturingssysteem Windows (8, 8.1 of 10) of macOS 10.14 (Mojave), 10.15 (Catalina), 11, 12, 13 of 14.
    LET OP: Draag zorg voor een laptop met voldoende rekenkracht. Zorg verder dat je voldoende bekend bent met je besturingssysteem om je laptop onder normale omstandigheden te kunnen bedienen. Het leren werken met Windows of macOS is geen onderdeel van de cursus.

Software

  • Voor Windows machines zowel als Mac's: (bij voorkeur de Engelstalige) Excel uit Microsoft Office 2016, 2019, 2021 of 365.
    LET OP: eerdere en/of Nederlandstalige versies van Excel zijn toegestaan maar Excel wordt uitgelegd a.h.v.  Engelstalige tutorials. Zorg dat de Excel-applicatie op je laptop staat voordat de cursus begint. 

  • CRAN R-4.3.1 of een recentere release (bij oudere besturingssystemen kan het zijn dat je een oudere release moet gebruiken). Het is beter om deze applicatie niet al thuis te downloaden: je doet dat tijdens de cursus, onder begeleiding.

  • RStudio 2023.06.x of een recentere release (bij oudere besturingssystemen kan het zijn dat je een oudere release moet gebruiken). Het is beter om deze applicatie niet al thuis te downloaden: je doet dat tijdens de cursus, onder begeleiding.

Leerdoelen

  • aangeven waar op gelet moet worden bij het verzamelen (meten, tellen) van gegevens teneinde deze met statistische methoden correct te kunnen analyseren;
  • basisbegrippen uit de statistiek kunnen uitleggen;
  • datasets kunnen beschrijven en grafisch kunnen weergeven;
  • eenvoudige statistische analysemethoden kunnen opnoemen;
  • kunnen bepalen hoe eenvoudige statistische vraagstukken moeten worden opgelost;
  • eenvoudige statistische analysemethoden kunnen uitvoeren met enkel pen, papier en rekenmachine
  • basishandelingen kunnen uitvoeren in Microsoft Excel;
  • de R app kunnen bedienen vanuit RStudio;
  • met de R app vectoren, matrices en dataframes kunnen bewerken;
  • met de R app eenvoudige statistische analysemethoden kunnen uitvoeren;
  • bij eenvoudige 'experimental designs' kunnen beredeneren welke statistische analysemethode van toepassing is

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • Laptopcollege
  • Zelfstudie

Tijdens de hoorcolleges bespreekt de docent de stof uit het boek, vaak vanuit een wat andere invalshoek en met andere voorbeelden dan het boek hanteert.
Tijdens de werkcolleges oefenen studenten om de behandelde stof toe te passen a.h.v. opgaven uit het boek en oude tentamenopgaven.
Tijdens de laptopcolleges leren studenten werken met R vanuit RStudio. Dit doen ze op hun eigen laptop.
Zelfstudie (circa de helft van de studielast-uren) is bedoeld om, buiten de contacturen om, zelf de theorie te bestuderen, huiswerkopgaven te maken, na een werk- of laptopcollege alsnog de opgaven te maken waar men niet was aan toegekomen, en tentamenstudie.

Verdeling leeractiviteiten

Activiteit

Uren

 

Hoorcollege

27

 

Laptopcollege

24

 

Theorietoets

3

 

Werkcollege

24

 

Zelfstudie

88

 

Practicumtoets

2

 

Totaal

168

(6 EC x 28 uur)

Merk op dat er 88 uur zelfstudie deel uitmaakt van de cursus. Dat is ruim de helft van de studielast.

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Deelname aan (computer)practica, veldwerk en werkcolleges is in principe verplicht. Eventueel aanvullende eisen worden per onderdeel in de studiewijzer omschreven. Hier staat ook beschreven wat de eventuele consequenties zijn van het niet nakomen van deze verplichting.

Aanvullende eisen voor dit vak:

Absentie bij een werkcollege of laptopcollege dient ALTIJD vooraf te worden gemeld, met reden.
In zeldzame gevallen waarin vooraf melden niet mogelijk of niet reëel is, dien je je absentie in elk geval z.s.m. te melden.
Melden doe je mondeling of via het cursus-emailaccount (Zie Contactinformatie).

Indien meedoen met de andere groep mogelijk is, dan heeft dat de voorkeur (dat moet wel de goedkeuring hebben van de cursusleiding). In dat geval word je als 'present' genoteerd voor het onderdeel..

Hoewel de corona-pandemie alweer enige tijd achter ons ligt, waart het corona-virus nog wel rond. Als je gezondheidsklachten hebt die zouden kunnen wijzen op corona (of als je positief test), dan stellen we het op prijs als je (a) het hoorcollege niet bezoekt maar thuis de video-opname ervan bekijkt en (b) je je absent meldt voor de werkcolleges / laptopcolleges. Als je niet te ziek bent, kun je online meedoen met het werkcollege of het laptopcollege, in welk geval je daarvoor als 'present' wordt genoteerd. Kun je of wil je niet online meedoen, dan wordt je als 'absent' genoteerd. Te vaak absent zijn heeft consequenties, zie hieronder.

Iedere student mag 3 keer absent zijn tijdens de cursus (dat is 1 keer per 8 bijeenkomsten) zonder consequenties, mits deze absenties zijn gemeld.
Voor een niet-gemelde absentie én voor elke absentie vanaf de 4e geldt:

Bij een werkcollege: je kunt voor je ingeleverde huiswerk nu nog maar 1/2 punt krijgen (i.p.v. 1 punt); om 1 punt te krijgen moet je ook de antwoorden op de werkcollege-opgaven inleveren.

Bij een laptopcollege uit de tweede helft van de cursus: je moet bepaalde, door de cursusleiding aan te geven, opgaven maken en de antwoorden inleveren. Doe je dat niet, dan zal de cursuscoördinator besluiten wat daarvoor de sanctie is. 

Voor studenten met privé-problemen of met specifieke gezondheidsproblemen e.d., kunnen mildere regels gelden. Alleen de studieadviseur kan bepalen of je tot deze categorie behoort, niet jijzelf. Als de studieadviseur meent dat er voor jou mildere regels mogen worden gehanteerd, zal de studieadviseur dat melden aan de cursuscoördinator, die vervolgens mildere regels zal opstellen, aangepast aan jouw situatie.

De absentieregeling staat in detail beschreven op Canvas in de module "Absentie: regels en consequenties".

Toetsing

Onderdeel en weging Details

Eindcijfer

Negeer bovenstaande incomplete tabel.


Het eindcijfer van de cursus wordt berekend uit 3 deelcijfers, met de volgende gewichten*:

deelcijfer theorie 80%
deelcijfer R1 10%
deelcijfer R2 10%

(De letter 'R' refereert naar de naam van de software waarmee gewerkt wordt en waarvan de vaardigheid van gebruik getoetst wordt.)

Het deelcijfer theorie bestaat uit het cijfer (schaal 0-8.8) dat je krijgt voor het gezamenlijke resultaat van twee deeltentamens, waarbij wordt opgeteld het cijfer (schaal 0-1.2) dat je krijgt voor ingeleverd huiswerk. Deze optelling (schaal 0-10) telt vervolgens voor 80% mee in het eindcijfer.

Voorbeeld: als je voor de twee deeltentamens samen een 6.6 haalt en voor je huiswerk een 0.9, is je deelcijfer theorie een 6.6+0.9 = 7.5. De bijdrage daarvan aan het eindcijfer is dan 7.5 * 80% = 6.0.

Huiswerk kun je wekelijks inleveren, en kan telkens cijfer 0.1 opleveren, mits het ingeleverde werk aan bepaalde criteria voldoet (zie Canvas). Huiswerk inleveren kan 12 keer tijdens de cursus, en zodoende kun je voor de component 'huiswerk' aan het eind van de cursus cijfer 1.2 hebben verdiend. Het inleveren van huiswerk is niet verplicht.

Op de helft van de cursus wordt er een deeltentamen afgenomen (27 oktober) en aan het eind van de cursus opnieuw (21 december). De resultaten van de deeltentamens worden samengevoegd en daaruit wordt een cijfer berekend (schaal 0-8.8).

Het deelcijfer theorie (dus tentamen plus huiswerk, samen schaal 0-10) mag niet lager zijn dan een 4 (een vakspecifiek besluit). Is dat wel het geval, dan moet de theoretische component herkanst worden middels één theoriehertentamen (9 mei 2024). De deeltentamens en het huiswerk kunnen niet apart opnieuw gedaan worden.

Het deelcijfer R1 en het deelcijfer R2 volgen uit de resultaten behaald bij de respectievelijke toetsen. Elk van deze deelcijfers (schaal 0-10) tellen voor 10% mee in het eindcijfer.

Voorbeeld: als je voor de R1 toets een 7 haalt, levert dat een eindcijferbijdrage op van 7 * 10% = 0.7. Als je bovendien voor de R2 toets een 5 haalt, levert dat een eindcijferbijdrage op van 5 * 10% = 0.5. Samen met het theoriedeelcijfer uit het vorige voorbeeld, zou je eindcijfer dan zijn: 6.0 (theorie) + 0.7 (R1) + 0.5 (R2) = 7.2, dat wordt afgerond naar een 7.0.
Meer voorbeelden vind je op Canvas.

Geen der beide R deelcijfers (elk schaal 0-10) mag lager zijn dan een 5 (vakspecifiek besluit). Is dat wel het geval, dan moet de betreffende toets herkanst worden. Deze herkansingen worden meestal geroosterd in januari (de data zijn tijdens het schrijven van deze studiewijzer nog niet bekend).

Tot slot worden er Excelvaardigheden getoetst, middels een zelf te downloaden toets die net zo vaak gemaakt kan worden tot er een voldoende is behaald. Het resultaat van deze toets draagt niet bij aan het eindcijfer van de cursus (de beoordeling luidt enkel 'voldoende' of 'onvoldoende') maar zolang er geen voldoende is behaald, wordt het eindcijfer van de cursus niet vrijgegeven.

De Exceltoets moet in elk geval één keer zijn ingeleverd vóór woensdag 1 november.

Het eindcijfer mag niet lager zijn dan een 6.0 (OER-A 4.6.4). Is dat wel het geval dan kunnen er onderdelen naar keuze herkanst worden (R1 herkansing en/of R2 herkansing en/of theoriehertentamen), waarbij zij opgemerkt dat onderdelen waarvoor een NAV is behaald sowieso herkanst moeten worden, ook als het eindcijfer voldoende is.

------------------

* Voor recidivisten kunnen andere gewichten gelden. Zolang zij één of meer deelcijfers hebben staan die nog stammen uit de cursus van 2022 of eerder, zijn de gewichten voor ál hun deelcijfers conform de toen gehanteerde percentages. Pas als alle deelcijfers in 2023 zijn behaald, gelden de 2023 gewichten. Meer info over de gewichten van deelcijfers voor recidivisten is te vinden op Canvas in de module "informatie voor Recidivisten".

Inzage toetsing

De antwoorden op de vragen van een deeltentamen komen daags na het deeltentamen op Canvas.
Het bespreken van deze vragen is geen ingeroosterd onderdeel, maar kan desgewenst individueel plaatsvinden voor wie dat wil. Benader daarvoor de coördinator. De antwoorden van de R toetsen komen niet online, maar een student kan wel aanvragen om het ingeleverde werk te mogen inzien.

Opdrachten

De Excelvaardighedentoets moet gemaakt worden om de cursus te kunnen afronden. Deze toets kunnen studenten zelf downloaden van Canvas en maken wanneer het hen uitkomt, ergens in de maanden september en oktober. De deadline voor het inleveren van deze toets is 31 oktober middernacht.

De Exceltoets moet tenminste 1 keer zijn ingeleverd vóór woensdag 1 november.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

Weeknummer Onderwerpen Studiestof
1 (=week 36) introductie                             R H0,1,2
2 (=week 37)   boek: Ch1;      R H3,4a
3   boek: Ch2;      R data opslaan en grafieken maken
4   boek: Ch3/4;  R H4b
5   boek: Ch5;      R H5a
6   boek: Ch7;      R H5b
7   boek: Ch10;    R H6,7
8 (=week 43) toetsing  
9   boek: Ch6
10   boek & R: Ch8
11   boek & R: Ch11
12   boek & R: Ch12
13   boek & R: Ch13
14   boek & R: Ch15
15 (=week 50) toetsing  
16 (=week 51) toetsing  

Zie liever de uitgebreide informatie op Canvas.
Wellicht zinnig om nu vast te weten: voor de cursusonderdelen in de eerste week (week 36) hoef je niets voor te bereiden. Zorg wel dat je je bij het laptopcollege (donderdag 7 sep) je laptop bij je hebt. Het cursusboek heb je pas nodig vanaf week 37.

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

VOERTAAL: NEDERLANDS
De cursus wordt gegeven in het Nederlands, maar vanwege het Engelstalige cursusboek en omdat de wetenschappelijke voertaal doorgaans Engels is, worden in de hoor- en werkcolleges karakteristieke statistiektermen in het Engels gebezigd.

MEER CURSUSINFO OP CANVAS
Vanaf de eerste cursusdag is er een Canvas-omgeving beschikbaar die gedurende de gehele cursus up-to-date zal worden gehouden. Deze omgeving bevat nuttige informatie over rooster, huiswerk-, werkcollege- en laptopcollege-opgaven, powerpoint-slides van de hoorcolleges, video-opnames van de hoorcolleges, overzicht van de tentamenstof, absentie-regels, beoordeling van de cursus, contact met de begeleiding, en meer.

De informatie op Canvas is identiek met of uitgebreider dan de informatie in deze studiewijzer.
De studiewijzer is hoofdzakelijk bedoeld om een indruk te krijgen van de cursus voordat deze van start gaat. Daarna is de Canvas-omgeving de aangewezen plek voor informatie. Tijdens het introductiecollege zal het gebruik van Canvas worden toegelicht.

Contactinformatie

Coördinator

  • drs. Peter Assink

Zolang de cursus nog niet gestart is, kunnen studenten communiceren met de coördinator.
Als de cursus eenmaal loopt (dat is vanaf 5 september 2023) wordt de studenten verzocht in principe alleen nog te communiceren met de assistenten. Daartoe kan gebruik gemaakt worden van het cursus e-mailadres 5042DAVA@gmail.com

Wanneer neem je contact op met de assistenten?
Sowieso om een absentie te melden, en verder voor elke gewenste of noodzakelijke wijziging in je deelname (bv. groepsruil), vragen over het rooster, je groepsindeling, waar info op Canvas te vinden is, e.d.. Al deze vragen mag je trouwens ook mondeling stellen tijdens de contactmomenten.
Stuur geen inhoudelijke vragen (vragen over de stof) naar de coördinator of de assistenten. Met dergelijke vragen kun je terecht op de hoorcolleges, werkcolleges en laptopcolleges.

Docenten

De coördinator is tevens de (enige) docent. Hij verzorgt de hoorcolleges en coördineert de cursus.
Twee ervaren assistenten zullen de werkcolleges en de laptopcolleges begeleiden. De docent zal ook meestal aanwezig zijn. Veelal zullen de assistenten de werkcolleges beginnen met het voordoen van een opdracht op het bord en/of de computer.