Data Science

6 EC

Semester 2, periode 4

5072DASC6Y

Eigenaar Bachelor Informatiekunde
Coördinator dr. Maarten Marx
Onderdeel van Bachelor Informatiekunde, jaar 3

Studiewijzer 2017/2018

Globale inhoud

In dit college gaan we aan de slag met grote databestanden, die we vaak van het web zullen halen. We werken zowel met tekst als met numerieke data. Veel van de analyses die we doen zullen gebeuren in Python's pandas module.

 Alle informatie over dit vak vind je op  http://maartenmarx.nl/teaching/DataScience/

Studiemateriaal

Software

  • IPython Notebooks. Aangeraden wordt de Anaconda distributie.

Leerdoelen

  • Kunnen voorbewerken van typische data science data: (zeer) grote hoeveelheden tekst met annotaties, gerepresenteerd in een database, spreadsheet of XML of als een verzameling tekst bestanden, voor wetenschappelijk onderzoek. Hieronder valt het transformeren, annoteren, categoriseren, classificeren en ordenen van data. Alles door middel van computers, en zo min mogelijk met de hand.
  • Kunnen evalueren van de kwaliteit van door een computer programma bewerkte data.
  • Ter voorbereiding op het afstudeerproject: het laatste deel van de empirische cirkel: 'formuleer hypothese, operationaliseer die in termen van de beschikbare data, programmeer en verzamel en analyseer de resulaten en vertaal die terug naar de oorspronkelijke hypothese."
  • Snel en gestructureerd kunnen werken met IPython notebooks, en verschillende Python modules voor Data Science, in het bijzonder pandas.
  • Kennis van resultaten behaald met eHumanities technieken en van resultaten uit de computationele sociale wetenschappen. Het zelf kunnen reproduceren van vergelijkbare resultaten op vergelijkbare datasets.

 

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • (Computer)practicum

Het vak bestaat uit 2 uur college en 4 uur werkcollege/practicum per week. Je zal veel tijd zelf bezig zijn. Voor de werkcolleges geldt een aanwezigheidsplicht van 90% (dat betekent dat je 5 van 6 keer aanwezig moet zijn)

Verdeling leeractiviteiten

Activiteit

Aantal uur

Digitale Toets

2

Hoorcollege

12

Presentatie

6

Werkcollege

24

Zelfstudie

124

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Voor practica en werkgroepbijeenkomsten met opdrachten geldt een aanwezigheidsplicht, tenzij anders vermeld in de studiegids.
  • Wanneer studenten niet voldoen aan deze aanwezigheidsplicht kan het onderdeel niet met een voldoende worden afgerond. De aanwezigheidsplicht met betrekking tot hoor/werkcolleges staat, indien van toepassing, vermeld in de studiegids.

Aanvullende eisen voor dit vak:

Wat te doen als je door overmacht afwezig bent? 

In principe dien je bij alle verplichte practica, waaronder PAV, aanwezig te zijn. Nu kan het in de loop van een collegejaar best een keer gebeuren dat je bijvoorbeeld ziek bent of naar een begrafenis wilt waardoor je een bijeenkomst mist. Het gaat hier steeds om overmacht: een onmogelijkheid die je niet valt toe te rekenen.

Bij de meeste vakken staat hier een regeling voor in de studiewijzer of studiegids. Doe in dat geval wel het volgende:

  1. Meld je vooraf per e-mail af bij de begeleider van die bijeenkomst (meestal een tutor, practicumassistent, of de docent).
  2. Neem zo goed mogelijk zelfstandig het materiaal door.
  3. Informeer bij je medestudenten wat je verder gemist hebt.

Wanneer je niet voldoet aan, of buiten de regeling van het vak valt, of denkt dat je door één keer missen al studievertraging oploopt, dan ontstaat er mogelijk een probleem. Neem in dat geval contact op met de studieadviseur. Zij kan met je kijken wat de gevolgen van jouw afwezigheid zijn voor jouw studie, en eventueel meedenken naar oplossingen.

De studieadviseur is via de mail te bereiken aan de hand van het online vragenformulier. Ook kun je online een afspraak inplannen. Telefonisch is de studieadviseur bereikbaar via de ESC servicedesk: 020 5257100.

De studieadviseur voor de bacheloropleiding Informatiekunde is:

Brit Giesbertz, MSc. Zie de informatiepagina van de studieadviseurs.

Toetsing

Onderdeel en weging Details

Eindcijfer

1 (100%)

Digitale Toets

De specifieke regels voor de toetsing en hoe veel elk deel meetelt staan op http://maartenmarx.nl/teaching/DataScience/#toets.

Inzage toetsing

De manier van inzage wordt via de webpagina van het vak gecommuniceerd.

Het inzagemoment wordt via mail meegedeeld en is meestal in de week na het tentamen.

Opdrachten

Voor de opdrachten, zie http://maartenmarx.nl/teaching/DataScience/CoursePlan/course_plan.html#exams

 

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: www.uva.nl/plagiaat

Weekplanning

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

 Sterk aanbevolen voorkennis voor dit vak zijn de technische vakken binnen Informatiekunde: collectieve intelligentie, databases en datamining.

 

Contactinformatie

Coördinator

  • dr. Maarten Marx

Lecturer: Maarten Marx, http://maartenmarx.nl 
Je kunt de assistenten mailen via datanose