Zoekmachines

Search Engines

6 EC

Semester 1, periode 1

5082ZOEK6Y

Eigenaar Bachelor Kunstmatige Intelligentie
Coördinator dr. Maarten Marx
Onderdeel van Minor Kunstmatige Intelligentie, jaar 1Bachelor Kunstmatige Intelligentie, jaar 3

Studiewijzer 2018/2019

Globale inhoud

Zoekmachines zoals Google, Bing, en Yahoo zijn niet weg te denken uit het alledaagse gebruik van het Internet. De meeste gebruikers staan niet stil bij de onderliggende technieken maar toch is een basisbegrip van hoe zoekmachines werken essentieel voor iedereen die zoekmachines in een professionele omgeving wil inzetten. In deze cursus bespreken we hoe zoekmachines werken, wat hun beperkingen zijn en wat de trends op het gebied van zoekmachine-technologieën zijn.

De cursus behandelt de volgende onderwerpen:

  • Inleiding zoekmachine technologie
  • Representatie van documenten
  • Ordenen van documenten op relevantie gegeven een zoekvraag
  • Menselijke interactie en zoektechnologie
  • Classificatie van tekst over meerdere categorieën
  • Goed rankings leren uit voorbeelden
  • Software voor het maken van een zoekmachine.

We sluiten de cursus af met het zelf bouwen van een zoekmachine gebruik makend van ElasticSearch, de top technologie van dit moment. Studenten zijn vrij in het kiezen van de verzameling documenten die doorzocht kan gaan worden, als het maar veel is. Typische voorbeelden zijn 50 jaar aan Telegraaf artikelen, de Nederlandse Wikipedia, miljoenen songteksten.

Studiemateriaal

Literatuur

Overig

Leerdoelen

Aan het eind van het vak is de student in staat om:

  • de belangrijkste onderdelen van moderne Information Retrieval systemen te beschrijven, uit te leggen en toe te passen;
  • de waarde van gebruikers interfaces voor information retrieval systemen te beschrijven, uit te leggen en toe te passen;
  • de potentie van information retrieval technieken voor de informatie maatschappij van vandaag te beschrijven, uit te leggen en toe te  passen;
  • een prototype IR systeem voor flinke gegevensbestanden te bouwen op basis van bestaande off-the-shelf software;

Daarnaast doet de student ervaring op met het maken van  IR systemen in Python, MySQL, en ElasticSearch (waaronder een systeem met miljoenen documenten).

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • Laptopcollege

Verdeling leeractiviteiten

12 uur hoorcollege

24 uur werkcollege

4 uur tentamen

10 minuten presentatie

rest = zelfstudie en maken van opdrachten

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Voor practica en werkgroepbijeenkomsten met opdrachten geldt een aanwezigheidsplicht. De invulling van deze aanwezigheidsplicht kan per vak verschillen en staat aangegeven in de studiewijzer. Wanneer studenten niet voldoen aan deze aanwezigheidsplicht kan het onderdeel niet met een voldoende worden afgerond.

Aanvullende eisen voor dit vak:

Er zijn geen aanwezigheidseisen voor dit vak.

Toetsing

Onderdeel en weging Details

Eindcijfer

35%

Digitale Toets 1

35%

Digitale Toets 2

10%

tekst classificatie opdracht

20%

Eind-zoekmachine opdracht

You pass the course if your mean grade for the two exams is at least 5.5 and the mean weighted grade of your assignments is at least 5.5.
For the exams there is a resit. Not for the assignments.

 

De opdrachten worden gemaakt in groepjes van 4. 

Inzage toetsing

De manier van inzage wordt via de digitale leeromgeving gecommuniceerd.

Inzage van het eerste deeltentamen vindt plaats na het responsiecollege daarover in week 4

Opdrachten

Zie http://maartenmarx.nl/teaching/zoekmachines/CoursePlan/course_plan.html#exams   

voor een beschrijving van de opdrachten.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

Bovenstaande informatie kan allemaal nog wijzigen. Gebruik voor de exacte opgaven en de stof voor elke week altijd de site  http://maartenmarx.nl/teaching/zoekmachines/

Verwerking vakevaluaties

Hieronder vind je de aanpassingen in de opzet van het vak naar aanleiding van de vakevaluaties.

* betere spreiding van de stof over de 2 helften

* nieuw onderwerp toegevoegd: recommender systems

* niet meer elke week huiswerk voor een cijfer

Contactinformatie

Coördinator

  • dr. Maarten Marx

Docenten

  • H. Azarbonyad MSc
  • Rolf Jagerman
  • Jiahuan Pei MSc
  • Maarten Marx