Search Engines
6 EC
Semester 1, periode 1
5082ZOEK6Y
| Eigenaar | Bachelor Kunstmatige Intelligentie |
| Coördinator | dr. Maarten Marx |
| Onderdeel van | Minor Kunstmatige Intelligentie, jaar 1Bachelor Kunstmatige Intelligentie, jaar 3 |
Zoekmachines zoals Google, Bing, en Yahoo zijn niet weg te denken uit het alledaagse gebruik van het Internet. De meeste gebruikers staan niet stil bij de onderliggende technieken maar toch is een basisbegrip van hoe zoekmachines werken essentieel voor iedereen die zoekmachines in een professionele omgeving wil inzetten. In deze cursus bespreken we hoe zoekmachines werken, wat hun beperkingen zijn en wat de trends op het gebied van zoekmachine-technologieën zijn.
De cursus behandelt de volgende onderwerpen:
We sluiten de cursus af met het zelf bouwen van een zoekmachine gebruik makend van ElasticSearch, de top technologie van dit moment. Studenten zijn vrij in het kiezen van de verzameling documenten die doorzocht kan gaan worden, als het maar veel is. Typische voorbeelden zijn 50 jaar aan Telegraaf artikelen, de Nederlandse Wikipedia, miljoenen songteksten.
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. Gratis te verkrijgen op http://nlp.stanford.edu/IR-book/
Hearst, M.A. Search User Interfaces, Cambridge University Press, September, 2009. Read it online.
Hearst, M. User Interfaces for Search, Chapter 2 of Modern Information Retrieval: The Concepts and Technology behind Search (2nd Edition), Addison Wesley, 2011. official chapter pdf unofficial chapter pdf, but includes the references, the book
Clinton Gormley, Zachary Tong. Elasticsearch: The Definitive Guide. https://www.elastic.co/guide/en/elasticsearch/guide/current/index.html
Each lecture will be accompanied by lecture notes and/or slides.
These notes are typically IPython Notebooks or MarkDown files. Zie http://maartenmarx.nl/teaching/zoekmachines/
Aan het eind van het vak is de student in staat om:
Daarnaast doet de student ervaring op met het maken van IR systemen in Python, MySQL, en ElasticSearch (waaronder een systeem met miljoenen documenten).
12 uur hoorcollege
24 uur werkcollege
4 uur tentamen
10 minuten presentatie
rest = zelfstudie en maken van opdrachten
Aanwezigheidseisen opleiding (OER-B):
Aanvullende eisen voor dit vak:
Er zijn geen aanwezigheidseisen voor dit vak.
| Onderdeel en weging | Details |
|
Eindcijfer | |
|
35% Digitale Toets 1 | |
|
35% Digitale Toets 2 | |
|
10% tekst classificatie opdracht | |
|
20% Eind-zoekmachine opdracht |
You pass the course if your mean grade for the two exams is at least 5.5 and the mean weighted grade of your assignments is at least 5.5.
For the exams there is a resit. Not for the assignments.
De opdrachten worden gemaakt in groepjes van 4.
De manier van inzage wordt via de digitale leeromgeving gecommuniceerd.
Inzage van het eerste deeltentamen vindt plaats na het responsiecollege daarover in week 4
Zie http://maartenmarx.nl/teaching/zoekmachines/CoursePlan/course_plan.html#exams
voor een beschrijving van de opdrachten.
Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl
Het rooster van dit vak is in te zien op DataNose.
Bovenstaande informatie kan allemaal nog wijzigen. Gebruik voor de exacte opgaven en de stof voor elke week altijd de site http://maartenmarx.nl/teaching/zoekmachines/
Hieronder vind je de aanpassingen in de opzet van het vak naar aanleiding van de vakevaluaties.
* betere spreiding van de stof over de 2 helften
* nieuw onderwerp toegevoegd: recommender systems
* niet meer elke week huiswerk voor een cijfer