Natuurlijke Taalmodellen en Interfaces

Natural Language Models and Interfaces

6 EC

Semester 2, periode 4

5082NTIT6Y

Eigenaar Bachelor Kunstmatige Intelligentie
Coördinator W. Ferreira Aziz
Onderdeel van Minor Kunstmatige Intelligentie, jaar 1Bachelor Kunstmatige Intelligentie, jaar 2

Studiewijzer 2017/2018

Globale inhoud

Natural language is the main channel of communication between humans, and much of human knowledge is represented in the form of natural language. Enabling computers to understand it is an extremely important task, and is one of the core problems of artificial intelligence. Though full understanding still remains a remote goal, robust methods have been developed for more shallow forms of processing, and these methods and corresponding formalisms are the focus of this course.  

In part I of this course you learn about formalisms and techniques to assign probabilities to (parts of) sentences (language modeling) and to perform the most basic form of syntactic processing (assigning word classes to words in a sentence). In part II of the course, we will look into techniques to predict syntactic structure (syntactic parsing) and semantic structure (compositional semantic structure and predicate-argument structure). Together, these two parts give an overview of basic techniques in current data-driven computational linguistics providing the building blocks for speech recognition, language understanding and machine translation systems.

Studiemateriaal

Literatuur

  • Daniel Jurafsky & James H. Martin, 'Speech and Language Processing' (2nd Edition) Pearson Prentice Hall, 2009.
  • Additional reading: Manning & Schuetze. 'Foundations of Statistical Natural Language Processing', 1999

Leerdoelen

  • Introduction to methods for natural language processing in AI
  • skills in statistical modeling and algorithms on graphs
  • experience with programming languages
    ­

Students will acquire knowledge of the major techniques used in modern computational linguistics for syntactic and semantic processing of natural language sentences. This includes ngram- and HMM-based language modeling, PCFG-based parsing, prediction of underlying predicate-argument structure, basics of statistical machine translation.

Skills: Programming and linux skills, joint work in groups.

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • (Computer)practicum

The class will consist of a theoretical course and practical sessions. There will be no compulsory attendance for the practical session.

Verdeling leeractiviteiten

Activiteit

Aantal uur

Computerpracticum

24

Deeltoets

4

Hoorcollege

24

Zelfstudie

116

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Voor practica en werkgroepbijeenkomsten met opdrachten geldt een aanwezigheidsplicht. De invulling van deze aanwezigheidsplicht kan per vak verschillen en staat aangegeven in de studiewijzer. Wanneer studenten niet voldoen aan deze aanwezigheidsplicht kan het onderdeel niet met een voldoende worden afgerond. .

Toetsing

Onderdeel en weging Details

Eindcijfer

40%

Programming Assignments

Moet ≥ 5 zijn

20%

Other assignments (theory)

Moet ≥ 5 zijn

40%

Deeltoets (final exam)

Moet ≥ 5 zijn, Herkansbaar

The grade will be 40% programming assignments, 20% theoretical assignments,  and 40% written final exam.

The partial grade for the theoretical assignments, the practical assignments and the exam need to be at least a 5,0 (Dutch scaling) each in order to pass the course.

Opdrachten

Onderstaande opdrachten komen aan bod in deze cursus:

  •    Naam opdracht 1 : beschrijving 2
  •    Naam opdracht 2 : beschrijving 1
  •    ....

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: www.uva.nl/plagiaat

Weekplanning

Weeknummer Onderwerpen Studiestof
1
2
3
4
5
6
7
8

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

The course will be taught in English.

Prerequisite skills: Basic probability theory, programming in python or java. 

 

Contactinformatie

Coördinator

  • W. Ferreira Aziz