Экзамен и проставление оценок

December 24, 2013 Денис Турдаков

Сдать экзамен или поставить полученную оценку в зачетку/ведомость можно приехав в ИСП РАН. Перед этим рекомендую написать мне письмо и договориться о времени. В университете я буду скорее всего только в январе.

Денис.

Билеты к экзамену

November 27, 2013 Денис Турдаков

Выкладываю новые билеты к экзамену (осенний семестр 2013).

Исправлена ошибка в 3 лекции

November 6, 2013 Денис Турдаков

В 21-м слайде лекции 3 (Языковые модели) была неправильная информация. Вопрос вызывала формула $\sum_{i,j} p(w_n|w_i,w_j)=1$ .

Эта формула относится к оценки вероятности N-граммы на основе метода максимального правдоподобия и означает вероятность события, что слово $w_n$ встретилось в одном из всех возможных контекстах, в которых оно встречалось. То есть выполняется всегда.
В случае, когда применяется сглаживание откатом к модели меньшего порядка (вероятность n-граммы равна $0$ ) необходимо сбалансировать вероятности всех n-грамм, так чтобы сумма вероятностей заданного слова во всех контекстах (в том числе и меньших порядков) была равна $1$ .

В разделе 6.4 основного учебника приводится подробный вывод коэффициента $\alpha$ . Всем интересующимся рекомендую заглянуть туда.

PS. Спасибо внимательным студентам за вопрос. Слайд в лекциях исправлен.

Слайды лекций 2012 года

October 3, 2013 Денис Турдаков Leave a comment

Лекция	Слайды
Лекция 1. Задачи обработки текстов	lecture1-2012.pdf
Лекция 2. Регулярные выражения и конечные автоматы	lecture2-2012.pdf
Лекция 3. Методы поиска словосочетаний	lecture3-2012.pdf
Лекция 4. Языковые модели и задача определения частей речи	lecture4-2012.pdf
Лекция 5. Контекстно-свободные грамматики и синтаксический анализ	lecture5-2012.pdf
Лекция 6. Статистические методы синтаксического анализа	lecture6-2012.pdf
Лекция 7. Лексическая семантика	lecture7-2012.pdf
Лекция 8. Вопросно-ответные системы и автоматическое реферирование	lecture8-2012.pdf
Лекция 9. Машинный перевод	lecture9-2012.pdf

Первая лекция в осеннем семестре 2013 года

September 18, 2013 Денис Турдаков Leave a comment

Первое занятие состоится в аудитории 612 в пятницу 4-го октября в 18.00. На вводной лекции будут рассмотрены классические задачи обработки текстов и типичные проблемы, возникающие при решении этих задач. Также будут обсуждаться некоторые организационные моменты.

Приглашаются все, кто хочет понять, о чем будет спецкурс, и что нужно для того чтобы успешно его завершить.