Итоги 2012 года

Итак, экзамен прошел, время подвести итоги.

На курс зарегистрировались 40 человек. Успешно завершили практическое задание и были допущены к экзамену 26 человек. Результаты экзамена:

По результатам практической части выкладываю top 9 лучших решений:

  1. zyxn52 (Кирилл Гаврилюк)
  2. nezabudka (Анна Потапенко)
  3. woxalex (Александр Сапатов)
  4. Esuqive (Виктория Петушкова)
  5. giz (Александр Акципетров)
  6. miryable (Татьяна Новикова)
  7. Yodikus (Владимир Марулин)
  8. tanunia (Татьяна Кривошеева)
  9. desa (мое простое решение)
Проверочный корпус доступен по ссылке: tpc-secret.zip.

 

Лекция 7. Лексическая семантика

Доступны слайды седьмой лекции. На лекции обсуждаются

Основные понятия лексической семантики

  • Слова и отношения между ними
  • Словари и тезаурусы

Вычислительная семантика

  • Разрешение лексической многозначности
  • Семантическая близость слов
  • Некоторые современные направления

 

Лекция 4. Языковые модели и задача определения частей речи

Доступны слайды четвертой лекции. Темы лекции:

  • Модель N-грамм
  • Оценка вероятности высказывания
  • Сглаживание (Лапласа и Откат)
  • Оценка качества. Тренировочный и проверочный корпуса
  • Задача определения частей речи и существующие подходы к ее решению
  • Алгоритм Витерби и поиск наиболее вероятной последовательности тэгов.

Лекция 3. Статистические методы поиска словосочетаний

Слайды третьей лекции доступны на сайте. Вопросы рассматриваемые на лекции:

  • словосочетания и коллокации
  • словосочетания в различных приложениях, в том числе в задаче выделения ключевых слов
  • статистические методы поиска словосочетаний (частота, фильтрация по тэгам, мат. ожидание и дисперсия)
  • применение статистических критериев для поиска словосочетаний (T-критерий Стьюдента, критерий Хи-квадрат, критерий отношения правдоподобия)