Category Archives: Uncategorized

Лекция 7. Лексическая семантика

Доступны слайды седьмой лекции. На лекции обсуждаются

Основные понятия лексической семантики

  • Слова и отношения между ними
  • Словари и тезаурусы

Вычислительная семантика

  • Разрешение лексической многозначности
  • Семантическая близость слов
  • Некоторые современные направления

 

Лекция 4. Языковые модели и задача определения частей речи

Доступны слайды четвертой лекции. Темы лекции:

  • Модель N-грамм
  • Оценка вероятности высказывания
  • Сглаживание (Лапласа и Откат)
  • Оценка качества. Тренировочный и проверочный корпуса
  • Задача определения частей речи и существующие подходы к ее решению
  • Алгоритм Витерби и поиск наиболее вероятной последовательности тэгов.

Лекция 3. Статистические методы поиска словосочетаний

Слайды третьей лекции доступны на сайте. Вопросы рассматриваемые на лекции:

  • словосочетания и коллокации
  • словосочетания в различных приложениях, в том числе в задаче выделения ключевых слов
  • статистические методы поиска словосочетаний (частота, фильтрация по тэгам, мат. ожидание и дисперсия)
  • применение статистических критериев для поиска словосочетаний (T-критерий Стьюдента, критерий Хи-квадрат, критерий отношения правдоподобия)

 

Лекция 2. Регулярные выражения и конечные автоматы

Доступны слайды второй лекции (lecture2.pdf). Рассматриваемые темы:

  • формальные языки;
  • регулярные выражения и их практическое применение;
  • детерминированные и недетерминированные конечные автоматы;
  • регулярные языки;
  • связь конечных автоматов, регулярных выражений и регулярных языков.