Доступны слайды четвертой лекции. Темы лекции:

  • Модель N-грамм
  • Оценка вероятности высказывания
  • Сглаживание (Лапласа и Откат)
  • Оценка качества. Тренировочный и проверочный корпуса
  • Задача определения частей речи и существующие подходы к ее решению
  • Алгоритм Витерби и поиск наиболее вероятной последовательности тэгов.