Изменения в системе тестирования

В системе тестирования 1 октября произойдет 2 изменения:

  1. Изменился вход для функции train. Теперь в качестве training_corpus будет передаваться тренировочный корпус в виде, как он был в скачиваемом файле:
    training_corpus = json.load(open(path_to_training_corpus))
    

    Необходимо преобразовать корпус во входной формат классификатора самостоятельно. Это даст возможность фильтровать входные данные произвольным образом. Раньше при преобразовании оставались только те значения, которые были одинаково размечены всеми людьми. То есть, если три человека размечало текст и характеристику "Цены" отметили как позитивную только двое, то она не попадала в корпус.

  2. Использовалась F1-мера без параметров. Теперь будет использоваться F1-мера с параметром " average='micro' ". См. документацию scikit-learn.