Если вы хотите предсказать новую категорию (в данном случае нет) с тем же классификатором, вы должны предоставить данные обучения, соответствующие этой категории.
Еще одна идея (лучше обсудить здесь: https://stats.stackexchange.com/questions/174856/semi-supervised-classification-with-unseen-classes) - обучить многоклассный классификатор, который назначает предложение одному из диалектов, а затем обучить различные одноклассные классификаторы, по одному для каждого диалекта, что может подтвердить или отрицать предсказания классификатора для нескольких классов.
Пример:
Диалекты A, B, C.
Мультиклассовый классификатор назначает предложение диалекту A.
Одноклассный классификатор для диалекта А классифицирует предложение как диалект А.
Предложение относится к диалекту А.
Мультиклассовый классификатор назначает предложение диалекту A.
Одноклассный классификатор для диалекта A классифицирует предложение как не диалект A.
Приговор принадлежит неизвестному диалекту (нет).