У меня есть модель CRF (Тип объекта: sklearn_crfsuite.estimator.CRF
), в которой данные объектов представлены в формате utf8
. Модель работает нормально с точки зрения прогнозирования. Теперь я хочу получить представление о модели CRF.
Чтобы сделать это всякий раз, когда я пытался напечатать crf.attributes_
, crf.state_features_
и crf.transition_features_
, я получаю следующие ошибки:
Traceback (most recent call last):
File "C:\Users\user123\eclipse-workspace\xxx_path\standalone scripts\crfModelAnalysis.py", line 20, in <module>
print_transitions(Counter(crf.transition_features_).most_common(k))
File "C:\Python27\lib\site-packages\sklearn_crfsuite\estimator.py", line 490, in transition_features_
if self._info is None:
File "C:\Python27\lib\site-packages\sklearn_crfsuite\estimator.py", line 499, in _info
self._info_cached = self.tagger_.info()
File "pycrfsuite\_pycrfsuite.pyx", line 704, in pycrfsuite._pycrfsuite.Tagger.info
File "pycrfsuite\_pycrfsuite.pyx", line 706, in pycrfsuite._pycrfsuite.Tagger.info
File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x80 in position 27: invalid start byte
Основная информация:
Модель сохраняется в формате pickle
.
Python Version : 2.7
sklearn-crfsuite==0.3.6
Любая помощь будет высоко оценена.