Как получить прогнозы и рассчитать точность для заданного набора тестов в быстром AI? - PullRequest
1 голос
/ 13 июля 2020

Я пытаюсь загрузить учащегося, который был экспортирован learn.export(), и хочу запустить его на тестовом наборе. Я хочу, чтобы у моего тестового набора были метки, чтобы я мог измерить его точность.

Это мой код:

test_src = (TextList.from_df(df, path, cols='texts')
            .split_by_rand_pct(0.1, seed=42)
            .label_from_df(cols='recommend'))

learn_fwd = load_learner(path + '/fwd_learn_c', 
                         test=test_src) #, tfm_y=False)


pred_fwd,lbl_fwd = learn_fwd.get_preds(ds_type=DatasetType.Test,ordered=True) 
accuracy(pred_fwd, lbl_fwd)

И я получил следующую ошибку, которая, по-видимому, не принимает помеченный набор данных !!

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-22-7f52f2136d8e> in <module>
      6 
      7 learn_fwd = load_learner(path + '/fwd_learn_c', 
----> 8                          test=test_src) #, tfm_y=False)
      9 learn_bwd = load_learner(path + '/bwd_learn_c',
     10                          test=test_src) #, tfm_y=test_src)

~/miniconda3/lib/python3.7/site-packages/fastai/basic_train.py in load_learner(path, file, test, tfm_y, **db_kwargs)
    622     model = state.pop('model')
    623     src = LabelLists.load_state(path, state.pop('data'))
--> 624     if test is not None: src.add_test(test, tfm_y=tfm_y)
    625     data = src.databunch(**db_kwargs)
    626     cb_state = state.pop('cb_state')

~/miniconda3/lib/python3.7/site-packages/fastai/data_block.py in add_test(self, items, label, tfms, tfm_y)
    562         "Add test set containing `items` with an arbitrary `label`."
    563         # if no label passed, use label of first training item
--> 564         if label is None: labels = EmptyLabelList([0] * len(items))
    565         else: labels = self.valid.y.new([label] * len(items)).process()
    566         if isinstance(items, MixedItemList): items = self.valid.x.new(items.item_lists, inner_df=items.inner_df).process()

TypeError: object of type 'LabelLists' has no len()

1 Ответ

1 голос
/ 13 июля 2020

Кажется, что для тестового набора он просто принимает ItemList (без ярлыков). В приведенном выше примере я передал ему LabelList, который является источником ошибки. В любом случае, чтобы получить точность для тестового набора, я нашел следующее решение:

# Create your test set:
data_test = (TextList.from_df(df, path, cols='texts')
            .split_by_rand_pct(0.1, seed=42)
            .label_from_df(cols='recommend'))

data_test.valid = data_test.train
data_test=data_test.databunch()

# Set the validation set of the learner by the test data you created
learn.data.valid_dl = data_test.valid_dl

# Now y refers to the actual labels in the data set
preds, y = learn.get_preds(ds_type=DatasetType.Valid)
acc = accuracy(preds, y)

# Alternatively you can call validate if you don't want the predictions

acc = learn.validate()[1]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...