Question

Я работаю над проектом анализа настроений и начинаю изучать Python.Мне нужно вычислить отзыв, точность и f-меру, но я не знаю синтаксис для моих наборов данных, которые выглядят так:

#The train data format ,contains text's words with their weights and the text's class label

train_set = [
    ({'adam': 0.05,'is': 0.0, 'a': 0.0, 'good': 0.02, 'man': 0.0}, 1),
    ({'eve': 0.0, 'is':  0.0, 'a':  0.0,'good':  0.02,'woman': 0.0}, 1),
    ({'adam': 0.05, 'is': 0.0, 'evil': 0.0}, 0)]

#0 or 1 for class label

#Test data the same as train data

Это мой текущий код

from nltk.classify import apply_features

def naivebyse(finaltfidfVector):
    train_set = []
    j = 0
    for vector in finaltfidfVector:
        if j < 2100: #take 70% of data for train
            train_set.append(vector)
            j += 1
        else:
            break

    test_set = []
    j = 0
    for vector in finaltfidfVector:
        if j < 3000 and j >= 2100: # 30% for test
            test_set.append(vector)
        if j>= 3000:
            break
        j += 1

    classifier = nltk.NaiveBayesClassifier.train(train_set)
    print("Accuracy of sarcasm classifier : ", 
     (nltk.classify.accuracy(classifier, test_set)*100))
    refsets = collections.defaultdict(set)
    testsets = collections.defaultdict(set)

    for i, (feats, label) in enumerate(test_set):
        refsets[label].add(i)
        observed = classifier.classify(feats)
        testsets[observed].add(i)

    print("Precision percentage : " , nltk.metrics.precision(refsets['1'], 
    testsets['1'])*100)
    print("Recall Percentage : ", nltk.metrics.recall(refsets['1'], 
    testsets['1'])*100)

Исключение

Exception in Tkinter callback
unable to realloc 20234 bytes

Кто-нибудь может дать несколько советов о том, как выполнить задачу?

Stam Tiniakos · Answer 1 · 22 июня 2019

Вы можете использовать библиотеку scikit-learn для этого, например, с

from sklearn.metrics import accuracy_score, f1_score, precision_score, recall_score, classification_report, confusion_matrix

f1 = f1_score(y_test, y_pred)

prec = precision_score(y_test, y_pred)

recall = recall_score(y_test, y_pred) `

Не уверен, относится ли это к вашему набору данных, но рекомендуется выполнять перекрестную проверку также.

Как рассчитать отзыв, точность и f-меру?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как рассчитать отзыв, точность и f-меру?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы