Как загрузить набор данных Weka из pandas кадра данных в python - PullRequest
0 голосов
/ 11 февраля 2020

В настоящее время я устанавливаю pandas фрейм данных в csv и загружаю его как набор данных weka из загрузчика CSV. Существует ли механизм для прямой загрузки pandas фрейма данных в набор данных weka без создания промежуточного CSV-файла между

learn_df = pd.DataFrame.from_records([s.to_dict() for s in learnList])
header = ["reviewId","word","type","positive_sentiment","negative_sentiment","number_of_noun","sentence","hasNeg","overallSentiment","sentiment"]
learn_df.to_csv(helper.get_data_dir() + os.sep + "resultTest.csv", index=None, header=True,columns=header)
diabetes_file = helper.get_data_dir() + os.sep + "resultTest.csv"
helper.print_info("Loading dataset: " + diabetes_file)
loader = Loader("weka.core.converters.CSVLoader")

diabetes_data = loader.load_file(diabetes_file)
remove = Filter(classname="weka.filters.unsupervised.attribute.Remove", options=["-R", "1,2,7"])
remove.inputformat(diabetes_data)
filtered = remove.filter(diabetes_data)
//code to classify instances here

Каждый раз, когда преобразование в csv и загрузка из csv для классификации делает это дорогостоящим процессом. Есть ли механизм, чтобы избежать этого?

1 Ответ

1 голос
/ 09 апреля 2020

@ Mani sh Вы можете преобразовать кадр данных pandas в список или матрицу numpy, а затем использовать методы weka create_instances_from_lists () и create_instances_from_matrices ().

Для получения более подробной информации вы можете посмотреть примеры weka на http://fracpete.github.io/python-weka-wrapper/examples.html

...