Как читать данные по категориям в отдельные вариабельные области - PullRequest
0 голосов
/ 08 мая 2018
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
dataFileName='RFInput.xlsx'
sheetName='Rawdata'
sheetNamePara='paraList'
dataRaw=pd.read_excel(dataFileName, sheetname = sheetName)
datapara=pd.read_excel(dataFileName, sheetname = sheetNamePara)

noData=len(dataRaw)
import matplotlib.pylab as plt
from sklearn.cross_validation import train_test_split
from sklearn.cross_validation import cross_val_score
from sklearn.preprocessing import StandardScaler


labels = datapara
x = dataRaw[labels]
y = dataRaw['classVariable']

В RFInput.xlsx, sheetname = "paraList", у меня есть список параметров, данные которых мне нужно извлечь из Rawdata. В paraList первая строка - это имена переменных, а во 2-й строке я пометил категорию каждой переменной как Y или N. Я хочу прочитать данные переменных категории Y в x_Y, а данные переменных N категории - в x_N.

classVariable   Category    Group Category.pare Status.dist
N                 N                Y               N
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...