NameError: имя 'Players_data' не определено - PullRequest
1 голос
/ 08 февраля 2020

Я получил эту ошибку. Как определить Players_Data ?

NameError Traceback (последний последний вызов) в
----> 1 data = np.vstack ((asia [1: ], eu [1:], na [1:], oc [1:], море [1:], Players_data [1:]))
2 df = pd.DataFrame ({data [0, i] : data [1 :, i] для i в диапазоне (data.shape [1])})
3 m = asfloat (data [1 :,: 4])

NameError: имя players_data не определено

asia = open_exl('pubg_as.xls', 0)
eu = open_exl('pubg_eu.xls', 0)
na = open_exl('pubg_na.xls', 0)
oc = open_exl('pubg_oc.xls', 0)
sea = open_exl('pubg_sea.xls', 0)

# Load all data
all_data = np.genfromtxt('PUBG_Player_Statistics.csv', delimiter=',')
all_data[:, 28] = all_data[:, 28] * 100

# Train data
train_data = all_data[1:2000, :][:, [3, 2, 28, 9]]
test_data = all_data[2000:, :][:, [3, 2, 28, 9]]

data = np.vstack((asia[1:], eu[1:], na[1:], oc[1:], sea[1:], players_data[1:]))
df = pd.DataFrame({data[0, i]: data[1:, i] for i in range(data.shape[1])})
m = asfloat(data[1:, :4])

1 Ответ

0 голосов
/ 09 февраля 2020

Трудно понять, какое исходное значение хранилось в Players_data, так как это неполный код другого пользователя; однако, исходя из того, что они делали, я предполагаю, что Players_data:

players_data = train_data

Но почему ??

Они использовали Алгоритм kmeans для создания 6 кластеров, представляющих следующие категории:

['Normal player', 'Waller', 'Experienced Player', 'Both', 'God', 'Aimbot']

В первых 5 переменных, используемых в vstack, у них есть информация от лучших игроков на 5 серверах. Они хотели использовать эту информацию и использовать ее для «обычных игроков».

В конце концов, они не использовали ни «train_data», ни «test_data»; однако в README.md они упомянули следующее:

Причина, по которой мы смешиваем данные из обычного набора данных, состоит в том, чтобы увеличить плотность обычных игроков и сделать кластеризацию жесткой. После теста мы считаем, что 2000 строк данных имеют лучшую производительность.

Важно отметить, что в данных поезда и теста они выбрали 4 столбца:

[3, 2, 28, 9]

Те же столбцы, которые использовались в "файлах с самыми высокими показателями"

def open_exl(address, idx):
    data = xlrd.open_workbook(address)
    table = data.sheets()[idx]
    rows = table.nrows
    ct_data = []
    for row in range(rows):
        ct_data.append(table.row_values(row))
    return np.array(ct_data)[:, :4]

Поскольку в коде есть несоответствия, получить результаты, как они, может быть невозможно. ; тем не менее, это прекрасная возможность поиграть с данными и сравнить полученные результаты с результатами предыдущего исследования.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...