Могу ли я использовать машинное обучение на примере ниже набора данных - PullRequest
0 голосов
/ 10 октября 2019

Образец набора данных

Можно ли использовать какой-либо алгоритм для обучения над набором данных? Потому что каждая строка (Id) имеет зависимую переменную (статус). Но каждый «Id» снова в виде нескольких строк в соответствии с возможностями, которые можно принять как «Каждый Id имеет несколько транзакций и все транзакции имеют общий статус». Будет ли машинное обучение находить некоторые шаблоны из этих транзакций

Есть ли какой-либо другой подход? решить проблемы такого типа

Ответы [ 2 ]

1 голос
/ 10 октября 2019

Просто заполните строку идентификатора значением из вышеуказанной строки, то же самое для строки состояния, это приведет к:

df
ID Feature1 Feature2 Feature3 Status
8079 100    Asia      High    Approved
8079 200    Africa    Low     Approved

Когда вы запускаете алгоритм классификации, вы можете использовать: ID, Feature1, Feature2, Feature3как функции и статус в качестве цели. Классификатор будет учиться с этим, и все совершенно так же, как и раньше. Функции по-прежнему независимы. Зависимость функций у вас будет только в том случае, если переменные каким-то образом зависят друг от друга, в вашем случае ID 8079 не приводит к Feature1: Africa. Они независимы.

Вы можете заполнить свои ячейки следующими словами:

import numpy as np
df[df[0]==""] = np.NaN
df.fillna(method='ffill')

Исходя из ваших комментариев, подход может быть немного другим, вам нужно преобразовать свои записи в новые функции ( Python-панды преобразуют строки в столбцы, в которых существует несколько столбцов ): кадр данных должен выглядеть следующим образом:

ID Feature1 Feature2 Feature3  Feature1a .... Feature3z Status
8079 100    Asia      High    200                       Approved
0 голосов
/ 10 октября 2019

вы можете предположить, что каждая строка независима, и игнорировать столбец id, или, если у каждого идентификатора есть 3 строки, вы можете расширить набор данных с помощью дополнительных функций

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...