Как указать столбец для numpy для разделения набора данных?
Сейчас я пытаюсь разделить набор данных, который у меня есть, который имеет следующий формат, это элементы данных,
{
"tweet_id": "1234456",
"tweet": "hello world",
"labels": {
"item1": 2,
"item2": 1
}
},
{
"tweet_id": "567890976",
"tweet": "testing",
"labels": {
"item1": 2,
"item2": 1,
"item3": 1,
"item4": 1
}
}
на данный момент работающий метод получает только tweet_ids в списке и разделяет его, но я хотел бы знать, есть ли метод для прямого разделения этого файла json с помощью numpy.split ()
TRAINPCT = 0.50
DEVPCT = 0.25
TESTPCT = 1 - TRAINPCT - DEVPCT
train, dev, test = np.split(dataitems, [int(TRAINPCT * len(dataitems)), int((TRAINPCT+DEVPCT) * len(dataitems))])
это просто выкидывает и ошибка
OrderedDict([('tweet_id', '1234456'), ('tweet', "hello world""), ('labels', Counter({'item1': 2, 'item2': 1}))])],
dtype=object) is not JSON serializable
Спасибо