Получение или редактирование строки из столбца в CSV-файле с пандами - PullRequest
0 голосов
/ 10 декабря 2018

Строка моего столбца с именем category выглядит следующим образом:

{"id":342,"name":"Web","slug":"technology/web","position":15,"parent_id":16,"color":6526716,"urls":{"web":{"discover":"http://www.kickstarter.com/discover/categories/technology/web"}}}}

Я хочу изменить этот столбец, чтобы в каждой строке столбца оставалось только число рядом с "parent_id":**16**, как я могу это сделать?такая вещь?

Я пытаюсь получить функцию категории из этого CSV-файла для проекта науки о данных, и это число представляет их.

Я смог прочитать файл и столбецс помощью:

import pandas as pd

df = pd.read_csv(r"filepath")
category = df.category

изменить: мой желаемый столбец будет:

    category
       15
       11
        1
        3
        5

удаление всего, кроме номера parent_id, так как эти числа представляют категорию, как 16 является технологией.Также строки столбца близки к 3800

1 Ответ

0 голосов
/ 10 декабря 2018

Вот, пожалуйста:

import pandas as pd

df = pd.DataFrame(
    {'col1' : [{"id":342,"name":"Web","slug":"technology/web","position":15,"parent_id":16}, 
               {"id":342,"name":"Web","slug":"technology/web","position":15,"parent_id":18}],
     'col2' : ['a', 'b']
    })

pd.concat([df, df['col1'].apply(pd.Series)['parent_id']], axis = 1).drop('col1', axis = 1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...