Как извлечь конкретное значение из формата JSON в столбцы данных панд - PullRequest
1 голос
/ 02 октября 2019

У меня есть файл json, из которого я хочу извлечь определенные значения в столбцы данных, например

    {'Benot':'50455','Madri':'18017','Madrar':'Ossur','Application':'Soft Top Post-op Shoe','Color':'Black','FasteningType':'Contact Closure','Material':'Cotton / Polyester','ShoeSize':'Male 9 to 11','Size':'Large','Style':'Open Toe / Closed Heel','Code':'42241709','User':'Male'}    
    {'Benot':'501455','Madri':'180117','Madrar':'Osur','Application':'SoftShoe','Color':'Black','Material':'Cotton / Polyester','ShoeSize':'Male 9 to 11','Size':'Large','Code':'42241709','User':'Male'}

Проблема в том, что те же данные отсутствуют внутри каждого {}, как в 'ShoeSize': 'Мужчина от 9 до 11 'предварительно установлен в одной строке, но не в другой строке, а для многих других полей

Я просто хочу прочитать «Бено», «Мадри», «Мадрар», «Приложение», «Код»Есть ли какой-либо возможный способ прочитать только это в dataframe, когда я читаю файл, он выдает ошибку

         data = pd.read_csv('McKessonFullData.txt')
 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 9: invalid continuation byte 

Можно ли прочитать определенные значения сохранить его dataframe

1 Ответ

1 голос
/ 02 октября 2019

Кажется, вам нужно read_json с lines=True:

data = pd.read_json('McKessonFullData.txt', lines=True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...