Я пытаюсь получить данные из файла YAML в Pandas DataFrame.Возьмите следующий пример data.yml
:
---
- doc: "Book1"
reviews:
- reviewer: "Paul"
stars: "5"
- reviewer: "Sam"
stars: "2"
- doc: "Book2"
reviews:
- reviewer: "John"
stars: "4"
- reviewer: "Sam"
stars: "3"
- reviewer: "Pete"
stars: "2"
...
Требуемый DataFrame будет выглядеть следующим образом:
doc reviews.reviewer reviews.stars
0 Book1 Paul 5
1 Book1 Sam 2
2 Book2 John 4
3 Book2 Sam 3
4 Book2 Pete 2
Я попытался передать данные YAML в Pandas различными способами (например, with open('data.yml') as f: data = pd.DataFrame(yaml.load(f))
), но ячейки всегда содержат вложенные диктанты.Это решение работает для общих данных JSON , но оно довольно немного кода и кажется, что может существовать более простое решение для YAML.
Существует ли встроенный или Pythonic способ денормализацииYAML для преобразования в Pandas Dataframe?