Python: мне нужно извлечь определенные значения из фрейма данных и создать новый фрейм данных - PullRequest
0 голосов
/ 12 июня 2019

Извините за вопрос, но я питон-нуб, и мне нужна помощь.

Итак, у меня есть этот CSV (https://www.kaggle.com/jtrofe/beer-recipes), и мне нужно извлечь определенные значения.

Я хочу создать новый фрейм данных с теми же столбцами и значениями, но я хочу извлечь из столбцов «Стиль» только «Американский IPA, Американский бледный эль, Сайсон, Американский светлый лагер и Американский янтарный эль».И создайте фрейм данных с этим.

Кто-нибудь может мне помочь?

Спасибо!

1 Ответ

0 голосов
/ 12 июня 2019

Я использую индексирование .iloc и генератор логических последовательностей .isin:

import pandas as pd

# Read in the full data set, check its size
original_df = pd.read_csv('recipeData.csv', encoding='latin-1')
print(original_df.size)  # 1698803

# Store your desired styles for filtering in a python list
styles_list = "American IPA, American Pale Ale, Saison, American Light Lager, American Amber Ale".split(', ')

# Filter using .loc and a boolean mask (checking if each 'Style' value is in your list)
new_df = original_df.loc[original_df['Style'].isin(styles_list)]
print(new_df.size)  # 608419
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...