Как получить доступ к определенным данным из таблицы? - PullRequest
0 голосов
/ 28 сентября 2019

Просто скажите, что у меня есть таблица данных для людей со столбцами «Имя», «Возраст» и «Рост».Однако я хочу показать отношения только с людьми по имени «Джордж» и «Том» с возрастом на графике рассеяния.Ниже приведен пример данных:


import pandas as pd
import matplotlib.pyplot as plt

people = (['Tom', 18, 175], ['Steph', 24, 164], ['George', 23, 182],
          ['George', 29, 162], ['Tom', 17, 78], ['Nick', 21, 172.5], ['Harry', 22, 169])

df = pd.DataFrame(people, columns=['Name', 'Age', 'Height(cm)'])

Итак, я хочу построить график только для имени Тома и Джорджа с указанием их возраста, но я не слишком уверен, как получить доступ к определенным элементам столбца таблицы.Извините, я новичок в Python, и это может быть глупый и простой вопрос, но вот что я попробовал:


plt.scatter((df['Name':'Tom'], df['Name':'George']), df['Age'])

Но, очевидно, я не думаю, что вы можете получить к нему доступ таким образом.Любая помощь приветствуется!

1 Ответ

1 голос
/ 28 сентября 2019

Если все, что вам нужно сделать, это установить подкадр данных на определенное значение одного из столбцов, вы можете сделать:

df.loc[df.Name=='Tom']

Если вы хотите создать точечную диаграмму подмножества данных(в данном случае для Тома и Джорджа) вы можете сделать что-то вроде этого:

df.loc[df.Name.isin(['Tom', 'George'])].plot.scatter(x='Age', y='Height(cm)')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...