Я совсем новый пользователь python, и я импортировал огромную базу данных, которая выглядит примерно так:
df = pd.DataFrame(
{'name': ["apple", "orange", "banana"],
'attr': ["yeoolw, red, white", "red", "yellow, black"]
}
)
df.head()
, и мне нужно получить что-то вроде:
df_new = pd.DataFrame(
{'name': ["apple", "apple","apple","orange", "banana","banana"],
'attr': ["yeoolw", "red", "white", "red", "yellow", "black"]
}
)
df_new.head(6)
очевидно, что существует много разных случаев, единственное правило состоит в том, что в конце я должен получить базу данных только с одним атрибутом для каждого имени и повторить имя, где есть несколько атрибутов по порядку Чтобы не пропустить информацию, может ли кто-нибудь предложить мне лучшее и менее затратное по времени решение этой проблемы?
Большое спасибо за вашу помощь