Question

У меня есть DataFrame сгенерированных случайных агентов. Однако я хочу расширить их, чтобы они соответствовали популяции, которую я ищу, поэтому мне нужно повторить строки в соответствии с моими выборочными индексами.

Вот код al oop, который занимает вечность:

df = pd.DataFrame({'a': [0, 1, 2]})    
sampled_indexes = [0, 0, 1, 1, 2, 2, 2]
new_df = pd.DataFrame(columns=['a'])
for i, idx in enumerate(sampled_indexes):
    new_df.loc[i] = df.loc[idx]

Затем исходный DataFrame:

дает мне результат увеличенного нового кадра данных

Итак, этот l oop слишком медленный с DataFrame, содержащий 34 000 или более строк (занимает вечность).

Как сделать это проще и быстрее?

sammywemmy · Answer 1 · 19 июня 2020

Переиндексируйте фрейм данных с помощью sampled_indexes, затем сбросьте индекс.

df.reindex(sampled_indexes).reset_index(drop=True)

Andrej Kesely · Answer 2 · 19 июня 2020

Можно сделать DataFrame.merge:

df = pd.DataFrame({'a': [0, 1, 2]})
sampled_indexes = [0, 0, 1, 1, 2, 2, 2]

print( df.merge(pd.DataFrame({'a': sampled_indexes})) )

Печать:

Как создать новые повторяющиеся строки DataFrame с использованием индексов из исходного DF

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как создать новые повторяющиеся строки DataFrame с использованием индексов из исходного DF

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы