У меня есть очень большой фрейм данных панды со строками для каждых десяти минут года. Один столбец данных имеет название 'квартал' и равен 1 для января-марта, 2 для апреля по 3 июня, 3 июля для октября и т. Д.
Теперь я хочу добавить определенное количество значений в другой столбец, но только если это в первом квартале, и я хочу добавить их случайным образом.
Это самое близкое, что у меня есть:
dfupdate=test_df.sample(5000)
dfupdate.status='TEST'
test_df.update(dfupdate)
Но это разделит 5000 записей на целый год, а я хочу их только в первом квартале.
В основном мне нужен алгоритм, который добавляет определенное количество значений к одному столбцу во все строки, где другой столбец имеет значение один.
На следующем шаге я хотел бы изменить следующие строки строки с определенным значением. Поэтому, если значение, добавленное мной на первом шаге ('TEST'), найдено, оно должно добавить его к следующим x строкам.
Надеюсь, вы понимаете мою проблему, и я был бы очень благодарен, если бы кто-нибудь смог мне помочь.
С наилучшими пожеланиями,
Элиас