Я работаю с Python в Bigquery и у меня большой фрейм данных (около 7 м строк).У меня также есть список lst, содержащий некоторые даты (скажем, все дни в данном месяце).
Я пытаюсь создать дополнительный столбец "random_day" в df со случайным значением lst в каждой строке.
Я попытался запустить цикл и применить функцию, но, будучи довольно большим набором данных, он оказался сложным.
Мои попытки пройдены по циклическому решению:
df["rand_day"] = ""
for i in a["row_nr"]:
rand_day = sample(day_list,1)[0]
df.loc[i,"rand_day"] = rand_day
И примените решение, определив сначала мою функцию, а затем вызвав ее:
def random_day():
rand_day = sample(day_list,1)[0]
return day
df["rand_day"] = df.apply(lambda row: random_day())
Любые подсказки на этот счет?Спасибо