DataPrame Python Pandas Заменить NaN значениями из списка - PullRequest
0 голосов
/ 31 октября 2018

Я пытаюсь заменить мою колонку на NaN

group_choices = ['Group1', 'Group2', 'Group3']

Groups limit
1 NaN NaN
2 Group1 2
3 Group2 2
4 Group3 2
5 NaN NaN
6 NaN NaN
7 NaN NaN

Как я могу заменить NaN случайным образом на основе group_choises?

Я также пытаюсь ограничить частоту выбора group_choise из-за предельного значения в столбце limit.

Я пытаюсь получить такой результат:

Groups limit
1 Group3 NaN
2 Group1 2
3 Group2 2
4 Group3 2
5 Group1 NaN
6 Group2 NaN
7 Out of groups

1 Ответ

0 голосов
/ 31 октября 2018

fillna со словарями

dct = dict(zip(df.Groups.loc[pd.isna].index, group_choices))

df.fillna({'Groups': dct}).fillna({'Groups': 'Out of groups'})

          Groups  limit
1         Group1    NaN
2         Group1    2.0
3         Group2    2.0
4         Group3    2.0
5         Group2    NaN
6         Group3    NaN
7  Out of groups    NaN

Старые ответы

Полезно, но мне больше нравится новый. Это иллюстрирует эволюцию моего мыслительного процесса.

Генераторы

def get_some(i, n):
  for x in [*i] * n:
    yield x

def fill(s, i, n):
  gs = get_some(i, n)
  for x in s:
    if pd.isnull(x):
      try:
        yield next(gs)
      except StopIteration:
        yield "Out of groups"
    else:
      yield x

df.assign(Groups=[*fill(df.Groups, group_choices, 1)])

          Groups  limit
1         Group1    NaN
2         Group1    2.0
3         Group2    2.0
4         Group3    2.0
5         Group2    NaN
6         Group3    NaN
7  Out of groups    NaN

Альтернативный

def get_some(i, n):
  for x in [*i] * n:
    yield x

df.assign(Groups=df.Groups.fillna(
    df.Groups.loc[pd.isna].pipe(
        lambda s: pd.Series(dict(zip(s.index, get_some(group_choices, 1))))
    )
).fillna('Out of groups'))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...