поиск столбца во фрейме данных для строкового значения - PullRequest
0 голосов
/ 24 декабря 2018

Я пытаюсь увидеть, находится ли строка из текущего фрейма данных внутри нового фрейма, посмотрев на строковое значение concept.

Но я получаю

«Ошибка типа: объекты Series являются изменяемыми, поэтому их нельзя хэшировать».

Я пробовал другие методы, которые также приводили к различным ошибкам, любая помощь приветствуется!

df = pd.read_csv('holder.csv', names = ['concept','frequency'])

newdf = pd.DataFrame(columns = ['concept','frequency'])
for index1, row1 in df.iterrows():
    if newdf.empty:
        row1 = row1.fillna(1)
        newdf = newdf.append(row1,ignore_index=True)
    elif newdf(newdf.concept == row1[0]):
        row1 = row1.fillna(1)


  newdf = newdf.append(row1,ignore_index=True)

edit1: я пытаюсь отделить файл holder.csv (который содержит строковые значения и дубликаты), так что конечным результатом является другой файл CSV, в котором каждая запись уникальна и хранит частоту строкового значения (т. Е. Получаются дубликаты).добавлено в частоту)

holder.csv

  1. принятие решения
  2. авторитетное местоположение
  3. местоположение
  4. принятие решения

end.csv

  1. принятие решения, 2
  2. авторитетное местоположение, 1
  3. местоположение, 1

1 Ответ

0 голосов
/ 24 декабря 2018

IIUC, конечный csv может быть достигнут просто с помощью groupby

при условии, что ваше имя столбца равно A

    A
0   decision making
1   authoritative location
2   location
3   decision making

>>df.groupby('A').size()


A
authoritative location    1
decision making           2
location                  1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...