Я пытаюсь увидеть, находится ли строка из текущего фрейма данных внутри нового фрейма, посмотрев на строковое значение concept
.
Но я получаю
«Ошибка типа: объекты Series являются изменяемыми, поэтому их нельзя хэшировать».
Я пробовал другие методы, которые также приводили к различным ошибкам, любая помощь приветствуется!
df = pd.read_csv('holder.csv', names = ['concept','frequency'])
newdf = pd.DataFrame(columns = ['concept','frequency'])
for index1, row1 in df.iterrows():
if newdf.empty:
row1 = row1.fillna(1)
newdf = newdf.append(row1,ignore_index=True)
elif newdf(newdf.concept == row1[0]):
row1 = row1.fillna(1)
newdf = newdf.append(row1,ignore_index=True)
edit1: я пытаюсь отделить файл holder.csv (который содержит строковые значения и дубликаты), так что конечным результатом является другой файл CSV, в котором каждая запись уникальна и хранит частоту строкового значения (т. Е. Получаются дубликаты).добавлено в частоту)
holder.csv
- принятие решения
- авторитетное местоположение
- местоположение
- принятие решения
end.csv
- принятие решения, 2
- авторитетное местоположение, 1
- местоположение, 1