Question

Я пытаюсь увидеть, находится ли строка из текущего фрейма данных внутри нового фрейма, посмотрев на строковое значение concept.

Но я получаю

«Ошибка типа: объекты Series являются изменяемыми, поэтому их нельзя хэшировать».

Я пробовал другие методы, которые также приводили к различным ошибкам, любая помощь приветствуется!

df = pd.read_csv('holder.csv', names = ['concept','frequency'])

newdf = pd.DataFrame(columns = ['concept','frequency'])
for index1, row1 in df.iterrows():
    if newdf.empty:
        row1 = row1.fillna(1)
        newdf = newdf.append(row1,ignore_index=True)
    elif newdf(newdf.concept == row1[0]):
        row1 = row1.fillna(1)


  newdf = newdf.append(row1,ignore_index=True)

edit1: я пытаюсь отделить файл holder.csv (который содержит строковые значения и дубликаты), так что конечным результатом является другой файл CSV, в котором каждая запись уникальна и хранит частоту строкового значения (т. Е. Получаются дубликаты).добавлено в частоту)

holder.csv

принятие решения
авторитетное местоположение
местоположение
принятие решения

end.csv

принятие решения, 2
авторитетное местоположение, 1
местоположение, 1

anky_91 · Answer 1 · 24 декабря 2018

IIUC, конечный csv может быть достигнут просто с помощью groupby

при условии, что ваше имя столбца равно A

    A
0   decision making
1   authoritative location
2   location
3   decision making

>>df.groupby('A').size()


A
authoritative location    1
decision making           2
location                  1

поиск столбца во фрейме данных для строкового значения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

поиск столбца во фрейме данных для строкового значения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов