Я провожу сетевой анализ по сетям и заметил, что некоторые узлы обрабатываются по-разному только потому, что у них есть лишние пробелы (ведущие).
Я пытался удалить пробелы, используя следующие коды, но я не может заставить вывод снова стать строками.
rhedge = pd.read_csv(r"final.edge.csv")
rhedge
_________________
source | to
niala | Sana, Sana
Wacko | Ana, Aisa
rhedge['to'][1]
'Sana, Sana'
rhedge['splitted_users2'] = rhedge['to'].apply(lambda x:x.split(','))
#I need to split them so they will be included as different nodes
Проблема в следующем коде
rhedge['splitted_users2'][1]
['Sana', ' Sana']
Как вы можете видеть, у второго Sana есть начальный пробел.
Я пытался сделать это:
split_users = []
for i in split:
row = [x.strip() for x in i]
split_users.append(row)
pd.Series(split_users)
Но когда я снова пытаюсь разделить их на «,», это не позволяет мне, потому что набор данных теперь находится в списке. Я считаю, что их разделение заставит сети рассматривать их как один узел, а не создавать другой узел для одного с начальным пробелом.
СПАСИБО