Вывод показывает что-то вроде Series ([],), как это исправить? - PullRequest
0 голосов
/ 28 ноября 2018

У меня есть фрейм данных, который выглядит следующим образом.

df = pd.DataFrame({ 'reference_id':['012ABH3', '012ABD44', '023HBA3', '032IHJK4', '543BHKI0'], 'link1': ['http://ll.abc.com/LNLDSOUYsda5443', 'http://ll.abc.com/KJBAKJBADndkja1223', 'http://ll.abc.com/KJADBDKAJB9973Fsdad', 'http://ll.abc.com/KAHSBAKHBjj*&*', 'http://ll.abc.com/JBKJBKJBDSwe77676']})
df
  reference_id                                  link1
0     012ABH36      http://ll.abc.com/LNLDSOUYsda5443
1     012ABD44   http://ll.abc.com/KJBAKJBADndkja1223
2     023HBA35 https://ll.abc.com/KJADBDKAJB9973Fsdad
3     032IHJK4       http://ll.abc.com/KAHSBAKHBjj*&*
4     543BHKI0   https://ll.abc.com/JBKJBKJBDSwe77676

Я пытаюсь написать цикл for и получить некоторую информацию из каждой ссылки в фрейме данных.

for i in df['link1']:
    if str(i).startswith('http'):
        link = i
        link = re.sub(r'(\w+)(?=.*:)', 'http', link)
        rid = df.loc[df['link1'] == link, 'reference_id']
        rid = pid.to_string(index=False)
        print(rid)

Но в ходе этого процесса мне также необходимо напечатать referenceid соответствующей ссылки в список выходных значений.Когда я делаю это, я замечаю, что получаю что-то, как показано ниже.

012ABH36
012ABD44
Series([], )
Series([], )
543BHKI0

Я не понимаю, что означает Series ([],).Может кто-нибудь объяснить, что может быть не так с этим и как я могу избавиться от серии ([],)?Как получить правильный referenceid для каждой информации о ссылке в столбце link1?

1 Ответ

0 голосов
/ 28 ноября 2018

Я определил причину проблемы, протестировав некоторые комбинации.

В своем скрипте я пишу следующую строку

link = re.sub(r'(\w+)(?=.*:)', 'http', link)

Это преобразование всех ссылок, имеющих https, в http,Но когда это делается и когда я пытаюсь получить соответствующий referenceid, он замечает, что ссылка неверна.Следовательно, он не печатает referenceid.Фактически, первый ответ, данный @nixon, был правильным.Спасибо за указание в правильном направлении

...