Питон нуб здесь. (полное раскрытие)
У меня есть список твитов, который отформатирован как список строк, например:
["This is a string that needs processing #ugh #yikes",
"this string doesn't have hashtags",
"this is another one #hooray"]
Я пытаюсь написать функцию, которая создаст список хэштегов в каждой строке, но оставит пустые записи, когда нет записей. Это потому, что я хочу присоединиться к этому списку с самими твитами позже. Это мой желаемый вывод:
['#ugh', '#yikes'], [], ['#hooray']
Эта функция, которую я нашел здесь отлично работает для ОДНОЙ строки.
mystring = "I love #stackoverflow because #people are very #helpful!"
Но, похоже, он не работает для нескольких строк. Это мой код:
l = len(mystringlist)
it = iter(mystringlist)
taglist = []
def extract_tags(it,l):
for item in mystringlist:
output = list([re.sub(r"(\W+)$", "", j) for j in list([i for i in
item.split() if i.startswith("#")])])
taglist.append(output)
multioutput = extract_tags(mystringlist,l)
print(multioutput)