У меня есть текстовый файл, содержащий твиты в следующем формате
['RT @abcd: Name another swing group who can sell out Bob Field. Thank you.', 'Thanks to amazing supporters like @Bob Community Development, eligible New Yorkers can use NYC #FreeTaxPrep to get… SomeURL']
Я хочу преобразовать строку в список отдельных твитов.
На мой взгляд, разделительодиночная кавычка, за которой следует запятая, за которой следует пробел, за которым следует одинарная кавычка.
Мой код выглядит следующим образом:
opened_file = open('file_name.txt')
read_file = opened_file.read()
split_dataset = read_file.split(" \', \' ")
Однако, когда я проверяю длинуПолученный список, я получаю размер только один, что означает, что синтаксический анализ не проводился.
>>> len(split_dataset)
1