У меня есть несколько наборов данных от использования скребка твиттера. Когда я использую скребок, для дальнейшего анализа данных мне нужен файл, содержащий все строки одну за другой. Я собрал данные в определенное время во время события, поэтому данные не могут быть восстановлены с использованием нового кода. Мне нужно написать некоторый код, который удаляет все эти пустые строки между каждым твитом.
Вот пример некоторых данных в файле.
1: Data Data Data etc
2:
3: data data data
4:
Я пробовал так много Различные способы удалить эти пустые строки безуспешно. Мой текущий код, который я пробую, выглядит следующим образом:
f = open(r"stream_london.jsonl", "r")
text = f.read()
lines = text.splitlines()
for line in lines:
if line.isspace() == True:
lines.write(line)
У меня нет успеха. Мне нужен код для перезаписи текущего файла так, чтобы присутствовали все данные, с записью 1 в строке 1 и записью 2 в строке 2, а не в настоящее время в строках 1, 3, 5, 7 и т. Д. c.
Кто-нибудь может мне помочь с этим? Мне удалось сравнительно легко выполнить все операции с твиттером, но теперь я разочарован тем, что не могу решить такую простую задачу, как убрать пустые строки и переместить все данные вверх, чтобы сжать их.