У меня есть многослойная строка, которая имеет несколько повторяющихся строк. Я хочу удалить не только повторную строку, но и «оригинал», который повторяется.
Я нашел несколько ответов о том, чтобы удалить только повторную строку, оставить оригинал, но я не знал, как его адаптировать, и когда я попытался, у меня не получилось.
text = """<br/>
Somewhere in China there is a copy of this vid.<br/>
2 years ago<br/>
Not sure really<br/>
Aiur Productions<br/>
Aiur Productions<br/>
2 years ago<br/>
"""<br/>
lines_seen = set() # holds lines already seen<br/>
for line in text:
if line not in lines_seen: # not a duplicate
print(lines_seen.add(line))
Я получил несколькостроки "нет". Как уже упоминалось, приведенный выше код исходит из другого вопроса, когда запрашивающий хотел удалить повторяющиеся строки, но оставить неповторяющиеся и одну версию повторных. То, что я хочу, это вывод, как это:
Где-то в Китае есть копия этого видео. Не уверен, что действительно
со всеми дублированными строками (например, «два года назад») удалены, так что остаются только те строки, которые не были повторены в оригинале.