Начиная с 2 разных строк, я пытаюсь перебирать по строке1 n раз и каждый раз сравнивать подстроку со строкой2, чтобы определить, совпадает ли она с какими-либо подстроками в этой строке. Если подстрока совпадает, она добавляется в список. Мой вопрос заключается в том, как получить список для печати новых строк вместо \ n, который сохраняется в списке в некоторых подстроках.
Пример длины подстроки 3
string1:
Yo.
dey do!!
yo'yo. yoyo.
строка 2:
yo.
dey do!!
yo'yo. yoyo.
Мои результаты:
o.\n
.\nd
\nde
dey
ey
y d
do
do!
o!!
!!\n
!\n\n
\n\ny
\nyo
yo'
o'y
'yo
yo.
o.
. y
yo
yoy
oyo
o.
Правильные результаты должны быть:
!!
o.
'yo
!
yo.
.
d
y
dey
yoy
o.
ey
de
y d
yo
. y
yo'
oyo
yo
o'y
o!!
do
do!
Вот код:
def substrings(a, b, n):
"""Return substrings of length n in both a and b"""
all_sub = list()
i = 1
for h in range(len(a)):
i = 1
sub = a[h]
if h+n > len(a):
n = len(a) - h
while i < n:
sub += str(a[h+i])
i += 1
if i == n:
if sub in b:
all_sub.append(sub)
all_sub = list(dict.fromkeys(all_sub))
return all_sub
# Compare files
if args["lines"]:
matches = lines(file1, file2)
elif args["sentences"]:
matches = sentences(file1, file2)
elif args["substrings"]:
matches = substrings(file1, file2, args["substrings"])
# Output matches, sorted from longest to shortest, with line endings escaped
for match in sorted(matches, key=len, reverse=True):
print(match.replace("\n", "\\n").replace("\r", "\\r"))
def positive(string):
"""Convert string to a positive integer."""
value = int(string)
if value <= 0:
raise argparse.ArgumentTypeError("invalid length")
return value
if __name__ == "__main__":
main()