У меня есть файл .csv, и я хочу разделить неанглийский текст и английский текст в двух разных файлах. Ниже приведен код, который я пробовал:
import string
def isEnglish(s):
return s.translate(None, string.punctuation).isalnum()
file=open('File1.csv','r',encoding='UTF-8')
outfile1=open('Eng.csv','w', encoding='utf-8')
outfile2=open('Noneng.csv','w', encoding='utf-8')
for line in file.readlines():
r = isEnglish(line)
if r:
outfile1.write(line+"\n")
else:
outfile2.write(line+"\n")
Код не дает желаемого результата. В обоих файлах присутствует повторяющийся текст на английском языке. Я приложил снимок одного выходного файла.