Question

У меня есть следующий текст на японском, который я должен разделить на строки по строкам ('\ n'). Текст называется 'so nnet .txt'

さよなら夜の教室

Как только я открываю файл и разбиваю текст на массив строк.

file = open('sonnet.txt', encoding="utf-8")
jP = file.read().split('\n')

У меня есть следующий результат в приглашении python для списка.

>>> jP
['\ufeffさよなら\u3000夜の教室',]

Есть ли способ избавиться от частей «\ ufeff» и «\ u3000» не для этого сохраненного значения, а в общие для других слов? Спасибо.

Peyman Majidi · Answer 1 · 17 июня 2020

На самом деле я написал ваш код и создал sonnet.txt текстовый файл, но не получил того же результата.

Мой результат был: ['さよなら夜の教室']

Кстати, я предлагаю сделать вот так:

file = open('sonnet.txt', encoding="utf-8")
jP = file.read().replace('\ufeff', '').replace('\u3000', '').split('\n')
print(jP)

Дополнительная информация:

Как правильно читать японские символы из файла без (escape-последовательностей) значений «\ ufeff» и «\ u3000» в строках?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.