Вы можете удалить все символы, не входящие в диапазон Unicode U + 0900-U + 097F, используя регулярное выражение.
import re
p = re.compile(r'[^\u0900-\u097F\n]') # preserve the trailing newline
with open('sample.txt') as f, open('sample2a.txt', 'w') as nf:
for line in f:
cleaned = p.sub('', line)
if cleaned.strip():
nf.write(cleaned)
Пример минимального кода
import re
text = '''
‘भूमी
‘भूमी’
‘भूमी’ला
‘भैय्यासाहेब
‘भैरवनाथ
‘भैरवी
‘भैरव’
ﻇﻬﻴﺮ
(ページを閲覧しているビジターの使用言語)。
(缺少文字)
गावापासून
गा
'''
p = re.compile(r'[^\u0900-\u097F\n]')
for line in text.splitlines():
cleaned = p.sub('', line)
if cleaned.strip():
print(cleaned)
# भूमी
# भूमी
# भूमीला
# भैय्यासाहेब
# भैरवनाथ
# भैरवी
# भैरव
# गावापासून
# गा