Я пытаюсь классифицировать латинские / нелатинские данные через Python.Я хочу, чтобы вывод был «columnname: Latin», если он латинский, «columnname: Non-Latin», если он нелатинский.Вот набор данных, который я использую:
name|company|address|ssn|creditcardnumber
Gauge J. Wiley|Crown Holdings|1916 Central Park Columbus|697-01-963|4175-0049-9703-9147
Dalia G. Valenzuela|Urs Corporation|8672 Cottage|Cincinnati|056-74-804|3653-0049-5620-71
هاها|Exide Technologies|هاها|Washington|139-09-346|6495-1799-7338-6619
Я попытался добавить приведенный ниже код.Я не получаю никакой ошибки, но я все время получаю «латынь».Есть ли какие-либо проблемы с кодом?
if any(dataset.name.astype(str).str.contains(u'[U+0000-U+007F]')):
print ('Latin')
else:
print('Non-Latin')
А также я был бы рад, если бы кто-то мог сказать мне, как отобразить вывод в виде "имя столбца: латиница", имя столбца повторяется из кадра данных