В настоящее время я работаю на Python 2.7 и имею два кадра данных x и y. Я хотел бы использовать какое-то понимание списков для итерации по обоим столбцам и использовать str.encode ('UTF8) в каждом столбце, чтобы избавиться от Unicode.
Это прекрасно работает и легко читается, но мы хотели попробовать использовать что-то быстрее и эффективнее.
for col in y:
if y[col].dtype=='O':
y[col] = y[col].str.encode("utf-8")
for col in x:
if x[col].dtype=='O':
x[col] = x[col].str.encode("utf-8")
Другие методы, которые я пробовал:
1.)[y[col].str.encode("utf-8") for col in y if y[col].dtype=='O' ]
2.)y.columns= [( y[col].str.encode("utf-8") if y[col].dtype=='O' else y[col]) for col in y ]
3.)y.apply(lambda x : (y[col].str.encode("utf-8") for col in y if y[col].dtype=='O'))
Я получаю значения ошибок и ошибки несоответствия длины для 2.) и 3.)