Я попытался воспроизвести ту же проблему, что и ваша, успешно, как код и рисунок ниже.
import numpy as np
import pandas as pd
import databricks.koalas as ks
dates = pd.date_range('20130101', periods=6)
pdf = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
df = ks.from_pandas(pdf)
print(pdf.iloc[0,0])
print(df.iloc[0,0])
Из-за отсутствия необходимое описание вашей переменной Y
, я думаю, Y
- это фрейм данных, но различия составляют pandas
фрейм данных на локальном Spyder, Koalas
фрейм данных в блоках данных.
Согласно к документу Koalas для databricks.koalas.DataFrame.iloc
, он не поддерживает операцию iloc(int, int)
для кадра данных Koalas.
Поэтому, если вы хотите выполнить какую-либо операцию для значения первого столбца каждой строки в кирпичах данных, есть два решения, как показано ниже:
- Убедитесь, что
Y
является pandas фреймом данных в том же скрипте из ваших блоков данных. Y
должен быть кадром данных Koalas, как вы хотите, пожалуйста, попробуйте код, как показано ниже.
# Here, `Y` is a Koalas dataframe
for row in Y.iterrows():
describe = re.sub('[^a-zA-Z]', ' ', row[1][0])
describe = describe.lower()
describe = describe.split()
describe = ' '.join(describe)
corpus.append(describe)
Как вы можете видеть мой пример кода и В результате ниже функция iterrows
может помочь получить значение первого столбца каждой строки.