У меня есть фрейм данных с исходным столбцом «Все», который я разделил на столбцы RegionName1 и RegioName2. Есть повторяющиеся записи, например, Duluth и Duluth (Университет Дулута Миннесоты. Я хочу преобразовать строки, такие как Duluth (Университет Дулута Миннесоты в значения NaN. Поэтому я попытался
unitown ['RegionName2'] = [np.nan if '(' в x, иначе x для x в unitown ['RegionName2']]
и получил ошибку, что TypeError: аргумент типа 'float' не повторяется. Что еще можно попробовать ?
unitown=pd.read_table('university_towns.txt', header=None).rename(columns={0:'All'})
unitown['State']=unitown['All'].apply(lambda x: x.split('[edi')[0].strip() if x.count('[edi') else np.NaN).fillna(method="ffill") #.fillna(method="ffill")
unitown['RegionName1'] = unitown['All'].apply(lambda x: x.split('(')[0].strip() if x.count('(') else np.NaN)
unitown['RegionName2'] = unitown['All'].apply(lambda x: x.split(',')[0].strip() if x.count(',') else np.NaN)
unitown['RegionName2'] = [np.nan if '(' in x else x for x in unitown['RegionName2']]
return unitown[unitown.State=='Minnesota']