Генерация DataFrame из текстового файла с фильтрацией определенных символов в строке - PullRequest
0 голосов
/ 30 апреля 2020

Я пробовал много методов для очистки данных, но все еще не могу очистить их и сохранить их параллельно. Ниже приведено изображение файла demo.txt, который я хочу прочитать.

введите описание изображения здесь

Ниже приведен кадр данных, который я хочу сгенерировать.

введите описание изображения здесь

Я пытаюсь удалить лишние обозначения, кроме ":", с помощью метода apply ().

df = pd.read_csv("Demo.txt", delimiter="\t", header=None)
df.rename(columns={0: "Make_Model"}, inplace=True)

df["Make"] = df["Make_Model"].apply(lambda x: x.split("[")[0] if "[edit]" in x else np.nan).ffill()
df["Model"] = df["Make_Model"].apply(lambda x: x.split(" (")[0].strip() if "(" or ":" in x else np.nan)
df["Make].dropna(inplace=True)

df =df.loc[:, ["Make", "Model"]].dropna().reset_index(drop=True)

Но когда я пробую этот метод, я не получаю желаемый результат. Пожалуйста, помогите мне, потому что я занял много времени, чтобы решить эту проблему.

...