У меня есть 2 CSV-файла: один dictionary.csv
, а другой file.csv
, который содержит много слов. Я хотел проверить, существует ли слово в dictionary.csv
в определенном столбце file.csv
.
Если он существует, должен быть создан новый файл new.csv
. Этот файл должен содержать все данные из файла file.csv, но с одним дополнительным столбцом, в котором записывается 1, если он существует, и 0, если он не существует.
Вот мой скрипт:
import csv
import pandas as pd
news=pd.read_csv("file.csv")
dictionary=pd.read_csv("dictionary.csv", squeeze=True)
pattern = '|'.join(dictionary)
exist=news['sentences'].str.contains(pattern, na=False)
with open('new.csv', 'w') as outFile:
for cols in exist:
if pattern in exist:
outFile.write(exist, "1")
В результате я получаю пустой CSV-файл, возможно, я что-то пропустил.
file.csv
id sentences
0 Roses are red
1 burgers are delicious
dictionary.csv
red
blue
green
Файл new.csv
должен содержать следующий вывод:
id sentences exist/not exist
0 Roses are red 1
1 burgers are delicious 0