Я пытаюсь сделать токенизацию с помощью spacy. Я новичок в python и хочу знать, как выполнить токенизацию в CSV-файл.
T открыл файл в блокноте Jupyter:
import csv
import wheel
with open('/Users/Desktop/Python Path copia/samsungs10.csv') as csv_file:
csv_reader = csv.reader(csv_file, delimiter=';')
for riga in csv_reader:
for campo in riga:
print(campo, end=" ")
print("") #fine riga
doc = nlp ('csv_file')
И результат правильно набор данных csv.
Попытка токенизации У меня есть эта проблема:
#python3 -m spacy download en_core_web_sm
import spacy
import en_core_web_sm
for token in doc:
print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,
token.shape_, token.is_alpha, token.is_stop)
Результат:
csv_file csv_file ADP IN ROOT xxx_xxxx False False.
ПОЧЕМУ?