Я не могу импортировать файл CSV? - PullRequest
2 голосов
/ 12 мая 2019

Я совершенно новичок в питоне и программировании в целом.

Я хочу участвовать в проекте Data Science «Титаник», но не могу прочитать файл CSV, хотя я их и загрузил. Я использую Jupyter и Python 3.

Я скачал все файлы CSV несколько раз.

screenshot

# data analysis and wrangling
import pandas                as pd
import numpy                 as np
import random                as rnd

# visualization
import seaborn               as sns
import matplotlib.pyplot     as plt
%matplotlib inline

# machine learning
from sklearn.linear_model  import LogisticRegression
from sklearn.svm           import SVC, LinearSVC
from sklearn.ensemble      import RandomForestClassifier
from sklearn.neighbors     import KNeighborsClassifier
from sklearn.naive_bayes   import GaussianNB
from sklearn.linear_model  import Perceptron
from sklearn.linear_model  import SGDClassifier
from sklearn.tree          import DecisionTreeClassifier



##Acquire data

train_df   = pd.read_csv('../input/train.csv')    #here I get the error
test_df    = pd.read_csv('../input/test.csv')
combine    = [train_df, test_df]

Ошибка: FileNotFoundError

Должен ли я изменить путь к каталогу? Но если да, то каким образом?

1 Ответ

2 голосов
/ 12 мая 2019

На всякий случай, укажите путь full файла csv в обоих файлах для загрузки ваших фреймов данных

train_df   = pd.read_csv('<path_to_csv>/train.csv')  
test_df    = pd.read_csv('<path_to_csv>/test.csv')
combine    = [train_df, test_df]

Или, если вы знаете каталог файла csv, используйте os.path.join длясоздать полный путь

import os

folder = "<path_to_csv>"

#Full path of csv files
train_path = os.path.join(folder, 'train.csv')
test_path = os.path.join(folder, 'test.csv')

#Use full path to open csv file
train_df = pd.read_csv(train_path)  
test_df = pd.read_csv(test_path)
combine = [train_df, test_df]

Также в качестве дополнения, если вы знаете, что файлы csv находятся в том же месте, откуда запускается скрипт, вы можете использовать os.path.dirname(__file__) для получения текущей папки..

...