Как я могу загрузить свои собственные данные для тензорного потока с помощью Google Colab? - PullRequest
0 голосов
/ 11 октября 2018

Я просматривал учебники по тензорному потоку онлайн (в частности, учебник по ценам на жилье: https://colab.research.google.com/github/tensorflow/models/blob/master/samples/core/tutorials/keras/basic_regression.ipynb)

Я пытался загрузить свой собственный CSV-файл для аналогичного проекта, используя Googlecolab.Но я не могу понять, что формат правильный - я очень плохо знаком с этим, поэтому я не могу найти решение, которое я могу понять.

from __future__ import absolute_import, division, print_function

import tensorflow as tf
from tensorflow import keras

import numpy as np
import pandas as pd

print(tf.__version__)

#Import the csv files

from google.colab import files
uploaded = files.upload()

for fn in uploaded.keys():
  print('User uploaded file "{name}" with length {length} bytes'.format(
  name = fn, length = len(uploaded[fn])))

# This is where I upload my csv file

import io

df = pd.read_csv(io.StringIO(uploaded[ 'data.csv'].decode('utf-8')))
df.head()

(train_data, train_labels), (test_data, test_labels) = uploaded.load_data()

# Shuffle the training set
order = np.argsort(np.random.random(train_labels.shape))
train_data = train_data[order]
train_labels = train_labels[order]
print(boston_housing)

Вот в чем проблема - я не могу разделить свои данные на данные тренировок и тестов.

В моем data.csv всего 5 столбцов.В столбце 1-2 содержатся два набора входных данных, в столбце 3 - метка, в столбце 3-4 - входные данные теста.

Опять же, массивный новичок, любая помощь будет потрясающей!Я так растерялся

1 Ответ

0 голосов
/ 13 октября 2018

Я предполагаю, что эта строка является проблемой:

(train_data, train_labels), (test_data, test_labels) = uploaded.load_data()

uploaded является результатом команды files.upload, и это не включает load_data метод.Вместо этого он помещает копию файла в локальную файловую систему и возвращает dict, содержащий байты каждого загруженного файла, проиндексированного ключами имени файла.Например:

enter image description here

Вы уже получили данные как DataFrame в df.Итак, чтобы разделить на тестирование и обучение, возможно, сделайте что-то вроде рецептов, предложенных здесь: Как мне создать тестовые и обучающие образцы из одного кадра данных с пандами?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...