Как читать числовые данные из CSV в PyTorch? - PullRequest
0 голосов
/ 07 мая 2020

Я новичок в PyTorch; пытаюсь реализовать модель, которую я разработал в TF, и сравнить результаты. Модель представляет собой модель автоэнкодера. Входные данные - это файл csv, включающий n образцов, каждый с m характеристиками (числовая матрица * m в файле csv). Цели (метки) находятся в другом CSV-файле с тем же форматом, что и входной файл. Я искал в Интернете, но не смог найти хорошую документацию для чтения данных без изображений из файла csv с несколькими метками. Есть идеи, как я могу прочитать свои данные и перебрать их во время обучения?

Спасибо

1 Ответ

1 голос
/ 08 мая 2020

Возможно, вы ищете что-то вроде TabularDataset ?

class torchtext.data.TabularDataset (path, format, fields, skip_header = False, csv_reader_params = {}, * * kwargs)

Определяет набор данных столбцов, хранящихся в формате CSV, TSV или JSON.

Он принимает путь к файлу CSV и строит из него набор данных . Вам также необходимо указать имена столбцов, которые затем станут полями данных.

В общем, все реализации torch.Dataset для определенных c типов данных расположены вне pytorch в библиотеках torchvision, torchtext и torchaudio.

...