загрузить мультимодальные данные с Pytorch - PullRequest
1 голос
/ 22 марта 2019

Я пытаюсь загрузить мультимодальные данные (например, текст и изображение) в pytorch для классификации изображений.Я не знаю, как загрузить их одновременно, как в следующем коде.

 def __init__(self, img_path, txt_path, transform=None, loader=default_loader):

def __len__(self):
    return len(self.img_name)

def __getitem__(self, item):

Кто-нибудь может мне помочь?

Ответы [ 2 ]

0 голосов
/ 24 марта 2019

Метод getitem (self, item) поможет вам сделать это.

Например:

def __getitem__(self, item):  # item can be thought as an index

    text = textList[item]  # textList would be a list containing the text you want to input into the model for element 'item'
    img = imgList[image]  # imgList would be a list containing the images you want to input into the model for element 'item'

    input = [text, img]  
    y = labels[item]  # labels would be a list containing the label for the input of the text and img. This is your target.

    return input, y
0 голосов
/ 23 марта 2019

В __getitem__ вы можете использовать словарь или кортеж для представления одной выборки ваших данных. Позже, во время обучения, когда вы создаете загрузчик данных с использованием набора данных, pytorch автоматически создает пакеты из диктонары или кортежей.

Если вы хотите создавать сэмплы гораздо более разнообразным способом, посмотрите collate_fn в pytorch.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...