Question

Я пытаюсь загрузить мультимодальные данные (например, текст и изображение) в pytorch для классификации изображений.Я не знаю, как загрузить их одновременно, как в следующем коде.

 def __init__(self, img_path, txt_path, transform=None, loader=default_loader):

def __len__(self):
    return len(self.img_name)

def __getitem__(self, item):

Кто-нибудь может мне помочь?

asong24 · Answer 1 · 24 марта 2019

Метод getitem (self, item) поможет вам сделать это.

Например:

def __getitem__(self, item):  # item can be thought as an index

    text = textList[item]  # textList would be a list containing the text you want to input into the model for element 'item'
    img = imgList[image]  # imgList would be a list containing the images you want to input into the model for element 'item'

    input = [text, img]  
    y = labels[item]  # labels would be a list containing the label for the input of the text and img. This is your target.

    return input, y

shivam2298 · Answer 2 · 23 марта 2019

В __getitem__ вы можете использовать словарь или кортеж для представления одной выборки ваших данных. Позже, во время обучения, когда вы создаете загрузчик данных с использованием набора данных, pytorch автоматически создает пакеты из диктонары или кортежей.

Если вы хотите создавать сэмплы гораздо более разнообразным способом, посмотрите collate_fn в pytorch.

загрузить мультимодальные данные с Pytorch

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

загрузить мультимодальные данные с Pytorch

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов