Я пытаюсь загрузить мультимодальные данные (например, текст и изображение) в pytorch для классификации изображений.Я не знаю, как загрузить их одновременно, как в следующем коде.
def __init__(self, img_path, txt_path, transform=None, loader=default_loader):
def __len__(self):
return len(self.img_name)
def __getitem__(self, item):
Кто-нибудь может мне помочь?