Вы ищете простой ответ да или нет?В таком случае да.Вы полностью контролируете построение своих моделей, которое включает в себя то, какие данные вы обрабатываете и какие прогнозы вы получаете.
Если вы действительно хотите спросить, как это сделать, это будет зависеть от конкретных наборов данных и приложения, ноОдин из способов сделать это - иметь две модели, одна из которых предназначена для определения выходной метки (кошка или собака) по изображению, так что, возможно, это будет какой-то простой CNN.Другой обработал бы текстовые данные и нашел бы образцы в этом.Затем, в конце, у вас может быть либо оценщик без ИИ, который наивно объединит эти два прогноза, либо вы можете использовать обе эти модели в качестве входных данных для простой нейронной сети, которая будет изучать шаблон на основе результатов этих двух моделей..
Это всего лишь один из возможных способов сделать это, и, как я уже сказал, точная реализация будет зависеть от множества других факторов.Как помечены оба набора данных?Связаны ли данные друг с другом?Это означает, что у вас есть какие-то текстовые данные для каждого изображения?Или у вас есть отдельный набор данных с изображениями и отдельный набор данных о биологической информации?
Существует также соображение, которое вы, вероятно, захотите сделать о необходимости такого подхода.Современные модели могут предсказывать категории по обработке изображений с супер-человеческой точностьюЕсли это не упражнение при создании более сложной модели, это выглядит излишним.
PS : я бы не использовал термин "биос" в этом контексте, я считаю, что это не такЭто очень распространенное использование, и здесь, в SO, люди будут думать, что вы имеете в виду BIOS .