Я пытаюсь использовать данные covid-19 для создания модели прогноза.
У меня есть очень хорошие данные для положительного пациента. У которого есть эти параметры.
Fever Tiredness Cough Difficulty-in-Breathing Sore-Throat None_Sympton Pains Nasal-Congestion Runny-Nose Diarrhea None_Experiencing Age_0-9 Age_10-19 Age_20-24 Age_25-59 Age_60+ Gender_Female Gender_Male Gender_Transgender Severity_Mild Severity_Moderate Severity_None Severity_Severe Contact_Dont-Know Contact_No Contact_Yes Country
Проблема со мной в том, что я не нахожу отрицательных данных пациента с аналогичными параметрами.
У меня есть одни отрицательные данные пациента, которые содержат всего 4500 записей, и это также отсутствует информация о возрасте, поле и местонахождении
Я хочу знать следующее: возможно ли, что мы используем только положительные данные пациентов и пытаемся предсказать вероятность заражения?
Согласно моему ML Поймите, нам нужны сбалансированные данные для обоих классов. Но мне любопытно узнать, есть ли какой-нибудь способ справиться с этой ситуацией.