Можно ли использовать для прогноза только положительную запись covid - PullRequest
0 голосов
/ 13 июля 2020

Я пытаюсь использовать данные covid-19 для создания модели прогноза.

У меня есть очень хорошие данные для положительного пациента. У которого есть эти параметры.

Fever   Tiredness   Cough   Difficulty-in-Breathing Sore-Throat None_Sympton    Pains   Nasal-Congestion    Runny-Nose  Diarrhea    None_Experiencing   Age_0-9 Age_10-19   Age_20-24   Age_25-59   Age_60+ Gender_Female   Gender_Male Gender_Transgender  Severity_Mild   Severity_Moderate   Severity_None   Severity_Severe Contact_Dont-Know   Contact_No  Contact_Yes Country

Проблема со мной в том, что я не нахожу отрицательных данных пациента с аналогичными параметрами.

У меня есть одни отрицательные данные пациента, которые содержат всего 4500 записей, и это также отсутствует информация о возрасте, поле и местонахождении

Я хочу знать следующее: возможно ли, что мы используем только положительные данные пациентов и пытаемся предсказать вероятность заражения?

Согласно моему ML Поймите, нам нужны сбалансированные данные для обоих классов. Но мне любопытно узнать, есть ли какой-нибудь способ справиться с этой ситуацией.

1 Ответ

0 голосов
/ 15 июля 2020

Принимая во внимание, что ваши данные имеют функции, строго соответствующие положительным пациентам с коронавирусом, вы можете применить подход к классификации с классификатором с деревом решений, где вы можете вводить только характеристики положительных пациентов с коронавирусом, чтобы проверить вероятность COVID.

Вы также можете использовать модель классификации Naive Bayes с использованием условной вероятности с тем же подходом.

Чтобы проверить точность вероятности, вы можете использовать показатели классификатора, такие как LOG-LOSS, чтобы сравнить ее с истинным значением и прогнозируемая вероятность.

Надеюсь, это поможет

...