Пожалуйста, у меня есть набор данных тройного класса, содержащий 129 переменных и около 58 000 наблюдений (строк). Моя переменная ответа имеет 3 класса: Attack, Natural и NoEvents. Распределение классов показано ниже. Однако я намерен уменьшить классы «Natural» и «NoEvent» на 80%, чтобы позволить мне создать несбалансированный набор данных, но мой код, похоже, не работает. Не могли бы вы мне помочь?
> reduced<- sample_frac(powerData, powerData$marker=="Natural" &
powerData=="NoEvent",0.8)
>
> table(powerData$marker)
Attack Natural NoEvents
40914 13351 3225