Я использую кераты для проекта преобразования текста в речь, и для этого проекта у меня есть почти 1000 помеченных данных.
, поскольку длина звуков в наборе данных различна, я изменил их размер до максимальной длины.
поэтому большинство моих данных сейчас выглядит примерно так: (это один образец набора данных)

, как вы видите, более половины из них пусто (ноль)
Теперь моя проблема в том, что, поскольку у более половины данных есть один класс, он больше подходит этому классу, а мой прогноз - просто пустая строка.
как я могу обрабатывать такие данные?