Я новичок в работе с большими объемами данных.У меня довольно большой набор данных (около 1 миллиона аудиофайлов каждые пару секунд), и я пытаюсь эффективно загрузить данные для целей визуализации (и в конечном итоге использовать в качестве обучающих данных в нейронной сети).
Пока я пробовал использовать librosa (использовала librosa.load (имя файла)), но для загрузки 10000 файлов потребовалось несколько часов.Я пытался выяснить, смогу ли я использовать графический процессор для его ускорения (возился с Numba), но я не уверен, является ли это даже действительной проблемой, которую решает графический процессор.
Мне кажется, что яЯ пропускаю что-то действительно очевидное.Может ли кто-нибудь более опытный сказать мне, что делать?Я с трудом пытаюсь найти решение в Интернете.Спасибо за помощь!