Question

У меня есть набор данных с примерно 300 тысячами образцов, где каждый образец представляет собой текстовый документ с примерно 25 тысячами слов.

Я могу загрузить все это в память, но я не могу по-настоящему использовать сеть GRU, так как я просто сталкиваюсь с ошибкой памяти из-за количества параметров

Я попытался установить max vocabдлина до 35000 и максимальная длина последовательности до 2500, после чего я могу запустить сеть GRU.Я получил немного хорошую точность, но я теряю 90% своих данных.

Abrhalei · Answer 1 · 28 сентября 2019

Одним из решений может быть загрузка меньшего входного набора данных за один раз и итерация по всему набору данных, или вы можете использовать небольшой размер пакета в вашей тренировке.

Что я могу сделать с большим вводимым текстом, который не может все поместиться в память

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Что я могу сделать с большим вводимым текстом, который не может все поместиться в память

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов