У нас значительное количество проблем при создании функции массовой загрузки для нашего небольшого приложения. Мы используем гем FasterCSV для загрузки данных в базу данных MySQL, но он Faster CSV настолько деликатен и точен в своих требованиях, что постоянно ломается из-за искаженных ошибок CSV и ошибок тайм-аута.
Файлы csv обычно создаются путем вставки текста пользователями с их веб-сайтов или из документов Microsoft Word, поэтому не стоит ожидать, что в данных никогда не будет лишних символов, таких как умные кавычки или акценты. Кроме того, пользователи не смогут легко определить, достаточно ли хороши их данные для FasterCSV или нет. Нам нужно найти способ исправить это для них автоматически.
Есть ли хороший способ или надежный инструмент для предварительной обработки данных CSV, чтобы исправить любые изъяны в данных перед обработкой их гемом FasterCSV?