Существуют ли известные службы для проверки файла CSV? - PullRequest
31 голосов
/ 19 июля 2011

Есть ли какие-нибудь хорошие сайты / услуги для проверки целостности файла CSV?

То же, что и W3C-валидатор , но для CSV?

Ответы [ 5 ]

20 голосов
/ 27 июля 2011

Я недавно натолкнулся на Google Refine - это не сервис для проверки файлов CSV, это инструмент, который вы загружаете локально, но он предоставляет множество инструментов для работы с данными и обнаружения аномалий.

http://code.google.com/p/google-refine/

Как упоминалось в ответе, "CSV" стал плохо определенным термином, главным образом потому, что люди не следуют Единому истинному пути при использовании данных, разделенных разделителем

http://www.catb.org/~esr/writings/taoup/html/ch05s02.html

РЕДАКТИРОВАНИЕ / ОБНОВЛЕНИЕ (2016-08-09):
CSV В настоящее время рабочая группа W3C CSV становится четко определенным термином

10 голосов
/ 11 февраля 2014

Институт открытых данных разрабатывает службу проверки CSV, которая позволит пользователям проверять структуру своих данных, а также проверять ее по простой схеме.

Служба все еще находится в альфа-версии, но можетможно найти здесь:

http://csvlint.io/

Код приложения и лежащая в его основе библиотека имеют открытый код:

https://github.com/theodi/csvlint

https://github.com/theodi/csvlint.rb

README в библиотеке предоставляет сводку ошибок и предупреждений, которые могут быть сгенерированы.Возможны следующие типы ошибок:

  • :wrong_content_type - тип содержимого не текстовый / csv
  • :ragged_rows - строка содержит другое количество столбцов (чемпервая строка в файле)
  • :blank_rows - полностью пустая строка, например, пустая строка или строка, в которой все значения столбца пусты
  • :invalid_encoding - ошибка кодирования при разборе строкиНапример, из-за недопустимых символов
  • :not_found - ошибка HTTP 404 при извлечении данных
  • :quoting - проблема с кавычками, например, отсутствующая или случайная кавычка, незакрытое поле кавычек
  • :whitespace - столбец в кавычках имеет пробел в начале или в конце

Можно сообщить о следующих типах предупреждений:

  • :no_encoding -Заголовок Content-Type, возвращаемый в HTTP-запросе, не имеет параметра charset
  • :encoding - набор символов не является UTF-8
  • :no_content_type - файл обслуживается беззаголовок Content-Type
  • :excel - заголовок Content-Type отсутствует, расширение файла - .xls
  • :check_options - файл CSV содержит только один столбец
  • :inconsistent_values - несовместимые значения в одном столбце.Сообщается, если <90% значений имеют одинаковый тип данных (числовой или буквенно-цифровой, включая знаки препинания) </li>
1 голос
/ 15 февраля 2018

Для проверки файла CSV я использую расширение RAINBOW CSV в коде Visual Studio, а также открываю файл CSV в Excel.

1 голос
/ 07 августа 2016

Национальные архивы разработали программное обеспечение CSV Language и CSV Validator , написанное на Java.Это с открытым исходным кодом.

0 голосов
/ 17 июня 2018

CSV Lint на csvlint.com (не .io :) - это служба, которую мы создаем для решения этой проблемы. Он проверяет файлы CSV по определенным пользователем правилам / схемам проверки ячейка за ячейкой.

Мы потратили много времени на настройку пользовательского интерфейса, чтобы пользователи могли легко создавать сложные правила / схемы проверки, соответствующие их бизнес-потребностям, без единой строчки кода.

Наша функция проверки в автономном режиме позволяет пользователям просматривать результаты в режиме реального времени даже при проверке нескольких файлов большого размера (с миллионами + строками), а самое главное, это 100% защищает конфиденциальность данных пользователя.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...