Расширенный .Csv анализ - файл ответов на опрос? - PullRequest
0 голосов
/ 29 июня 2011

Хорошо, во-первых, я просто хотел бы отметить, что я знаю о синтаксическом анализе файлов .csv с использованием запятых или табуляции и т. Д. Однако у меня все еще есть проблема, и я немного застрял.

Я пытаюсь создать приложение, которое читает файл ответов на опрос .csv (желательно всех типов расширений, но давайте начнем с одного).Эти файлы ответов на опрос предварительно создаются другими веб-сайтами.(т.е. пользователь загружает свои ответы на опрос с сайта опроса, а затем использует мое приложение).Целью приложения является выполнение статистического анализа данных.

Так что проблема, которую я имею, состоит в том, чтобы выяснить, как читать и отделять вопросы - от ответов - от неактуального текста.Мне нужен многократно используемый способ сделать это для нескольких файлов ответов с разными типами вопросов и т. Д.

Я знаю, что более простой способ сделать это состоит в том, чтобы пользователь создал опрос с моим приложением, а затем проанализировал его, поэтомуЯ могу контролировать форматирование, но на данный момент это не вариант.

ПРИМЕЧАНИЕ. Я планирую прочитать все переменные в системе, а затем разрешить пользователю выбирать переменные из списка и выполнять алгоритмы анализа.на них.

Опять же, я знаю, что они продвинутые читатели CSV там, я просто ищу идеи о том, как решить мою проблему.

Ответы [ 3 ]

1 голос
/ 29 июня 2011

используйте Microsoft.VisualBasic.FileIO.TextFieldParser

он специально предназначен для анализа файлов .csv.он также обрабатывает запятые в полях.

0 голосов
/ 29 июня 2011

В первой строке вашего файла (CSV (разделитель - запятая) или TSV (разделитель - табуляция)) содержатся имена столбцов?Все ли строки имеют одинаковое количество значений (при необходимости, если пропущенные или нулевые значения обозначены последовательными разделителями)?

Если ответы на оба вопроса положительные, одним из вариантов является использование ADO сДрайвер JET 4.0 для чтения каждого файла как источника реляционных данных.

Существует множество примеров, демонстрирующих эту технику.Начните здесь.

0 голосов
/ 29 июня 2011

Для анализа CSV вы можете использовать регулярное выражение, которое я описываю в своем решении к этому сообщению . Это будет оцениваться построчно.

...