Question

Я пытаюсь проанализировать CSV-файлы из трендов Google, но между столбцами нет разделителя? Есть ли какой-нибудь способ заставить это работать так, чтобы я мог разбить данные на столбцы после синтаксического анализа, или это лучшее, что я могу сделать, просто поместить каждую строку в один столбец.

Я пробовал множество читателей CSV: http://www.codeproject.com/KB/database/CsvReader.aspx http://www.stellman -greene.com / CSVReader /

Я мог бы попытаться выделить данные в каждой строке, но это кажется очень плохим решением.

Пример CSV-файла из Google трендов: http://www.google.com/trends/viz?q=stackoverflow&date=all&geo=all&graph=all_csv&sort=0&sa=N

У кого-нибудь есть идеи?

Mormegil · Answer 1 · 13 февраля 2011

Мне кажется, столбцы разделены вкладками (U + 0009), не так ли?Просто сделай

using (var reader = new StreamReader(@"trends.csv", true))
{
    string line;
    while ((line = reader.ReadLine()) != null)
    {
        var items = line.Split('\t');
        if (items.Length == 3) // recognizing the header etc. left as an exercise for the reader
        {
            Console.WriteLine("Date: {0}, value = {1}, error = {2}", items[0], items[1], items[2]);
        }
    }
}

Maxim Gueivandov · Answer 2 · 13 февраля 2011

Есть две возможные проблемы, по которым эти библиотеки плохо разбираются:

Первые 4 строки могут «обмануть» эти анализаторы, полагая, что есть только 2 столбца
Это на самом деле не CSV (значения, разделенные запятыми) файл, вкладки используются вместо запятых

enter image description here

Легко и просто написать собственный анализатор для этого конкретного случая (в значениях нет экранированных вкладок):

Открыть файл
Пропустить первые 5 строк
Для каждой прочитанной строки разбить ее на \t иполучить значения столбца

Jon Skeet · Answer 3 · 13 февраля 2011

Мне кажется, что он закодирован в UTF-16 с разделителем табуляции (U + 0009).

c # разбор трендов гугл csv без явного разделителя

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

c # разбор трендов гугл csv без явного разделителя

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы