Проблема чтения XML-файла в C # DataSet - PullRequest
6 голосов
/ 09 сентября 2008

Мне дали файл .xml, который мне нужно было прочитать в моем коде как набор данных (в качестве фона файл был создан путем создания DataSet в C # и вызова dataSet.WriteXml(file, XmlWriteMode.IgnoreSchema), но это сделал кто-то другой ).

Файл .xml имеет следующую форму:

 <?xml version="1.0" standalone="yes"?>
 <NewDataSet>
  <Foo>
    <Bar>abcd</Bar>
    <Foo>efg</Foo>
  </Foo>
  <Foo>
    <Bar>hijk</Bar>
    <Foo>lmn</Foo>
  </Foo>
</NewDataSet>

Используя C # и .NET 2.0, я прочитал файл, используя следующий код:

        DataSet ds = new DataSet();
        ds.ReadXml(file);

Используя точку останова, после этого line ds.Tables[0] выглядело так (используя тире вместо подчеркиваний, которые я не смог правильно отформатировать):

Bar     Foo-Id    Foo-Id-0
abcd     0         null
null     1         0
hijk     2         null
null     3         2

Я нашел обходной путь (я знаю, что их много) и смог успешно прочитать в .xml, но я хотел бы понять, почему ds.ReadXml(file) выполняется таким образом, поэтому я смогу избежать проблема в будущем. Спасибо.

Ответы [ 2 ]

4 голосов
/ 09 сентября 2008

Похоже, это правильно для ваших вложенных тегов Foo:

<NewDataSet>  
  <Foo>              <!-- Foo-Id: 0 -->
    <Bar>abcd</Bar>
    <Foo>efg</Foo>   <!-- Foo-Id: 1, Parent-Id: 0 -->
  </Foo>
  <Foo>              <!-- Foo-Id: 2 -->
    <Bar>hijk</Bar>
    <Foo>lmn</Foo>   <!-- Foo-Id: 3, Parent-Id: 2 -->
  </Foo>
</NewDataSet>

Таким образом, это правильно становится 4 записи в вашем результате, с ключом "родитель-потомок" "Foo-Id-0"

Попробуйте:

<NewDataSet>  
  <Rec>              <!-- Rec-Id: 0 -->
    <Bar>abcd</Bar>
    <Foo>efg</Foo>   
  </Rec>
  <Rec>              <!-- Rec-Id: 1 -->
    <Bar>hijk</Bar>
    <Foo>lmn</Foo>   
  </Rec>
</NewDataSet>

Что должно привести к:

Bar     Foo        Rec-Id
abcd    efg        0
hijk    lmn        1
0 голосов
/ 09 сентября 2008

Это мои наблюдения, а не полный ответ:

Я предполагаю (не пытаясь воспроизвести его сам), что пара вещей может происходить, когда DataSet пытается "сгладить" иерархическую структуру с реляционной структурой данных.

1) размышление о данных с точки зрения реляционной базы данных; нет очевидного поля первичного ключа для идентификации каждого из элементов Foo в коллекции, поэтому DataSet автоматически использовал порядковый номер в файле в качестве автоматически сгенерированного поля с именем Foo-Id.

2) На самом деле есть два элемента, называемых «Foo», что, вероятно, объясняет создание странного имени для столбца «Foo-Id-0» (он автоматически сгенерировал уникальное имя для столбца - я полагаю, может воспринимать это как отказоустойчивое поведение в наборе данных).

...