Десериализация XML с помощью serde-xml-rs создает ошибку (дублирующее поле `$ value`) - PullRequest
0 голосов
/ 29 апреля 2018

Этот является примером схемы xml, которую я пытаюсь проанализировать. Только несколько полей представляют интерес для меня. Корнем схемы является PubmedArticleSet, который содержит> = 0 PubmedArticle записей. Я заинтересован в полях, содержащихся в этих записях. Я получаю ошибку в заголовке, хотя я не вижу проблемы, связанной с этой ошибкой здесь .

<PubmedArticle>
  <MedlineCitation>
     <PMID>xxxxxxxx</PMID>
     <date tags i don't care about/>
     <other date tags i don't care about/>
     <Article>
       <tags I don't care about/>
         <children I don't care about>  
       <other tags I don't care about/>
         <children I don't care about>
       <AuthorList>
         <Author>
           <LastName>xxxx</LastName>
           <FirstName>i don't care about this</FirstName>
           <Initials>xx</Initials>
           <AffiliationInfo>
              <Affiliation>String of text</Affiliation>
           </AffiliationInfo>
          </Author>
          <Author>same as above</Author>
        </AuthorList>
        <Lots of stuff I don't care about/>
      </Article>
      <More stuff I don't care about/>
    </MedlineCitation>
    <Final stuff I don't care about/>
  </PubmedArticle>

И я создал следующие структуры:

#[derive(Serialize, Deserialize, Debug)]
struct PubmedArticleSet {
    #[serde(rename="$value")]
    pub articleset: Vec<PubmedArticle>
}

#[derive(Serialize, Deserialize, Debug)]
struct PubmedArticle {
    #[serde(rename="$value")]
    pub medlinecitation: MedlineCitation,
}

#[derive(Serialize, Deserialize, Debug)]
struct MedlineCitation {
    #[serde(rename="$value")]
    pub pmid: PMID,
    pub article: Article
}

#[derive(Serialize, Deserialize, Debug)]
struct PMID {
    #[serde(rename="$value")]
    pub id: String
}

#[derive(Serialize, Deserialize, Debug)]
struct Article {
    pub authorlist: AuthorList,
    pub publicationtypelist: Vec<PublicationType>
}

#[derive(Serialize, Deserialize, Debug)]
struct PublicationType {
    #[serde(rename="$value")]
    pub publicationtype: String
}

#[derive(Serialize, Deserialize, Debug)]
struct AuthorList {
    #[serde(rename="$value")]
    pub authorlist: Vec<Author>,
}

#[derive(Serialize, Deserialize, Debug)]
struct Author {
    #[serde(rename="$value")]
    pub author: (LastName, Initials),
    pub affiliation: Affiliation
}

#[derive(Serialize, Deserialize, Debug)]
struct LastName {
    #[serde(rename="$value")]
    pub lastname: String
}

#[derive(Serialize, Deserialize, Debug)]
struct Initials {
    #[serde(rename="$value")]
    pub initials: String
}

#[derive(Serialize, Deserialize, Debug)]
struct Affiliation {
    #[serde(rename="$value")]
    pub affiliation: String

И я пытаюсь разобрать следующую функцию:

fn deser_article_records(result: &String) -> Result<PubmedArticleSet, Box<Error>> {
    if let Some(start) = result.find("<PubmedArticleSet>") {
        let records = serde_xml_rs::deserialize(result[start..].as_bytes())?;
        Ok(records)
    } else {
        Err("no articleset found")?
    }
}

1 Ответ

0 голосов
/ 19 ноября 2018

Я предполагаю, что у вас есть элементы XML с другими вещами между ними. Вы не показываете пример в приведенном выше фрагменте, но например:

<Author ...>
<SomethingElse ...>
<Author>

serde_xml_rs, кажется, хочет, чтобы все теги были смежными согласно этому комментарию: https://github.com/RReverser/serde-xml-rs/issues/55

т.е.

<Author...>
<Author...>
<SomethingElse ...>

Если ваш XML не такой, вы можете решить это с помощью Enum.

, например

#[derive(Deserialize, Debug)]
struct Article {
    details: Vec<Detail>
}

#[derive(Deserialize, Debug)]
enum Detail {
    Author(Author),
    SomethingElse(SomethingElse)
}

#[derive(Debug, Deserialize)]
struct Author {
    ...
}

#[derive(Debug, Deserialize)]
struct SomethingElse {
    ...
}
...