xmlNodeGetContent вводит новые строки - PullRequest
0 голосов
/ 01 июля 2011

Кажется, xmlNodeGetContent вводит новые строки, где их не должно быть.

Это дамп узла:

ELEMENT td
  ATTRIBUTE width
    TEXT
      content=100%
  ATTRIBUTE bgcolor
    TEXT
      content=#FFFFFF
  ELEMENT font
    ATTRIBUTE face
      TEXT
        content=Arial,Helvetica
    ELEMENT font
      ATTRIBUTE color
        TEXT
          content=#0000FF
      ELEMENT font
        ATTRIBUTE size
          TEXT
            content=-1
        ELEMENT b
          ELEMENT br
  TEXT
    content= 
  ELEMENT hr
  ELEMENT font
    ATTRIBUTE face
      TEXT
        content=Arial,Helvetica
    ELEMENT font
      ATTRIBUTE color
        TEXT
          content=#0000FF
      ELEMENT font
        ATTRIBUTE size
          TEXT
            content=-1
        ELEMENT b
          TEXT
            content=love
        ELEMENT br
  TEXT
    content= 
  ELEMENT ul
    ELEMENT li
      ELEMENT small
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#FF0000
          TEXT
            content=s
        TEXT
          content= iubire 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#FF0000
          TEXT
            content=f
        TEXT
          content=; dragoste 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#FF0000
          TEXT
            content=f
        TEXT
          content=; scump 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#FF0000
          TEXT
            content=m
        TEXT
          content=; 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#0000FF
          TEXT
            content=to be in love with
        TEXT
          content= a fi #C3#AEndr#C4#83gostit de; 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#0000FF
          TEXT
            content=to send one's love
        TEXT
          content= a transmite complimente; 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#0000FF
          TEXT
            content=love affair
        TEXT
          content= amor; 
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#0000FF
          TEXT
            content=lovelorn
        TEXT
          content= dezn#C4#83d#C4#83jduit
    TEXT
      content= 
    ELEMENT li
      ELEMENT small
        ELEMENT font
          ATTRIBUTE color
            TEXT
              content=#FF0000
          TEXT
            content=vt
        TEXT
          content= a iubi; a-i pl#C4#83cea
    TEXT
      content=

И это текст, возвращаемый xmlNodeGetContent:

  s iubire f; dragoste f; scump
  m; to be in love
  with a fi îndrăgostit de; to send
  one's love a transmite complimente; love affair amor; lovelorn deznădăjduit
  vt a iubi; a-i
  plăcea

Как видите, есть разрывы строк, которых не должно быть.

1 Ответ

0 голосов
/ 01 июля 2011

Несмотря на бесполезные комментарии (неужели неясно, что это был за вопрос?), Я хотел бы поделиться своим объяснением.

Дополнительные строки из-за HTML Tidy, преобразующего документ.

...