Я делаю простой веб-скребок, который записывает слова для меня, а затем записывает их в базу данных. все работает, но по какой-то причине он заменяет некоторые символы знаками вопроса, и когда я просматриваю эту информацию на простой веб-странице php, я вижу много ошибок в текстах.
I?m = I'm
Let?s = Let's
haven?t = haven't
stuff like that.
Я знаю, что ошибка в c # и моем коде, потому что я ставлю точки останова, прежде чем он записывает в базу данных, и отображаю его в поле расширенного текста. Как заставить его правильно отображать эти символы?
public static string getSourceCode(string url)
{
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse resp = (HttpWebResponse)req.GetResponse();
StreamReader sr = new StreamReader(resp.GetResponseStream());
string sourceCode = sr.ReadToEnd();
sr.Close();
resp.Close();
return sourceCode;
}
........
string url = txbURL2.Text;
string sourceCode = sourceCode = WorkerClass.getSourceCode(url);
int startIndex = sourceCode.IndexOf("<td valign=\"top\" width=\"100%\">");
sourceCode = sourceCode.Substring(startIndex, sourceCode.Length - startIndex);
........
//Gets Lyric
startIndex = sourceCode.IndexOf("<br><b>Lyrics:</b><br><br>") + 30;
endIndex = sourceCode.IndexOf(" <br><br>", startIndex);
string lyric = sourceCode.Substring(startIndex, endIndex - startIndex) + "";
rtbLyric.Text = lyric;
//End Lyric