|
C#写一个简单的浏览器,遇到一个小小的问题,即:在通过WebBrowser.DocumentText获取的页面内容是乱码
System.IO.StreamReader getReader = new System.IO.StreamReader(this.webBrowser.DocumentStream, System.Text.Encoding.GetEncoding("gb2312"));
string gethtml = getReader.ReadToEnd();
注意:这儿使用的不是DocumentText属性获取的页面内容。
UTF8编码方式,只是在读取的时候,指定为UTF8即可啊.
System.IO.StreamReader getReader = new System.IO.StreamReader(this.webBrowser.DocumentStream, System.Text.Encoding.GetEncoding("utf8"));
WebBrowser的编码可以从文档对象中获得,将代码改为如下即可。
System.IO.StreamReader getReader = new System.IO.StreamReader(this.webBrowser.DocumentStream, System.Text.Encoding.GetEncoding(this.webBrowser.Document.Encoding));
string gethtml = getReader.ReadToEnd();
|
上一篇:周金桥:IT人(程序员),请爱惜你的身体下一篇:当前线程不在单线程单元中,因此无法实例化 ActiveX 控件“8856f961-340a-11d0-a96“
|