static string GetHtml(string url) { return GetHtml(url, null); } // 獲取網(wǎng)頁的HTML內(nèi)容,指定Encoding static string GetHtml(string url, Encoding encoding) { byte[] buf = new WebClient().DownloadData(url); if (encoding != null) return encoding.GetString(buf); string html = Encoding.UTF8.GetString(buf); encoding = GetEncoding(html); if (encoding == null || encoding == Encoding.UTF8) return html; return encoding.GetString(buf); } // 根據(jù)網(wǎng)頁的HTML內(nèi)容提取網(wǎng)頁的Encoding static Encoding GetEncoding(string html) { string pattern = @"(?i)\bcharset=(? <charset>[-a-zA-Z_0-9]+)"; string charset = Regex.Match(html, pattern).Groups["charset"].Value; try { return Encoding.GetEncoding(charset); } catch (ArgumentException) { return null; } } 從CSDN找個這個方法區(qū)別的網(wǎng)站內(nèi)容,但是有個問題。網(wǎng)頁的CSS文件和JS文件別人用的是相對地址,無法獲取。(包括CSS里可能有設(shè)置背景圖片之類的用的也是相對地址,是相對于CSS文件的地址。) 請問如何能獲取他們的絕對地址?各位大蝦幫幫忙。。急用。
- 2 回答
- 0 關(guān)注
- 875 瀏覽
添加回答
舉報
0/150
提交
取消