文章详情

  • 游戏榜单
  • 软件榜单
关闭导航
热搜榜
热门下载
热门标签
php爱好者> php文档>.net中获取html页面并提取其中的超链接 ...

.net中获取html页面并提取其中的超链接 ...

时间:2010-08-09  来源:caoguangguang

下列的函数分别用于获取HTML页面和提取页面中的超链接。

using System.Net; using System.IO; using System.Text; using System.Text.RegularExpressions; string[] GetLink(string strHtml) {   string RegexStr = "(?<=href[\\s\\r]*=[\\s\\r]*[\"\'])([^\"\'\\s\\r>]*)(?<=[\"\'\\s\\r]{0,1})"; Regex reg = new Regex(RegexStr, RegexOptions.IgnoreCase); MatchCollection mc = reg.Matches(strHtml); if (mc.Count > 0) { string[] strHref = new string[mc.Count]; int i = 0; foreach (Match m in mc) { strHref[i] = m.Groups[1].Value; ++i; } return strHref; } return null; } string GetHttp(string strUrl) { string strHtml = ""; WebResponse wrp = null; try { WebRequest wrq = WebRequest.Create(strUrl); wrq.Timeout = 60000; wrp = wrq.GetResponse(); } catch (WebException e) { } catch (Exception e) { } finally { if (wrp != null) { StreamReader sr = new StreamReader(wrp.GetResponseStream(), Encoding.GetEncoding("GB2312")); strHtml = sr.ReadToEnd(); sr.Close(); wrp.Close(); } } return strHtml; }

可首先使用GetHttp获取指定URL的页面内容,然后将此内容作为参数传给GetLink,GetLink返回的String数组中的每个元素代表一个超链接。

相关阅读 更多 +
排行榜 更多 +
辰域智控app

辰域智控app

系统工具 下载
网医联盟app

网医联盟app

运动健身 下载
汇丰汇选App

汇丰汇选App

金融理财 下载