C# 抓取网页上的文字,保存到数据库
时间:2011-05-21 来源:白草红叶
<
string content = string.Empty;
string str = string.Format("http://www.bd.com/s?wd={0}&", key);
WebRequest wrq = WebRequest.Create(str); WebResponse wrs = wrq.GetResponse();
using (StreamReader dr = new StreamReader(wrs.GetResponseStream(), Encoding.GetEncoding("gb2312")))
{
string two_sort = Dr["two_sort"].ToString(); content = dr.ReadToEnd();//这就是全部内容 int start = content.IndexOf("相关搜索");
int end = content.IndexOf("");
string StrOldHtml = content.Substring(start, end - start);
StrOldHtml = Utility.StringHelper.stripHtml(StrOldHtml); StrOldHtml = StrOldHtml.Replace("相关搜索", "");
StrOldHtml = StrOldHtml.Replace(" ", "");
content.add(content);
OK,处理完毕,只是在线交流,无其他用途
在这里只是简单的演示下,有事可以留言。谢谢