文章详情

  • 游戏榜单
  • 软件榜单
关闭导航
热搜榜
热门下载
热门标签
php爱好者> php文档>抓去新浪 网页

抓去新浪 网页

时间:2010-10-14  来源:kanison_zhang

                 sina 网页抓取统计信息    首先 list 列表页是在一个frameset 里,所以直接通过访问 我们看到的页面(比如:http://down.tech.sina.com.cn/3gsoft/softlist.php?osid=5)里面的源代码就没有我们想要的list信息,我通过在frameset里查看源代码,看到了真实的list页面地址(例如:http://down.tech.sina.com.cn/3gsoft/iframelist.phpclassid=&keyword=&osid=5&vid=0&page=2)其中 osid 表示操作系统的id,通过观察发现(android id=4,symbian id=1,windows id=2,iphone id=5,java id=55)  page表示 第几个list页面,
   其次 抓到list里的每个软件信息后要针对每个软件在进行抓取
 
相关阅读 更多 +
排行榜 更多 +
我的武侠梦手游下载

我的武侠梦手游下载

角色扮演 下载
快乐连连看下载免费版

快乐连连看下载免费版

休闲益智 下载
泛滥死者布道手机版下载

泛滥死者布道手机版下载

角色扮演 下载