截取整个网页的程序
时间:2010-12-24 来源:yudotyang
最近市场部的同事要求将自己网站上的每个页面每天抓取一次并保存成一张完整的图片。开始的时候通过php的exec函数 运行 一些第三方的工具可以实现。使用过的第三方工具有IECapt,Web2pic,和webshotcmd.exe等这些命令行。可是在使用过程中发现由于网页上并非只是html代码,还有一些大量的外边链接和flash的广告,不知道怎么回事 在执行过程中就开始死掉了。总共就抓取八十几张图片 有时候一天都抓取不玩。
最近发现python的Qypt4 中的webkit工具可以实现这个功能,可是在试用的过程中 好多flash的广告不能渲染在图片上。我们抓取网站成图片的目录就是方便通过图片来检查这些flash的广告,可是这样就远远没有达到目的。请问大家有什么办法可以一起将网站中的flash也渲染到图片上吗?
最近发现python的Qypt4 中的webkit工具可以实现这个功能,可是在试用的过程中 好多flash的广告不能渲染在图片上。我们抓取网站成图片的目录就是方便通过图片来检查这些flash的广告,可是这样就远远没有达到目的。请问大家有什么办法可以一起将网站中的flash也渲染到图片上吗?
相关阅读 更多 +