文章详情

  • 游戏榜单
  • 软件榜单
关闭导航
热搜榜
热门下载
热门标签
php爱好者> php文档>python抓取页面数据总结一

python抓取页面数据总结一

时间:2009-01-21  来源:hkebao

1.类A中的一个方法Fun1调用了Func2的方法是这样来写的:
class A:
    def start(self):
        self.Fun1()
    def Fun1():
2.创建一个类的对象然后调用这个类中的一个方法
写一个类
class A:
    hostlist={}
    log=Log()
    def getHost(self):
        try:
           m=model_host()
           lines=m.selectMuti()#调用这个类中的一个方法
        except Exception,e:
           print str(e)
        self.hostlist=""
3.创建多线程抓取记录
class CheckURI(threading.Thread):  #通过继承多线程类实现的
     def __init__(self,_values):   #初始化操作的继承了父类中的方法的
        threading.Thread.__init__(self)
       
        self.host = _values[0]
        self.uri = _values[1]
     def dead(self):               #线程关闭的时候执行退出操作的
        exit(0)

     def run(self):                #这个线程真正要做的事情
        count = 1
time.sleep(self.period)            #此线程休眠一个时间段

如何进行判断这个页面是否是正常的可以通过发送一个HTTP请求操作的:
def Check(self):
   
        FirstTime = time.time()
        try:           
            httpconn = httplib.HTTPConnection(self.host)
            httpconn.request(self.method,self.uri)
            req = httpconn.getresponse()
            httpconn.close()
            try:               
                self.code = float(req.status)
                print self.code             
            except Exception,e:
                self.code = 0
                self.log.log('CHECK ' + str(e))

        except Exception,e:
            print str(e)
            self.code = 0
            self.log.log('CHECK ' + str(e))
        finally:
            LastTime = time.time()
            self.timeconsumes = round((LastTime - FirstTime),2)
sql = "INSERT INTO checklog (host,code,timeconsumes,checktime) values ("
        sql += " '" + _host + "',"
        sql += " '" + _code + "',"
        sql += " '" + _timeconsumes + "',"
        sql += " '" + _checktime + "')"
将一条长的SQL进行分割成若干段小的SQL命令啊!

    
相关阅读 更多 +
排行榜 更多 +
找茬脑洞的世界安卓版

找茬脑洞的世界安卓版

休闲益智 下载
滑板英雄跑酷2手游

滑板英雄跑酷2手游

休闲益智 下载
披萨对对看下载

披萨对对看下载

休闲益智 下载