<b>全自动监控网站关键词排名(Python实现)</b>

作者:Lgo100 来源:未知 2012-04-17 23:33:58 阅读 我要评论 直达商品

c.setopt(TIMEOUT, 120)

for key in kwargs:

c.setopt(locals()[key], kwargs[key])

c.setopt(URL, url)

c.setopt(WRITEFUNCTION, s.write)

if ‘USERAGENT’ not in kwargs:

c.setopt(USERAGENT, useragent)

if ‘REFERER’ not in kwargs:

c.setopt(REFERER, url)

while 1:

try:

c.perform()

break

except:

if retry:

time.sleep(delay)

else:

return False

return s.getvalue()

  对于简单的采集琅缦沔需要用到的下载功能,已经被整合在了这个模块之中。如User-agent轮换、自动301/302跳转等、使用当前URL作为REFERER的有些取巧的体例等。这个模块的代码可以日后再慢慢理解,此刻只要知道它的用法即可。

  首先到放置Python剧本的目录,将前面一段代码保留为curl.py,然后在统一目录下建树一个新文件,输入以下测试代码:

# -*- coding:utf-8 -*-

import curl

print curl.curl('http://g.cn/') #这样即下载了一个网页

#以下是斗劲保险的下载体例,因为各类原因,就算总体很不变的网站也偶然会呈现网页且则无法打开的情形

#当网页下载犯错时,如不美观retry为True,则会不竭重试,直到下载完网页

#delay则指定了几回重试之间的侍旧肃离,以秒为单元

print curl.curl('http://g.cn/', retry=True, delay=1)

#以下用到了一些Curl的参数,具体声名可见:http://curl.haxx.se/libcurl/c/curl_easy_setopt.html

print curl.curl('http://g.cn/', FOLLOWLOCATION=False, COOKIE='mycookie')


  推荐阅读

  <b>合格SEOER的白帽操作手册:SEO效果最大化</b>

巨匠好,我是虚子雨。不知道巨匠对于白帽seo关注度有若干好多,小我因为喜欢进行白帽seo操作,对于这个辞书关注度就斗劲高,而且也倡导我四周的伴侣进行白帽seo,因为黑帽seo有时辰虽然短时刻内有不错的效不美观,可>>>详细阅读


本文标题:<b>全自动监控网站关键词排名(Python实现)</b>

地址:http://www.lgo100.com/a/34/20120417/51890.html

顶一下

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度