获得Baidu搜索的相关词awk脚本
时间:2006-07-13 来源:developing_T
#一个分析baidu搜索结果页面,获得相关搜索关键词的awk脚本 getWords.awk
BEGIN {
FS="\">"
beginline=500 #定义一个开始行,设置一个较大值
endline=500 #定义一个终止行,设置一个较大值
found=0 #定义是否找到的标志
}
{
while($0~/<tr><td style="font-size:14px;font-weight:bold;width:70px;">相关搜索<\/td>/){ #查找web代码里的这行
beginline=NR+3
endline=NR+23
found=1
break
}
if(found){
if( (NR>=beginline)&&(NR<=endline)&&(NF>=3) ){
mystring=$3
sub(/<\/a><\/td>^M/,"",mystring)
print mystring
}
}
}
# 执行这段脚本可以使用:
# curl "http://www.baidu.com/s?wd=哈哈"|awk -f getWords.awk
BEGIN {
FS="\">"
beginline=500 #定义一个开始行,设置一个较大值
endline=500 #定义一个终止行,设置一个较大值
found=0 #定义是否找到的标志
}
{
while($0~/<tr><td style="font-size:14px;font-weight:bold;width:70px;">相关搜索<\/td>/){ #查找web代码里的这行
beginline=NR+3
endline=NR+23
found=1
break
}
if(found){
if( (NR>=beginline)&&(NR<=endline)&&(NF>=3) ){
mystring=$3
sub(/<\/a><\/td>^M/,"",mystring)
print mystring
}
}
}
# 执行这段脚本可以使用:
# curl "http://www.baidu.com/s?wd=哈哈"|awk -f getWords.awk
相关阅读 更多 +