文章详情

  • 游戏榜单
  • 软件榜单
关闭导航
热搜榜
热门下载
热门标签
php爱好者> php文档>谈采集与权重!

谈采集与权重!

时间:2008-07-26  来源:耿志涛

随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!   
网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!   
当论坛采集工具 也出现的时候 采集之风就更甚了!   
  
基本上网站站点可以随意复制了!   
  
既然本文谈的是采集与权重,我现在好像离题了 我们进入正题哈!!   
首先来说下我的环境!   
  
网站类型:分类信息网   
域名注册年限:2年   
在百度权重:比被采集站点站点相比要高点   
目的:把采集变原创,保证排名和权重   
搜索引擎:百度   
  
我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!   
  
1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里  按照百度的规律 一条信息从收录到显示结果基本就这几步!   
  
这几步 最块也要2天时间才能完成! 从1到5  基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!   
当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!   
  
按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!   
  
列出例子说明:   
被采集站点 每天大概有500条新的分类信息   
我利用采集工具设置自动采集!   
每日 8点 10点 12点 14点 16点 18点 20点 22点 0点  进行采集!!并且进行直接入库!   
基本上我站信息和被采集站信息发布时间误差不超过 30分钟!   
  
我们来看下 百度是怎么判断的   
  
5.规则审核:   
            1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,   
            2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比   
            3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!   
  
知道了百度的审核的机制 我们就很好来操作了!   
  
及时更新了。说白了,。就是及时采集!   
我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!   
到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!   
为什么你也是及时采集了他,但是仍然和他不能比!   
那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!   
  
说到权重 我说下百度如何判定权重的   
  
  
1.外链   
2.网站运营时间的长短   
3.流量   
4.采用的编写语言!   
这只是一部分! 还有的我不在鏊述!   
  
要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!   
流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!   
  
  
总而言之!   
想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!   
  
还有一条!有很多小型网站是你采集的不错选择!   
  
采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!
相关阅读 更多 +
排行榜 更多 +
粘粘世界2中文版

粘粘世界2中文版

休闲益智 下载
业余漂移赛车

业余漂移赛车

赛车竞速 下载
水下自行车模拟器

水下自行车模拟器

赛车竞速 下载