代码狗-如何提交网站和sitemap网站地图给搜索引擎
时间:2011-04-30 来源:blue.net
如何提交网站给搜索引擎
新开网站,肯定无什么流量,所以,虽然各大搜索引擎每天都放蜘蛛来抓取网页,但很难抓到你的网站,这就是为什么有的网站开通半个月也没有被收录的主要原因。
所以,站长需要主动出击,把网站提交给搜索引擎。
Google说,我们每次抓取网页时都会向索引中添加并更新新的网站,同时我们也邀请您提交您的网址。我们不会将所有提交的网址都添加到索引中,也无法预测或保证这些网址是否会显示以及何时会显示。请注意:您只需提供来自托管服务商的顶层网页即可,不必提交各个单独的网页。我们的抓取工具 Googlebot 能够找到其他网页。Google 会定期更新它的索引,因此您无需提交更新后的或已过期的链接。无效的链接会在我们下次抓取时(即更新整个索引时)淡出我们的索引。
Google的话是具有代表性以及指导意义的。
下面是各大搜索引擎的网站提交入口
<lastmod>2009-06-04</lastmod> | 是该URL的最后一次修改时间 |
<changefreq>daily</changefreq> | 表示该URL的更新频率,可以设置为daily weekly always |
<priority>0.1</priority> | 是该URL在整个站点的权重,是1.0~0.1之间的数值 |
sitemap文件的限制:
- 必须是utf-8的编码格式
- 每个sitemap.xml文件包含的URL建议不超过5w个URL
- 单个sitemap.xml文件不能超过10M大小
在一个Sitemap索引文件中包括25亿个URL
最近,Google改进了其对Sitemap的支持。其中最重要是增加了支持的Child Sitemap(子Sitemap)的数量。以前,Google对一个Sitemap索引文件最多只能支持1000个子Sitemap,在最近一次的更新中,这个数字变成了50000,这意味着一个Sitemap索引文件中最多可以包含25亿个URL,我相信这已经可以满足一般大型网站的需求了。
提交sitemap有如下两种方式:
- 使用 robots.txt 提交 Sitemap
您可通过向 robots.txt 文件添加以下行(使用您自己的 Sitemap 的完整路径更新示例网址)的方式通知 Google 以及其他搜索引擎有关您 Sitemap 的信息:
Sitemap: http://example.com/Sitemap 位置.xml此指令不受 User-agent 行的影响,因此,您可将其放置在您文件中的任意位置。如果您有 Sitemap 索引文件,那么,您也可以添加该文件的位置。您无需列出索引文件中所列出的每个单独的 Sitemap。
我们仍然建议您通过您的网站管理员工具帐户提交 Sitemap,这样,您可确保 Sitemap 处理无误,并可获得有关您网站的其他统计信息。
- 主动提交sitemap文件
下面是提交入口:
Yahoo! | http://sitemap.cn.yahoo.com/mysites |
baidu | 现在百度不支持Sitemap。可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。 |