百度第一天收录页面第二天消失删除

作者 FarLee 2010年4月17日 19:23:57   ‖浏览(11,081)

最近发现,百度第一天会很及时地收录WordPress博客的文章页面。比如远方博客今天凌晨发表的一篇日志Google地图企业网络推广-区域性商家推广,现在已经被收录了,用标题在百度搜索结果如下:

百度第一天收录页面

但是第二天,明天再用同一个标题来搜索,可能就不会有这个结果了;甚至用site:farlee.info 查看百度是否收录了该页面,会发现在site结果中这篇文章日志已经消失不见了。而Google收录正常。

因为前两天远方博客发表的几篇文章:Godaddy二级域名如何添加子域名twitter使用方法新手技巧和新浪微博 都是如此。这是什么原因会导致第二天消失呢?是这些页面第二天就被百度删除了吗?

带着这些疑问,今天在网上搜了一下,自从百度推出半死不活的凤巢广告系统以后,很多网站管理员都发现了自己的网页存在这种现象:百度第一天收录了网页,第二天百度搜索结果中就消失不见了。他们分析的主要原因有以下一些:

  • 1. 网页内容的原创性:远方博客每篇文章都是一个字一个字打出来的,可以排除这个原因。
  • 2. 原创文章被高权重的网站转载:虽然这里的部分文章会被一些网站转载,但是一般很少会有高权重网站在第二天就转载文章的。
  • 3. 网站更新:博客更新基本上维持在一天一篇,发表时间也基本在晚上12点前后,这种更新算是有规律了吧。
  • 4. 你的空间服务器问题:最近我的网站服务器非常正常,虽然达不到百度服务器的水平,那也不至于因为网站服务器问题导致第二天网页被删除。
  • 5. 百度服务器出错了:百度服务器down机的可能性较小,因为都是第二天消失删除,这么有规律的down机一般是不可能的。

排除了以上原因,最后综合分析得出以下几点可能是真正导致百度收录后第二天删除某页面的原因:

1. 百度自身的原因:前面提到了这个问题是百度推出凤巢广告竞价体系后才出现的,所以这肯定和百度自身的排名策略有关系。

一方面百度更新索引速度加快了,能马上收录最新的网页博客日志资讯;但是同时百度索引服务器处理效率没有跟上来,百度需要花费较长时间的综合分析之后,才能判断出某个网页是否原创,是否有价值,是否给你收录和索引到数据库中。

另外一方面可能是百度调整了新的搜索结果排名策略,它将我们的博客文章页面当作了新闻源来索引。新闻源网页有一个明显的特征就是时效性,只收录第一天最新发生的资讯文章,到了第二天这篇文章的页面就成了老文章、旧新闻,因此百度将该网页删除,搜索结果中就消失了。

打个比方,这就相当于Google 博客搜索,谷歌博客搜索的排名是每天都变化的。远方博客推测,百度在不久以后也会推出博客搜索(2010年5月7日更新:今天发现正如推测所说,百度已经推出了百度博客搜索测试版),

百度博客搜索测试版

因为百度最近在拼命地和google学习,像最近推出百度站长平台,修正搜索结果页面url中的中文乱码问题等等,在Google百度SEO优化对比-百度七宗罪 文中有详细介绍。这有点扯远了。

2. 第二个可能原因是网页权重不够:

百度第二天收录首页

用昨天发布的一篇文章标题进行百度搜索,发现搜索结果第一条是网站首页。博客首页http://h.farll.com/权重高于文章页面,百度在抓取首页时发现了这个长尾关键词,再比较发现文章页面有重复,因此第二天就将权重更高的首页收录到搜索结果中,将权重低的页面从索引数据库中删除。

3. 第三个原因是个案:301重定向问题

因为远方博客采取了301重定向,将www域名301重定向到不带www的域名上。同时带有www网址的文章页面也重定向到了不带www的WordPress博客首页http://h.farll.com/百度更认识带有www的网址,百度不喜欢顶级域名短网址,而Google却是平等对待这两个域名。百度会优先考虑www的域名,所以一旦百度将文章页面带有www的url优先索引,那么将会被301重定向到首页,因此百度就将首页取代这篇新发布的文章页面,出现在搜索结果中。就像上面第2条中举的例子一样。

因此如果关注百度搜索排名,存在百度第一天收录了网站页面,第二天页面被删除消失问题的朋友,可以注意两点:

  • 一、百度对301转向处理得很不好,或者处理时间很慢,需要个把月时间才能将重定向后的网页加入索引。因此尽量少用301重定向。
  • 二、在选择主域名的时候,请尽量选择带www的域名作为网站主域名。不带www的域名只有一个好处,那就是短裤(短、酷)。

对Google来说,因为还可以设置网站首选域,所以远方博客撤销了www域名的301重定向也没关系。对于百度则看着办了,如果百度站长平台可以实现相关的设置,那最好;若不可以设置,则可以考虑过段时间将windows 主机IIS 换成Linux 主机,通过Apache 服务器的 .htaccess文件设置301重定向(整站)就简单多了。百度反应都是慢一个节拍的,只能过十几天再看结果了。


“百度第一天收录页面第二天消失删除”文章评论(11)

  1. 是哦,也曾注意有这样的情况。

  2. 不是很注意百度的收录~

  3. 百度这种情况真是让人心烦

  4. 我也遇到这样的问题,不过我是新站
    不知道博主网站年龄

  5. 我也遇到了这样的问题
    写得很详细

  6. 我的博客也遇到过这个问题,看了您的文章才知道是这么回事啊

  7. 一切都是猜的。

    不去看重就行了!

  8. 有才… 说的太深了.. 学习了“`

  9. 我的网站也是这样,很巧合的是我也是.INFO的域名,感觉百度对这样的域名也会区分对待,因为很多人用他来做垃圾站。PS:.info要嘛免费要嘛10元RMB左右。

  10. 分析的很好,我的大概也是这个原因。。。

  11. 这个很难说,我的网站做好当天就收录了,第二天就消失了

来说兩句