分享、学习、提高
2010/04/23 21:19
文章作者:Enjoy 转载请注明原文链接。
百度站长俱乐部里也有不少问题了,虽然好像只有2个人在提问,也没有邀请码可以获取:(
我几乎每条都看了一边,将值得记录的整理了说来,供大家分享。
以下均来自于百度站长俱乐部版主Lee回复的一些内容,几乎是原话,略加整理。

第一次的整理:百度是否支持nofollow,是否认301? http://www.9enjoy.com/baidu-nofollow-301/

1.百度site语法的结果数不准。而且这种不准的幅度甚至不是稳定的,可能今天比较接近真实值,明天就发生大波动了。其中的原因不便多解释。site语法查询的检索结果,更多情况下类似随机的排序,除了说明这些网页已经被收录以外,不能说明任何问题。

2.site本意起到限定作用,那么“seo site:www.9enjoy.com”的意思,即是“在www.9enjoy.com的限定集内,seo搜索结果按权值高低的正常排序”。

3.在百度快照里页面没有显现完整,首页底部(友情链接及版权信息那块)代码和页面都没在快照中出现,那么友情链接对其他网站还有用吗?
lee回复:百度spider抓取的网页文件非常之大,链接提取完全不必担心。我们建议网页(包括代码在内)不要过大,过大的网页会有抓取截断;而内容部分,也不要过大,过大会被索引截断。当然,抓取截断的上限,会远大于索引截断的上限。

4.不少站只收录不带www的URL,不收录带www的?
lee回复:这应该是系统缺陷问题。

5.网页的导出链接数多少为宜?
lee回复:一般情况下,链接数量,会影响到这些链接从该页面上所获得的权重;少就多分一些,多就少分一些。

6.百度11位现象?
lee回复:这是一个很有意思的“术语”。作为搜索引擎,10位还是11位不是关键,关键是用户体验。作为站长,在看待网站排序的时候,如果不仅仅是从自己的利益角度出发,也能从一个普通用户角度出发,那么我们相信,大家就能找到更多的共鸣了。
enjoy:这是不是就是说有人工参与进行单关键词调整呢?

7.百度关于robots的建议:http://www.baidu.com/search/robots.html

8.百度收录后很快又删除是怎么回事?
lee回复:很抱歉的说明一下,这是我们系统的一个缺陷,正在修复中。预计很快就不会有这种让人faint的事情出现了。

9.为什么有些站每天不更新反而百度的快照天天新。有些站提供原创内容每天更新反而百度快照不更新。
lee回复:   前面曾经说过,我们内部也对结果页上的时间戳(在url后面)很纠结,有计划整改。实际上有的搜索引擎早已经把这个时间戳去掉了,而代之以网页更新的实际时间。
这个时间戳既然给内部人员也带来了困扰,那么对站长和用户,显见也是有困扰的。所以,我的建议是不必太过关注这个时间戳。如果期望看到精确的spider行为,最直接的手段是分析网站日志。

10.正常的301永久重定向,旧url上积累的各种投票信息会全部转移到新url上。

11.服务器开启gzip压缩,不会对spider抓取产生影响,我们会以压缩的方式来抓取。并且也能够节省站点的网络流量。

12.百度在识别和处理超链作弊方面,仍存在很多问题。


百度站长俱乐部地址:http://tieba.baidu.com/club/9374916
发表评论
表情
emotemotemotemotemot
打开HTML
打开UBB
打开表情
隐藏
昵称   密码   游客无需密码
网址   电邮   [注册]
               

验证码 不区分大小写