百度先生:你在看谁家的黄脸婆?(关于百度收录策略)

google应用及研究, 百度搜索引擎研究, 社会百态 No Comments »

来自:汽车维修管理软件博客,原文: 看不懂的百度收录策略

近半年的收录策略的调整,包括百度和谷歌都有很大改变。如果你是站长的话肯定对最近这些调整也有体会。

首先,百度收录快、收录多,谷歌收录慢、收录少,这种局面完全是调过来了。百度近最近半年对新站的收录都比较慢,而且页面不容易收录,对于质量不太高的文章K得很快,整站K掉是常有的事情。经常逛一些站长有关的论坛就知道。

其次,因为百度与谷歌技术上的差距,百度对一些站点的页面无法收录到。所以有很多站的整站收录数百度的要比谷歌少。谷歌开始更看重时效性,对于新的文章以最快的速度收录,这一点改变主要是针对博客,并且是普通的博客。比如我在汽车修理厂管理博客上发表文章,只需要几分钟就可以收录。这一点对百度来说,几乎是不可能完成的任务。当然,对于大站,百度和谷歌都是比较实时的收录,因为这些站有常驻的搜索蜘蛛。

据说,百度因为硬件设备的配置储备不够,面对目前互联网信息的爆发性质的增长完全准备不足,所以收录容量有限,百度面对这个问题不得收紧收录策略,对一些权威性不够,站点质量不高,文章质量也不高的站点不收录,同时也在大量的K站。

在文章做百度竞价可以改变百度收录问题吗?中说到:
话说到百度空间的收录问题,对于其它门户博客的收录都不断的增长。百度先生不知道在偷窥谁家的黄脸婆,总觉得别家的长得比自家的好看,质量比自家黄脸婆 好。所以百度空的收录一直都是下降,一年前就不止收录300万了,现在还是200万左右浮动。一年的时间,一千万的百度空间用户,这一年来难道什么都没写 吗?如此鄙视百度空间的用户!百度先生是不是该回家好好反省一下了??

百度为什么要喜欢别人家的黄脸婆?这无法看懂。关于黄脸婆的故事请看这里:你在看谁家的黄脸婆

看看目前百度对于百度空间都在收录什么吧,site:hi.baidu.com/一下,结果让我大跌眼界!第一篇文章是空的,第二篇也是“主 页博客相册|个人档案 |好友 文章列表 暂无文章。”如此的内容,第三、第四、第五……一直第47页,也就是说前面470篇文章都是无内容的页面。百度收的垃圾都放在前面去了。接下来的 47页里面那些文章打开来也是寥寥几字的小朋友写的。如果从空间的名称来看,前面47页绝大部分都是小朋友的空间。

百度空间中“暂无文章”是什么意思呢?原因有两个:一是之前写过文章,后来自己删除了,或者作者把它隐藏了。二是作者写了百度认为不符合百度空间协议的文章,百度把它删除或者屏蔽了。从百度快照来看,在抓取时就已经不存在了。

百度空间内“暂无文章”的例子当然不止那几百篇,那几百篇只是排在前面的活生生的例子。从第一个原因来说,这些小朋友会不约而同的把它删除或者隐藏了吗?完全不合理的推断。第二个原因:作者都是小朋友,不可能写出有违反百度空间协议明令禁止的文章。是不是还有第三种原因,百度认为他们是脑残一代写出来都是脑残文章,把它们统统删除掉,免得影响和谐。关于什么是脑残 非主流点这里。

“暂无文章”的问题扯远了,但是百度为什么要收录这些不符合百度收录指面的垃圾页面?实在是看不懂!

百度网站登录页面删除后,新站如何登录百度?

百度搜索引擎研究 1 Comment »

为了测试专题集中的网站竞争优势问题,我开通了另外一个汽车4S店管理及软件的博客。弄了几篇文章上去,准备提交到百度去,结果发现www.baidu.com/search/url_submit.html已经打不开了,返回404的错误页面:http://www.baidu.com/search/error.html

很抱歉,您要访问的页面不存在。

  1. 请检查您输入的网址是否正确。
  2. 如果您不能确认您输入的网址,请浏览百度更多页面,来查看您所要访问的网址。
  3. 直接输入要访问的内容进行搜索

百度应该不会开这种玩笑了,应该是故意删除的。对新站的收录减慢,收录要求提升,或者不收录,早有耳闻了。删除登录页面,对于不收录新站和提高收录要求是最直接的证明了。

 

新站如何登录百度? 

 

1、当然办法还是有的,百度一下:百度网站登录 结果如下:

百度搜索帮助中心-网站登录
网站登录 · 一个免费登录网站只需提交一页(首页),百度搜索引擎会自动收录网页。 · 符合相关标准您提交的网址,会在1个月内按百度搜索引擎收录标准被处理。 · 百度不保证一定能收录您提交的网站。 -→加入百度搜索联盟,快速登录百度搜索…
www.baidu.com/search/url_submit.html 4K 2007-12-29 百度快照 

第一名还是百度的收录页面,只是打不开而已,不过你可以点百度快照进去登录你的新站点,记得要刷新一下,验证码就会变了,输入网址后点提交,提示登录成功,感谢你的支持。还不知道是否有效。

 

2、在别的站做外部链接仍然是让百度收录你的新站的最好的办法。

 

Google PR分配与网站页面URL应该注意的细节

google应用及研究 1 Comment »

按以往的PR分配的规律,不同的域名既使是指向同一个页面,它们所分配到的PR也是不同的。Google在今年很早的时候就作了一个调整,对于域名www.whsjsoft.comwhsjsoft.com分配于同样的PR值。当然这不是偶然的相同,因为whsjsoft.com的反向链接远远低于www.whsjsoft.com,PR却是相同;经过多个网站的验证这个谷歌的这个调整是属实的。这两个域名基本相同,如果不同的域名指向相同的IP解析,那它们的PR也会是相同的。

由此可以得到一个结论, Google对不同的URL地址如果指向同一个页面的话PR值是相同的。

下面这个例子又将会推翻这个结论:

http://www.whsjsoft.com/chinese/Bs_Download.asp的PR为0。

http://www.whsjsoft.com/Chinese/Bs_Download.asp的PR为2。

它们之间的区别只差一个C的大小写之分。这就是网站设计时应该注意的细节了,URL地址应该始终的保持一致性,哪怕是大小写也要一样。

百度不支持Robots Meta标签

百度搜索引擎研究 2 Comments »

Yo2博客的标签相关的页面,打开你可以看到有这么一段代码:

<meta name=”robots” content=”noindex,follow” />

这个标签的意思是:不列入索引,但页面上的链接可以被查询。

简单点就是有这个标签的页面将不会被收录。在做收录查询时谷歌确实没有收录本博客标签相关的页面,但是百度不支持这个标签,所以百度收录了一些相关页面。

有关如何使用怎样使用Robots Meta标签?请看:

 http://www.dunsh.org/2007/03/07/robots-meta

Yo2博客tag将增加关键字密度引起百度的反感

WordPress及维护日志, google应用及研究, 百度搜索引擎研究 No Comments »

我这个博客的侧边栏原来有标签云(即tag群),标签云聚集了博客内的所有tag。Yo2的博客平台支持侧边栏中加入标签云的功能,这点倒是很方便,其它的博客倒是没有看见有这个功能。

为了增加文章的相关性,所以我的文章一般都有好几个相关的关键字作为标签。比如写一篇汽车维修管理制度的文章,贴上了汽车修理厂管理制度、汽车维修厂管理制度、汽修厂管理制度、汽修管理制度等多个意思相同的标签,目的只为客户能找到这篇文章,也为搜索引擎在搜索相关关键字时能找到这篇文章。为搜索引擎设计,还是为客户设计,两者都有吧。但是这个结果将导致标签云庞大,放在侧边栏后标签云是可以不断的自动拉长,但是将会增加每一个页面的关键字密度,包括首页。

在博客开始收录后的一段时间,文章基本上被百度收录了,但是没过两个星期,收录减少了一半,某些关键字排名也急速下滑。意识到这个问题之后,我把侧边栏的标签云取消了,降低了每个页面的关键字密度,而后收录也重新增长,排名也慢慢提升了,文章不多,所以开始基本上有google带来访客,每天20-30个IP左右,现在涨到每天70IP左右吧。

另外一个博客也见证了这个说法,http://www.whsjsoft.com/blog也是以汽车维修与管理为主题的博客,因为博客系统在谷歌爬行页面时报告太多404错误,问题几乎无法改善只好放弃了。这个博客主页上放了不少相关的关键字,本意并不是堆叠关键字,只是为了增加搜索相关性,博客主页虽然收录了,但是结果也是在百度中一直得不到排名。相反在google中排名还不错。google对无意的关键字过多并无多少反感。

博客tag将增加关键字密度的问题,虽然不是作弊行为,对百度来说还是有些过敏。在百度,单页的堆叠关键字还不如单个关键字重复个两三次更能得到好的排名。

来自:首佳汽车修理厂管理博客,转载请注明。

测试nofollow标签在百度的反向链接计算是否有用?

google应用及研究, 百度搜索引擎研究 11 Comments »

nofollow标签是一两年前由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响。这个标签的意义是告诉搜索引擎这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。

这个标签通常是用在博客的评论或论坛帖子中,因为这些地方是最多垃圾链接出现的地方。现在主流的博客和论坛软件都自动在评论和帖子的链接中加上了这个标签。几乎所有wordpress博客和Z-blog,当然Yo2博客也在内。

新站点的推广少不了用这种方法,在一些权重比较高的、流量大的博客或论坛发表评论并留下签名链接是新站长的一惯做法。如此说来,这种做法似乎毫无作用了,因为没用nofollow标签的博客太少了。 这个博客也是新站,前段时间做小量的这类工作,看来成效确实不大,至少在谷歌网站管理员工具中的反向链接统计中没有反应出任何有效链接。

很多文章都说Google,Yahoo,MSN表示支持这个标签,唯独百度不支持,所以垃圾链接仍然被计算在内。 是不是真的如此文所说的一样,我们来做个测试。本文第一个链接名称直接用网址,因为百度的domain查询不支持文字链接。另外,刚好要测试的网址在各大搜索引擎中反向链接都几乎为0。

如何建设一个对搜索引擎友好的网站?

百度搜索引擎研究 2 Comments »

百度在很多站长心目中,SEO与百度是对立的!因为百度几乎只靠出售竞价排名作为收入。其实呢,每一个搜索引擎都喜欢比较友好的网站或博客,百度的官方申明说:百度欢迎合理的搜索引擎优化,但是网站优化过度只会适得其反。合理的优化,有利于搜索引擎爬行网站、收录更多的有用的网页、挖掘出更多有价值的信息等;此类网站叫对搜索引擎友好的网站。

看过很多SEO(搜索引擎优化的缩写)的文章谈网站如何优化,针对Google优化的文章占多,baidu相对少一些。理论加上实践,我总结了一些经验给大家分享。

大家看百度的搜索帮助:http://www.baidu.com/search/guide.html
关于给站长的建站建议的部分内容对如何做百度优化来说相当重要。
1、网站结构宜简洁明晰,这是针对百度搜索引擎友好站点的基础。
2、内容独特,最好原创。如果未被收录的内容对搜索引擎来说也是原创,呵呵。
3、网站内容经常性的更新,百度最喜欢有新鲜内容的网站。
4、慎用你的友情链接,链向垃圾站点、优化过度的站点,会有连带性惩罚。
5、网站最终目标是客户而非搜索引擎;优化网站,内容为王。

针对百度目前计算网页排名的算法,总结几点优化细节:
1、网页标题、META标签
百度比Google更重视网页标题与所搜索关键字的匹配程度。网页的所描述的内容应该用准确的关键字作为网页标题,一个页面可用多个相关的关键字作网页标 题,但是网页中至少要出现一两次标题中所示关键字。关键字的匹配程度在相关搜索中竞争因素比重很高。对网页标题、META标签关键字的长度最佳建议:标题 ≦80,META关键字 ≦100,META描述≦200。
2、动态网页的转换。如果ASP之类制度的网站,网页内容是动态的,带参数访问的,此类网页竞争性很低。百度对于两个以上参数的很少会收录,最多只收录标题而不收录网页内容。此类网页应当把它转换成静态的路径或生成文件名。
3、目录、文件名称中包含关键字这一算法仍然很有用。
4、网站深度,网站地图。网站历史不长,PR不高的网站,对于超过两三次点击才能到达的页面很难被百度收录。对于这个问题可以制作网站地图来解决。PR本来跟百度没有关系的,但是判断一个网站质量,PR仍然是一个重要的参考。
5、交换有价值的友情链接。PR对Google有用,对百度同样也有用。百度和Google同样采用了相类似的Page Rank页面级别技术来评价一个网站的权威性。何为有价值的友情链接?比如你要优化QQ表情这个关键字,如果QQ.com跟你做了友情链接,那你网站的 QQ表情的竞争力自然不弱。
6、搜索引擎蜘蛛人抓取页面时,不支持javascript代码。很多网页带菜单导航,但是搜索引擎不能收录菜单导航所包含的链接。此类网站的结构性就太差了,几乎不能收录多少页。网站的导航一定要用静态链接。

不友好表现:
· 大量采用图片形式,没有可以检索的文本信息;搜索引擎蜘蛛人是基于文本方式来浏览网站的,没有文本就没有内容可抓。
· 网页没有标题,或者标题中没有包含有效的关键词;没有包含有效的关键词会被认为作弊而遭到降权处理。
· 网页正文中有效关键词比较少;关键词密度建议值:2%≦密度≦8%
· 网站导航系统让搜索引擎“看不懂”;比如上面所述第六条。
· 部分数据库信息对搜索引擎“保密”;
· 没有其他网站提供链接线索进行比较。没有外部链接,没有提交,搜索引擎自然找不到你。
首发于2007-01-31 19:37,地址:http://hi.baidu.com/whsjsoft/blog/item/458aae3e281e82fa828b131a.html
来自:汽车管理软件资讯博客
转摘请注明!

首佳汽车修理厂管理软件广泛应用于全国各地的汽修厂,汽车4S店,维修站,汽车美容连锁店等企业.
论坛文章RSS 评论RSS 登录