google和baidu都支持链接文字定义无标题网页的标题

google应用及研究, 百度搜索引擎研究 No Comments »

近日发现google同时收录了首佳汽车维修论坛的三个XML格式的网站地图(bbs.xiuli123.com/sitemap_1.xml、bbs.xiuli123.com/sitemap_2.xml、bbs.xiuli123.com/sitemap_3.xml),并且给这三个页面加了标题,分别是地图1地图2地图3。但是这个汽车维修论坛的sitemap索引页:bbs.xiuli123.com/sitemap_index.xml没有被收录。

这三个sitemap是个无标题的网页,以前有过收录,但是收录的标题就是网址或是随机抓取的,比如显示的是里面内容的一个网址。被定义成地图1、地图2这种标题是因为最近增加一个汽车维修论坛内页友情链接造成的。除此之外,这几个sitemap没有导入链接是汉字的。

google收录网页标题的原则:首先以网页本身的标题为准;如果网页无标题则随机抓取网页内的文字为标题;如果有链接指向这些网页则以链接锚文字为标题。

除了google支持以链接锚文字定义一个无标题网页的标题外,发现baidu也支持,baidu目前只收录了地图3这个sitmap。

其它搜索引擎还没有收录这几个xml文件,所以还不知道是否支持这种功能。

对于站长来说有一个好消息,百度正在内测中的站长平台开始支持由站长提交sitemap给百度,这些服务类似google的网站管理员工具。而所支持的sitemap格式跟google支持的是同一种格式,也就是说以前为google制作好的sitemap可以原封不动的直接提交给百度。

汽车修理厂管理这个站点的sitemap还没有被google收录。首佳软件的sitemap也没有被google收录.

关于如何手工制作sitemap请看这篇:google应用:如何制作sitemap.xml文件?

谷歌网站管理员工具增加网络抓取错误来源功能

google应用及研究 2 Comments »

网站管理员工具

Google 网站管理员工具为您提供您的网页在Google 上的展示率的详细报告。使用Google 网站管理员工具提高流量. Google 对网站索引编制的统计、诊断和管理,包括Sitemap 提交和报告。

以前一直在为谷歌网站管理员工具https://www.google.com/webmasters/) 报告的网络抓取错误的信息头痛,因为不知道这些”404(找不到)”错误的来源,因为404错误的来源可能是网站本身设计的问题,网站可能存在死链接;还 可能外部网站留下的链接是错误的死链接。对于后面这个原因,今天才证实了外部链接的错误也会在你所有的网站的报告中提现。

作为网站管理员,你可能很关心网站的404问题。例如:http://www.whsjsoft.com/blog/%20…%20%3Cspan%20id=
这样一个404报错信息,网站设计者本身或者网站管理员几乎无从查证这样的错误来源在哪里?如果是大型网站更是难上加难,要查出错误,工作量也太大了。为了这个问题,我多次向谷歌反映。今天登录网站管理员工具,谷歌终于作出了回应,值得称赞!增加报告网络抓取错误来源的功能如下图:

发件人 myweb

关于404页面的问题,谷歌网站管理员工具的帮助页面中,提到很多相关的信息。还有Google中文网站管理员博客也多次发表了相关的文章,告诉我们,如果是外部链接的错误不会对自己的网站产生任何影响,谷歌会把这类外部链接算作无效链接。

相关文章:
为什么我的网站会被谷歌降权?如何处理?
如何制作sitemap.xml文件?
关于google中文网站管理员博客的意见
更多相关网站管理员工具的文章点此。

汽车修理厂管理与汽车维修管理软件博客PR升级

WordPress及维护日志, google应用及研究, 首佳新闻 4 Comments »

前两天打开博客,发现汽车修理厂管理与汽车维修管理软件博客的PR升级了,由0升级到2。这是一个正常的表现,有持续的更新、有原创文章、一定数量的外部链接;有这三个条件的作为基础,谷歌不给我这个博客升级PR都难了。

PR值又是什么?Page Rank的中文为页面等级,缩写为PR 。Page Rank是Google推出的网页等级,通常被称为PR值,从0到10一共11个级别,级别越高则证明该网页越重要,一般情况下PR高的网页会有更大的机会排在Google搜索的前列。有兴趣可以看PR的其它解释

前段时间谷歌的网站管理员工具统计显示,这个博客的外部链接莫名其妙的消失的一个不剩了 。昨天去谷歌网站管理员工具查看时, 也恢复了,现在增加到869个。这869个外部链接当中,除了正常的链接,还包括一些博客设置了nofollow标签的评论留下的链接,还包括百度空间用SCRIPT生成的友情链接(在浏览器客户端生成的链接)。如此看来,大量的留下带自己博客地址的评论,不管是不是垃圾评论,都会被计算为外部链接,不过质量和作用肯定不能与正常链接相比了。

另外,YO2升级后带来的一系列问题大部分都得到解决。例如:1、sitemap.xml的格化不再被谷歌认为不可识别的。2、根目录下的robots.txt文件经常返回200的成功状态,不再是robots.txt无法访问。3、网站已顺利的得到谷歌网站管理员工具的验证,也不再是告诉你因为访问超时而无法验证。4、提交的sitemap文件,很不错的结果哦,收录比例很高。结果如下:

Sitemap 中的总网址数 92
Sitemap 中已编入索引的网址 91

近期的访问速度也不错了,希望YO2的服务器能一如既往的稳定、好用。

相关文章:

谷歌:外部链接清零?PR降为0?

Yo2升级到wordpress2.3.2后的现存问题

WordPress及维护日志 2 Comments »

不可否认Yo2的撑柜ONE00的努力,每天都在努力工作解决升级留下来的问题,YO2的用户们感谢你了!看到通知12.31晚上开始升级到现在有 5天了,还留下了不少问题,包括所有的Yo2用户在内都有不满意吧。升级带来的阵痛主要是系统的不稳定、用户的使用、访问量的流失,还有博客的稳定性对搜 索引擎的持续影响是不可估量的。希望Yo2可以早点解决现存问题。我总结的现存问题如下列表。

1、页面没有了评论功能。不知道是不是模板的问题,至少我用了几个模板都不能发表评论。

2、网站地图或者网站导航的插件功能失效。我试了两个插件都无效。

3、除了默认的模板之外,文章后面都没有tag显示了。有tag的话,可以增加文章的相关性。

4、这两天出现修改模板之后被恢复到原始模板的问题,修改一次也好辛苦啊,昨天下载的备份竟然文件被损坏无法的开。不知道是不是服务器在打包时的问题。

5、自动生成XML sitemap的插件生成的xml文件格式不能被谷歌认可。旧版本的XML sitemap的插件是可以的。

6、不可以发表评论,都被认为是SPAM了。评论中不包含任何网址。自己给自己留言都不允许了。

其它建议:

1、yo2主页改版整体还是不错的,但是只有http://blog.yo2.cn/这个页面有管理的导航栏,如果没有点到这里的话还真找不到管理后台,或者要记住“域名+/wp-admin/”才能找到后台。对新手不太方便。

2、 http://blog.yo2.cn/这里面能显示最新的日志,这可以加深用户之间的互动,很不错的改进。顺便也加一个更多日志列表的功能,可以让更多的用户看到更多的文章,另外还可以让搜索引擎顺藤摸瓜收录更多的页面,扩大YO2的影响力。
最新反馈:

问题:昨天下载的备份竟然文件被损坏无法的开。不知道是不是服务器在打包时的问题。

用Firefox下载工具文件会被损坏,在IE下直接输入打包文件的地址下载就正常了,或者用其它下载工具也行。

sitemap插件产生不规范的sitemap文件的问题

WordPress及维护日志, google应用及研究 No Comments »

今早看到谷歌网站管理员工具的报告告诉我sitemap产生错误了。直接打开sitemap文件看还真产生如下的问题。

文档只能有一个顶层元素。处理资源 ‘http://soft.whsjsoft.com/sitemap.xml’ 时出错。第 473 行,位置: 2。

没有更直接的办法查看真正的sitemap.xml源文件,只要用讯雷把它下载下来了。看到第473行,如下内容:

<?xml version=”1.0″ encoding=”UTF-8″?>
<!– generator=”wordpress/2.1.3″ –>
<!– sitemap-generator-url=”http://www.arnebrachhold.de” sitemap-generator-version=”3.0b4″ –>
<!– generated-on=”2007-11-01 11:11 am” –>
<urlset xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance” xsi:schemaLocation=”http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/09/sitemap.xsd”    xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

这段内容在最开始部分就有了,原来是重复了。按sitemap规范,urlset标签只能在一个sitemap文件中存在一次,<urlset> 开始标记开始,以 </urlset> 结束标记结束。上一次追加了Include categories的内容。当时rebuilder后还没发现问题,看来是sitemap插件走神了,哈哈。

反正wordpress博客系统已经把文章分类的页面加了noindex的标签,所以sitemap文件完全可以不要包含文章分类了。

相关文章:

百度不支持Robots Meta标签

google应用:如何写sitemap.xml文件?

google应用:如何写sitemap.xml文件?

google应用及研究 7 Comments »

看到一些网友搜索”如何写sitemap文件”进入本站,有些奇怪,本之前并未写过这样的文章,竟然在百度和谷歌中排名第一,搜索结果是这篇文章:sitemap和robots的关系,robots如何写?

为了不负众望吧,本文解释一些与sitemap相关的知识与大家分享。

什么是 Sitemap 文件?为什么网站需要它?

通过Sitemap 文件,您可以告诉谷歌关于您网站上的所有网页;另外,还可以选择是否告诉谷歌关于这些网页的信息,如哪些网页最重要以及更改频率。Sitemap 有助于加速网页的查找,这也是抓取网页和编制索引重要的第一步,但还有其他很多因素会影响抓取/编制索引过程。Sitemap 可让您告诉google关于您网页的信息(您认为哪些网页最重要,这些网页的更改频率如何)。

Sitemap是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能更快更全面的收录网站的内容。Sitemap的作用就好像为网站提供了整站的RSS,而Google就是这些RSS的订阅者,只要网站有更新就会自动通知Google。这样一来,搜索引擎的收录由被动的Pull变成了主动的Push。

更多sitemap的帮助信息请参考:http://www.google.com/support/webmasters/bin/topic.py?topic=8476

另外谷歌希望网站所有者只创建一个 Sitemaps 文件供所有搜索引擎使用。这与很多有关Sitemaps 文件最好只包含100个以内的网址的说法并不相符,所以我们尽可相信谷歌官方的说法:您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且未压缩时不能大于 10MB。Sitemap 索引文件最多可以列出 1,000 个 Sitemap。

sitemap文件可以通过第三方程序自动生成,地图生成工具页面: http://www.sitemapspal.com/

1、在这个网站可以自动生成sitemap文件,进入这个网站后找到如下图中的黄色选框,输入要添加Google Sitemap的网站地址,例如: www.whsjsoft.com(前面“http://”默认显示,不要删掉。),然后回车。

2、回车后,第一屏页面下方的文本框中,会生成一段代码。用鼠标全部选中文本框中的代码,打开记事本等工具,复制上去。然后,把这个文件保存为:Sitemap.xml.

3、把保存的Sitemap.xml文件上传到你的站点的根目录下。

4、在谷歌网站管理员工具中提交sitemap文件。

当然,除了用工具生成sitemap.xml文件,也可以自己动手写,以弥补工具可能产生的错误。范例:本博客的sitemap为http://www.xiuli123.com/sitemap.xml
手动写sitemap文件需要尊守如下规则:

Sitemaps 协议格式由 XML 标记组成。Sitemaps 的所有数据数值应为实体转义过的。文件本身应为 UTF-8 编码的。

以下是只包含一个网址并使用所有可选标记的 Sitemaps 示例。可选标记为斜体。简单范例:

<?xml version="1.0" encoding="UTF-8"?>
  < urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   < url>
    < loc>http://www.example.com/</loc>
    < lastmod>2005-01-01</lastmod>
    < changefreq>monthly</changefreq>
    < priority>0.8</priority>
   </url>
  </urlset>

Sitemaps 应:

  • <urlset> 开始标记开始,以 </urlset> 结束标记结束。
  • 每个网址包含一个作为父标记的 <url> 条目。
  • 每一个 <url> 父标记包括一个 <loc> 子标记条目。

请参考相关信息:XML 标记定义Sitemaps 索引 XML 标记定义

要验证手工写的sitemap.xml文件是否正确,可以用个简单的方法,用IE打开它,如果不报错,基本上正确了,然后才可以上传到网站根目录下并提交给谷歌。注意:sitemap.xml文件中一定不能包含纯汉字,否则一定会报错。

相关文章:Google网站管理员工具为什么要重复验证?

来自:首佳管理软件博客,转载请注明!

wordpress中文博客:如何正确使用Google Sitemaps插件?

WordPress及维护日志, google应用及研究 2 Comments »

网站或博客如果能向Google提供Sitemap,可以很详细的让Google了解你的站点情况,比如网站的结构、更新情况等。Google Sitemaps插件可以给博客创建一个 Google Sitemap XML 文件,并自动递交到 Google ,以达到更快的搜索引擎收录。通常网站更新时,都是手工更新Sitemap XML 文件,然后上传到网站服务器,再提交给Google。

这个插件允许你设置在博客更新时自动更新Sitemap XML 文件,而且可以自动通知Google你的博客有更新了。无需做那些繁杂的锁事。对Yo2博客来说,实现这些只要在管理后台启用这个插件就可以了。

wordpress中文博客在语言上是个特殊,比如Google Sitemap.XML 文件的识别、Sitemap的规范等,对中文的支持不是太好。Sitemap.XML 文件中不允许出现中文字符,否则谷歌网站管理员工具会报告错误而无法正常的抓取。wordpress中文博客结合google sitemaps插件应该如何设置才能自动的生成正确的Sitemap.XML 文件?Sitemap的作用除了告诉google你的站点内有哪些页面及更新信息之外,还要尽量的保证不要提交不正确的网址。正确的设置应该注意的问题有如下几点:

1、默认的wordpress中文博客的默认日期格式是yyyy年mm月dd日,在生成Sitemap.XML 文件时,这个插件会在开头加上如下内容:<!– generated-on=”2007年10年03日 2:43 pm” –>这问题就来了,包含了中文字符不能通过。所以你在后台的常规设置中把默认日期格式设置成Y-m-d或yyyy-mm-dd就行了。

2、如果插件设置中的Sitemap Content包括Include categories的话,你的Sitemap.XML 文件会多一个并不存在的页面网址,比如:http://www.xiuli123.com/category/,你本身并没有创建这个页面。所以你的Sitemap Content可以不包括Include categories的内容。

3、因为Sitemap.XML 文件是自动生成的,如果不是独立的空间,你还不可以手工修改这个文件。所以你要手工检查一下根目录下的Sitemap.XML 文件的内容没有中文字符。有时候博客平台会出现些小问题,比如我曾经创建了一个关于的页面,后来觉得不太好就把文件缩略名改成about,这时Sitemap.XML 文件还包括“http://www.xiuli123.com/关于”这样的错误网址,这时候只有在Sitemap Content中去掉Include posts,然后rebuild sitemap一次,再重新选上Include posts再rebuild sitemap一次就可以搞定了。

转载请注明来自:首佳软件博客http://www.xiuli123.com/

sitemap和robots的关系,robots如何写?

google应用及研究 6 Comments »
robots.txt 网址 http://www.xiuli123.com/robots.txt
最新下载 2007年9月25日 上午02时24分03秒
状态 200 (成功)

这是google网站管理员工具提供的最新报告。 robots.txt文件内容可当一个robots的参考范例:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/

几乎所有搜索引擎都尊从robots协议,并按网站根目录下的robots.txt文件进行网站的抓取。 这个例子的意思是:允许所有搜索引擎抓取,并且/wp-admin/、/wp-content/、 /wp-includes/这三个目录不可以抓取。有关 robots.txt 语法的更多信息,请参阅 robotstxt.org。谷歌对有关robots.txt的设置信息请参考:http://www.google.com/support/webmasters/bin/answer.py?answer=40364&topic=8846&hl=zh_CN

在robots.txt文件无法访问或按要求验证时,提交的sitemap都会提示有相关错误,比如:robots.txt文件无法访问等。我提交了两次都失败了,可能是不存在robots.txt文件的问题,后来一查这个文件是存在的,又提交了一次终于成功了。不知道这个robots.txt文件是不是YO2后来生成的,这个问题无法考证了。

按谷歌帮助文档的说法,robots.txt文件是可以不存在的,但在提交sitemap时又必须先检查robots.txt文件,如果返回404错误,则会在以后重新访问网站并开始抓取。后来我要检查时robots.txt又存在了,sitemap才通过。如果这个文件真的不存,那谷歌是不是按照帮助文档的说法呢?不得而知了。

相关文章:google应用:如何写sitemap.xml文件?

给你的wordpress博客加谷歌的sitemap

WordPress及维护日志 1 Comment »

是谷歌的网站管理员工具需要sitemap,不是普通的网站地图哦。需要的插件:Google Sitemaps

这个插件能在博客更新时自动生成sitemap,并且自动ping谷歌服务器,告诉它你的博客已经更新了。

设置方法:进入博客管理后台,在后台管理的导航栏的“插件”管理里面,找到这个插件,然后点启用。在导航栏的“选项”管理里面有sitemap的设置。启用这个插件后会自动生成一个sitemap.xml的文件:http://www.xiuli123.com/wp-content/uploads/115/11533/sitemap.xml,但是这个文件不能满足谷歌的网站管理员工具的要求,因为它不是根目录下的sitemap。要生成根目录下的sitemap,需要在sitemap的设置中add new page,指定路径和文件名,然后save page changes就OK了,然后在网站管理员工具中添加sitemap文件就可以了。下面内容为Google 网站管理员工具:

什么是Google 网站管理员工具?

您的 Google 网站管理员工具帐户可提供有关您所添加的网站、Sitemap 的信息及其最近的更新,并允许您添加新的 Sitemap 以供 Google 抓取。需要拥有 Google 帐户才能登录 – 可在我们的帐户主页注册一个帐户。如果您已使用 Gmail、Google 网上论坛、我的搜索历史、Google 快讯或 Froogle 购物列表,那么您就已经有 Google 帐户,并可以通过现有帐户登录以使用 Google 网站管理员工具
Google 为什么要这样做?
Google 的使命是整合全球信息,使人人皆可访问。本协作抓取系统秉承该使命,改进抓取工具的覆盖范围和时效性,从而优化用户对 Google 索引的使用。

相关问题:

来自: http://www.xiuli123.com/

转载请注明!

首佳汽车修理厂管理软件广泛应用于全国各地的汽修厂,汽车4S店,维修站,汽车美容连锁店等企业.
论坛文章RSS 评论RSS 登录