让google增加网站收录的方法测试

google应用及研究, 百度搜索引擎研究 1 Comment »

上一次讲到google收录下降站长要不要在乎它的问题,其实site语法不一定是真实的结果,有可能是google有意这样做的。不过site结果多也代表着实际收录数量也多,这是肯定的。站长除了用常规的方法引入蜘蛛抓取外,还有可以用一些特别点的方法来增加网站的收录。

常规的方法无非就是这些:坚持更新、多创造有质量的原创文章,加强内部链接,多引入有质量的外链,建立引导roboot抓取的网站地图等。

特别点的方法,还可以多引入外部链接指向网站地图,加强它的权重,增加再次抓取的机会。昨天我在首佳汽车维修论坛中增加了一个客户案例的导航页面。我发现首佳软件虽然有近1300个客户案例的页面,但是收录状况也很差,除了内容质量方面,内部链接和容易抓取方面都做得不够。经过上次的一些小小的改善目前收录增加了一点点。

另外一个很重要的问题,是自身网站的问题,比如重复内容太多自然会减少收录。还有robots.txt文件阻击了抓取,有的时候多一个抓取的入口自然就多一些收录的机会。但是为防止重复内容做一定的阻止还是有必要的。

前文讲到ASP网页动态修改网页标题的例子,就以此作为测试的一部分,看看能增加网站收录吗?此方法对百度也应该有效,让我们拭目以待吧。

google和baidu都支持链接文字定义无标题网页的标题

google应用及研究, 百度搜索引擎研究 No Comments »

近日发现google同时收录了首佳汽车维修论坛的三个XML格式的网站地图(bbs.xiuli123.com/sitemap_1.xml、bbs.xiuli123.com/sitemap_2.xml、bbs.xiuli123.com/sitemap_3.xml),并且给这三个页面加了标题,分别是地图1地图2地图3。但是这个汽车维修论坛的sitemap索引页:bbs.xiuli123.com/sitemap_index.xml没有被收录。

这三个sitemap是个无标题的网页,以前有过收录,但是收录的标题就是网址或是随机抓取的,比如显示的是里面内容的一个网址。被定义成地图1、地图2这种标题是因为最近增加一个汽车维修论坛内页友情链接造成的。除此之外,这几个sitemap没有导入链接是汉字的。

google收录网页标题的原则:首先以网页本身的标题为准;如果网页无标题则随机抓取网页内的文字为标题;如果有链接指向这些网页则以链接锚文字为标题。

除了google支持以链接锚文字定义一个无标题网页的标题外,发现baidu也支持,baidu目前只收录了地图3这个sitmap。

其它搜索引擎还没有收录这几个xml文件,所以还不知道是否支持这种功能。

对于站长来说有一个好消息,百度正在内测中的站长平台开始支持由站长提交sitemap给百度,这些服务类似google的网站管理员工具。而所支持的sitemap格式跟google支持的是同一种格式,也就是说以前为google制作好的sitemap可以原封不动的直接提交给百度。

汽车修理厂管理这个站点的sitemap还没有被google收录。首佳软件的sitemap也没有被google收录.

关于如何手工制作sitemap请看这篇:google应用:如何制作sitemap.xml文件?

SRG Clean Archives插件不能按月归档了

WordPress及维护日志 2 Comments »

Yo2不知道怎么升级的?原先是Dagon Design Sitemap Generator这个插件不能生成网站地图,才换成SRG Clean Archives插件。最近谷歌网站管理员工具又报404错误了,原来是SRG Clean Archives插件生成的按月归档页面不存了,产生了404错误,只好又换回Dagon Design Sitemap Generator网站地图插件。现在的效果就如现在的网站地图一样,是按文章类别归档的。我还是觉得SRG Clean Archives插件生成的按月归档好看一些,层次分明,按月生成的树形。

这两个插件用起来都比较简单,YO2已经下载好了,只要到后台启用一下,再做一个页面,放入代码就行了。

希望YO2对插件方面能稳定一点,像这个问题换了插件后,原来的页面又不存在了,如果有外链的话又会有404错误的产生。

一个题外话:谷歌对导入链接的拼写错误也会反应在网站管理员工具上,不知道这算不算网站质量问题呢?这本身不是网站的质量问题,而是导入链接没写对,如果算在网站头上就有点冤枉了。

Yo2升级到wordpress2.3.2后的现存问题

WordPress及维护日志 2 Comments »

不可否认Yo2的撑柜ONE00的努力,每天都在努力工作解决升级留下来的问题,YO2的用户们感谢你了!看到通知12.31晚上开始升级到现在有 5天了,还留下了不少问题,包括所有的Yo2用户在内都有不满意吧。升级带来的阵痛主要是系统的不稳定、用户的使用、访问量的流失,还有博客的稳定性对搜 索引擎的持续影响是不可估量的。希望Yo2可以早点解决现存问题。我总结的现存问题如下列表。

1、页面没有了评论功能。不知道是不是模板的问题,至少我用了几个模板都不能发表评论。

2、网站地图或者网站导航的插件功能失效。我试了两个插件都无效。

3、除了默认的模板之外,文章后面都没有tag显示了。有tag的话,可以增加文章的相关性。

4、这两天出现修改模板之后被恢复到原始模板的问题,修改一次也好辛苦啊,昨天下载的备份竟然文件被损坏无法的开。不知道是不是服务器在打包时的问题。

5、自动生成XML sitemap的插件生成的xml文件格式不能被谷歌认可。旧版本的XML sitemap的插件是可以的。

6、不可以发表评论,都被认为是SPAM了。评论中不包含任何网址。自己给自己留言都不允许了。

其它建议:

1、yo2主页改版整体还是不错的,但是只有http://blog.yo2.cn/这个页面有管理的导航栏,如果没有点到这里的话还真找不到管理后台,或者要记住“域名+/wp-admin/”才能找到后台。对新手不太方便。

2、 http://blog.yo2.cn/这里面能显示最新的日志,这可以加深用户之间的互动,很不错的改进。顺便也加一个更多日志列表的功能,可以让更多的用户看到更多的文章,另外还可以让搜索引擎顺藤摸瓜收录更多的页面,扩大YO2的影响力。
最新反馈:

问题:昨天下载的备份竟然文件被损坏无法的开。不知道是不是服务器在打包时的问题。

用Firefox下载工具文件会被损坏,在IE下直接输入打包文件的地址下载就正常了,或者用其它下载工具也行。

导航

4 Comments »

本站导航第一页第二页第三页第四页第五页第六页

Page 1 of 6 : Next Page

文章

插件作者: dagondesign.com

google应用:如何写sitemap.xml文件?

google应用及研究 7 Comments »

看到一些网友搜索”如何写sitemap文件”进入本站,有些奇怪,本之前并未写过这样的文章,竟然在百度和谷歌中排名第一,搜索结果是这篇文章:sitemap和robots的关系,robots如何写?

为了不负众望吧,本文解释一些与sitemap相关的知识与大家分享。

什么是 Sitemap 文件?为什么网站需要它?

通过Sitemap 文件,您可以告诉谷歌关于您网站上的所有网页;另外,还可以选择是否告诉谷歌关于这些网页的信息,如哪些网页最重要以及更改频率。Sitemap 有助于加速网页的查找,这也是抓取网页和编制索引重要的第一步,但还有其他很多因素会影响抓取/编制索引过程。Sitemap 可让您告诉google关于您网页的信息(您认为哪些网页最重要,这些网页的更改频率如何)。

Sitemap是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能更快更全面的收录网站的内容。Sitemap的作用就好像为网站提供了整站的RSS,而Google就是这些RSS的订阅者,只要网站有更新就会自动通知Google。这样一来,搜索引擎的收录由被动的Pull变成了主动的Push。

更多sitemap的帮助信息请参考:http://www.google.com/support/webmasters/bin/topic.py?topic=8476

另外谷歌希望网站所有者只创建一个 Sitemaps 文件供所有搜索引擎使用。这与很多有关Sitemaps 文件最好只包含100个以内的网址的说法并不相符,所以我们尽可相信谷歌官方的说法:您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且未压缩时不能大于 10MB。Sitemap 索引文件最多可以列出 1,000 个 Sitemap。

sitemap文件可以通过第三方程序自动生成,地图生成工具页面: http://www.sitemapspal.com/

1、在这个网站可以自动生成sitemap文件,进入这个网站后找到如下图中的黄色选框,输入要添加Google Sitemap的网站地址,例如: www.whsjsoft.com(前面“http://”默认显示,不要删掉。),然后回车。

2、回车后,第一屏页面下方的文本框中,会生成一段代码。用鼠标全部选中文本框中的代码,打开记事本等工具,复制上去。然后,把这个文件保存为:Sitemap.xml.

3、把保存的Sitemap.xml文件上传到你的站点的根目录下。

4、在谷歌网站管理员工具中提交sitemap文件。

当然,除了用工具生成sitemap.xml文件,也可以自己动手写,以弥补工具可能产生的错误。范例:本博客的sitemap为http://www.xiuli123.com/sitemap.xml
手动写sitemap文件需要尊守如下规则:

Sitemaps 协议格式由 XML 标记组成。Sitemaps 的所有数据数值应为实体转义过的。文件本身应为 UTF-8 编码的。

以下是只包含一个网址并使用所有可选标记的 Sitemaps 示例。可选标记为斜体。简单范例:

<?xml version="1.0" encoding="UTF-8"?>
  < urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   < url>
    < loc>http://www.example.com/</loc>
    < lastmod>2005-01-01</lastmod>
    < changefreq>monthly</changefreq>
    < priority>0.8</priority>
   </url>
  </urlset>

Sitemaps 应:

  • <urlset> 开始标记开始,以 </urlset> 结束标记结束。
  • 每个网址包含一个作为父标记的 <url> 条目。
  • 每一个 <url> 父标记包括一个 <loc> 子标记条目。

请参考相关信息:XML 标记定义Sitemaps 索引 XML 标记定义

要验证手工写的sitemap.xml文件是否正确,可以用个简单的方法,用IE打开它,如果不报错,基本上正确了,然后才可以上传到网站根目录下并提交给谷歌。注意:sitemap.xml文件中一定不能包含纯汉字,否则一定会报错。

相关文章:Google网站管理员工具为什么要重复验证?

来自:首佳管理软件博客,转载请注明!

如何建设一个对搜索引擎友好的网站?

百度搜索引擎研究 2 Comments »

百度在很多站长心目中,SEO与百度是对立的!因为百度几乎只靠出售竞价排名作为收入。其实呢,每一个搜索引擎都喜欢比较友好的网站或博客,百度的官方申明说:百度欢迎合理的搜索引擎优化,但是网站优化过度只会适得其反。合理的优化,有利于搜索引擎爬行网站、收录更多的有用的网页、挖掘出更多有价值的信息等;此类网站叫对搜索引擎友好的网站。

看过很多SEO(搜索引擎优化的缩写)的文章谈网站如何优化,针对Google优化的文章占多,baidu相对少一些。理论加上实践,我总结了一些经验给大家分享。

大家看百度的搜索帮助:http://www.baidu.com/search/guide.html
关于给站长的建站建议的部分内容对如何做百度优化来说相当重要。
1、网站结构宜简洁明晰,这是针对百度搜索引擎友好站点的基础。
2、内容独特,最好原创。如果未被收录的内容对搜索引擎来说也是原创,呵呵。
3、网站内容经常性的更新,百度最喜欢有新鲜内容的网站。
4、慎用你的友情链接,链向垃圾站点、优化过度的站点,会有连带性惩罚。
5、网站最终目标是客户而非搜索引擎;优化网站,内容为王。

针对百度目前计算网页排名的算法,总结几点优化细节:
1、网页标题、META标签
百度比Google更重视网页标题与所搜索关键字的匹配程度。网页的所描述的内容应该用准确的关键字作为网页标题,一个页面可用多个相关的关键字作网页标 题,但是网页中至少要出现一两次标题中所示关键字。关键字的匹配程度在相关搜索中竞争因素比重很高。对网页标题、META标签关键字的长度最佳建议:标题 ≦80,META关键字 ≦100,META描述≦200。
2、动态网页的转换。如果ASP之类制度的网站,网页内容是动态的,带参数访问的,此类网页竞争性很低。百度对于两个以上参数的很少会收录,最多只收录标题而不收录网页内容。此类网页应当把它转换成静态的路径或生成文件名。
3、目录、文件名称中包含关键字这一算法仍然很有用。
4、网站深度,网站地图。网站历史不长,PR不高的网站,对于超过两三次点击才能到达的页面很难被百度收录。对于这个问题可以制作网站地图来解决。PR本来跟百度没有关系的,但是判断一个网站质量,PR仍然是一个重要的参考。
5、交换有价值的友情链接。PR对Google有用,对百度同样也有用。百度和Google同样采用了相类似的Page Rank页面级别技术来评价一个网站的权威性。何为有价值的友情链接?比如你要优化QQ表情这个关键字,如果QQ.com跟你做了友情链接,那你网站的 QQ表情的竞争力自然不弱。
6、搜索引擎蜘蛛人抓取页面时,不支持javascript代码。很多网页带菜单导航,但是搜索引擎不能收录菜单导航所包含的链接。此类网站的结构性就太差了,几乎不能收录多少页。网站的导航一定要用静态链接。

不友好表现:
· 大量采用图片形式,没有可以检索的文本信息;搜索引擎蜘蛛人是基于文本方式来浏览网站的,没有文本就没有内容可抓。
· 网页没有标题,或者标题中没有包含有效的关键词;没有包含有效的关键词会被认为作弊而遭到降权处理。
· 网页正文中有效关键词比较少;关键词密度建议值:2%≦密度≦8%
· 网站导航系统让搜索引擎“看不懂”;比如上面所述第六条。
· 部分数据库信息对搜索引擎“保密”;
· 没有其他网站提供链接线索进行比较。没有外部链接,没有提交,搜索引擎自然找不到你。
首发于2007-01-31 19:37,地址:http://hi.baidu.com/whsjsoft/blog/item/458aae3e281e82fa828b131a.html
来自:汽车管理软件资讯博客
转摘请注明!

wordpress中文博客:如何正确使用Google Sitemaps插件?

WordPress及维护日志, google应用及研究 2 Comments »

网站或博客如果能向Google提供Sitemap,可以很详细的让Google了解你的站点情况,比如网站的结构、更新情况等。Google Sitemaps插件可以给博客创建一个 Google Sitemap XML 文件,并自动递交到 Google ,以达到更快的搜索引擎收录。通常网站更新时,都是手工更新Sitemap XML 文件,然后上传到网站服务器,再提交给Google。

这个插件允许你设置在博客更新时自动更新Sitemap XML 文件,而且可以自动通知Google你的博客有更新了。无需做那些繁杂的锁事。对Yo2博客来说,实现这些只要在管理后台启用这个插件就可以了。

wordpress中文博客在语言上是个特殊,比如Google Sitemap.XML 文件的识别、Sitemap的规范等,对中文的支持不是太好。Sitemap.XML 文件中不允许出现中文字符,否则谷歌网站管理员工具会报告错误而无法正常的抓取。wordpress中文博客结合google sitemaps插件应该如何设置才能自动的生成正确的Sitemap.XML 文件?Sitemap的作用除了告诉google你的站点内有哪些页面及更新信息之外,还要尽量的保证不要提交不正确的网址。正确的设置应该注意的问题有如下几点:

1、默认的wordpress中文博客的默认日期格式是yyyy年mm月dd日,在生成Sitemap.XML 文件时,这个插件会在开头加上如下内容:<!– generated-on=”2007年10年03日 2:43 pm” –>这问题就来了,包含了中文字符不能通过。所以你在后台的常规设置中把默认日期格式设置成Y-m-d或yyyy-mm-dd就行了。

2、如果插件设置中的Sitemap Content包括Include categories的话,你的Sitemap.XML 文件会多一个并不存在的页面网址,比如:http://www.xiuli123.com/category/,你本身并没有创建这个页面。所以你的Sitemap Content可以不包括Include categories的内容。

3、因为Sitemap.XML 文件是自动生成的,如果不是独立的空间,你还不可以手工修改这个文件。所以你要手工检查一下根目录下的Sitemap.XML 文件的内容没有中文字符。有时候博客平台会出现些小问题,比如我曾经创建了一个关于的页面,后来觉得不太好就把文件缩略名改成about,这时Sitemap.XML 文件还包括“http://www.xiuli123.com/关于”这样的错误网址,这时候只有在Sitemap Content中去掉Include posts,然后rebuild sitemap一次,再重新选上Include posts再rebuild sitemap一次就可以搞定了。

转载请注明来自:首佳软件博客http://www.xiuli123.com/

Yo2博客关于robots.txt问题的最新进展

google应用及研究 3 Comments »

大部分YO2博客都反映在谷哥网站管理员工具中存在robots.txt文件问题,错误都是一样的:

网络无法访问: robots.txt 无法访问
我们访问您的 Sitemap 时遇到错误。请确保您的 Sitemap 符合我们的指南要求,并能够通过您所提供的位置访问,然后重新提交。

按 照robots相关的帮助里说,robots并不是必须的,我可以不上传这个文件。而且相关的帮助也说明了如果robots不存在的话,将再次访问并抓 取,为什么谷歌来了两次还是只找这个robots文件呢?这不符合谷歌的帮助说明嘛。并且也不合理。不能因为网站没有robots文件,谷歌就不给收录。

谷歌中文网站管理员回应说:http://www.googlechinawebmaster.com/2007/09/blog-post_6441.html

你的错误一定与有没有robots.txt无关.请检查你的sitemap文件是否有问题.

有了这个提示,今天重新看了一下sitemap文件,里面包含中文页面的网址。 我记得以前用另外的网站提交过sitemap时,里面包含了中文的网址结果提交后报告返回错误,去掉这部分网页后正常。
这个问题表面上看起来是“robots.txt 无法访问”结果这一句话误导了所有人,Yo2的博客们肯定也想不通怎么会是这样的问题。因为robots.txt确实是正常的,每次手工访问都存在。现在终于找到问题了,希望YO2可以找到解决问题的办法。

我们发表文章时,当然是中文的标题了,如果没有指定文章缩略名肯定是中文了,然后sitemap是自动生成的,这个错误就在所难免了。

首佳汽车修理厂管理软件广泛应用于全国各地的汽修厂,汽车4S店,维修站,汽车美容连锁店等企业.
论坛文章RSS 评论RSS 登录