八 23
你可以试试问一下google有关字母缩写是什么意思这类的问题,比如4S是什么意思?5S是什么意思?PS又是什么意思?看看第一个结果一般会提供一个翻译解释。虽然翻译结果与中文语境有很大的差别,但不失为另一种有意思的解释。
ps是什么意思,翻译解释是“聚苯乙烯”。如果按照中国人日常的口语用语习惯来看,这个翻译不是中国人想要的结果,一般是指“顺便说一下、附言”的意思,或者用Photoshop修改照片的意思。当然不能排除用户就是想要“聚苯乙烯”的翻译解释。
4S是什么意思?按中国网民的搜索需求、相关搜索、搜索结果等来看,多数是要问汽车4S店的4S是什么意思?翻译解释是“4型”这个跟中文习惯就太离题了。而5S的翻译解释是“5秒”这个又更接近中文习惯。
再比如你用google搜索SB是什么意思?翻译解释是“某人”。中国成年人都知道SB是什么意思,把这google翻译理解成”某人是SB”倒是很含蓄的。
七 04
原文在这里:http://news.qq.com/a/20100702/001055.htm
新闻里面有这样一句话:
全球网络史上从未出现过的奇怪搜索现象出现了,点击“Google.cn”就会有“我们已移至Google.hk.com”提示,再点一下就到了 “Google.hk.com”。
Google.hk.com这个域名是没有正常运营的,什么时候变成谷歌香港的网站了?正确的网址是google.com.hk。犯这种低级错误的文章怎么跑到腾讯热点新闻里面去了?腾讯新闻也确实够垃圾的。低级错误有三点:
1、打开“Google.cn”,认识一点英文和中文的人都知道,正确的是“我们已移至Google.com.hk”。此妓者没有实事求是,连抄东西都太随意了。
2、纯粹一个网络文盲,有点网络知识的都不会把域名写这样。
3、丧失记者基本的职业道德,不尊重事实,胡言乱言,充当D媒走狗。
自从谷歌退出中国事件后,接着地图牌照申请被拒,ICP牌照不能通过年检,注定了google将被赶尽杀绝。杯具!
六 12
上一次讲到google收录下降站长要不要在乎它的问题,其实site语法不一定是真实的结果,有可能是google有意这样做的。不过site结果多也代表着实际收录数量也多,这是肯定的。站长除了用常规的方法引入蜘蛛抓取外,还有可以用一些特别点的方法来增加网站的收录。
常规的方法无非就是这些:坚持更新、多创造有质量的原创文章,加强内部链接,多引入有质量的外链,建立引导roboot抓取的网站地图等。
特别点的方法,还可以多引入外部链接指向网站地图,加强它的权重,增加再次抓取的机会。昨天我在首佳汽车维修论坛中增加了一个客户案例的导航页面。我发现首佳软件虽然有近1300个客户案例的页面,但是收录状况也很差,除了内容质量方面,内部链接和容易抓取方面都做得不够。经过上次的一些小小的改善目前收录增加了一点点。
另外一个很重要的问题,是自身网站的问题,比如重复内容太多自然会减少收录。还有robots.txt文件阻击了抓取,有的时候多一个抓取的入口自然就多一些收录的机会。但是为防止重复内容做一定的阻止还是有必要的。
前文讲到ASP网页动态修改网页标题的例子,就以此作为测试的一部分,看看能增加网站收录吗?此方法对百度也应该有效,让我们拭目以待吧。
六 12
用过google中文网站管理员工具的站长应该能经常看到“包含重复标题标记的页面”有多少这样HTML建议,一个页面一种标题一直是google建议站长做好网站质量的要求。而我们的网站很多情况下存在不同程度的重复标题的情况,特别是一些动态更新的新闻页面、客户案例页面等;新闻多的时候就会分页,网址就这样的news.asp?page=2。新闻越多page当然也越多了,这样的话,重复的标题页就会很多。
以有动态更新功能ASP网页为例,比如http://www.whsjsoft.com/Chinese/Bs_News_co.asp这个新闻页面,一共分了6页,以前的标题全是一样的:首佳软件公司新闻|首佳汽修汽配管理软件及汽车维修软件、汽车美容软件、汽车4S管理软件类新闻
这样就有了6个重复标题页了,因为这个Bs_News_co.asp页面代码固定了标题,所以网址请求page=2或者page=3都是一样的标题。经过测试我们可以这样改:
<title>首佳软件公司新闻第<%=reQuest.Querystring(“page”)%>页, 汽修汽配管理软件及汽车维修软件、汽车美容软件、汽车4S管理软件类新闻</title>
<%
Action=reQuest.Querystring(“page”)
if Action<2 then
response.write “<script language=’javascript’>”
response.write “document.title=’首佳软件公司新闻|首佳汽修汽配管理软件及汽车维修软件、汽车美容软件、汽车4S管理软件类新闻’”
response.write “</script>”
end if
%>
具体的效果请看首佳软件公司新闻第2页:http://www.whsjsoft.com/Chinese/Bs_News_co.asp?page=2,这页的标题跟第一页就不同了。这样等着下次来抓取时就不会提示有重复标题页面了。
以此例的成功实现动态修改网页标题,我们还做像首佳软件客户案例第3页、汽车维修行业资讯第3页、汽车维修博客文章列表第3页、首佳软件常见问题第3页、公司简介等页面的动态修改网页标题的实例。这些链接的例子全是第3页,因为刚好在中间更难抓取到。
六 05
近日在测试网页标题与点击率的关系时,发现我登录google账户后搜索“4S店是什么意思?”我站的一篇博客文章“什么是汽车4S店?汽车4S店是什么意思?”为第一位的结果,而退出google账户后搜索“4S店是什么意思?”却是不同的结果;以6月6日前的结果显示前三四位为爱词霸、百度知道、天涯问答的网页,我站博客那篇排在第五位。
这种现象说明google现在会根据用户的习惯和喜好来排定不同的搜索排名了,因为我登录google账户后,搜索这个关键字点过两三次来自我站的网页,google会认为这是喜好,喜欢这个网站的结果,所以以后再搜索时就把它排一位了。当时,我还高兴了一把,这么快有效果?换用IE再搜索一次发现结果没有变,原来是被google忽悠了一把。
有兴趣的可以试一下,看看是不是会变化?
六 05
google的PR更新在6月3日就发生了,此次更新我站没大的变化,只是内页更新了好多,详情请看这篇:2010-06-03日google PR更新,我站内页PR更新好多!
从此次更新的结果来看,让我们更加清晰更加明确的是:google认为最有效的反向链接,是中文章中的链接,此类链接是高质量的链接。
文章中的投票链接将直接提高某个页面的PR值,所以在首佳软件网站中才有很多内页获得了不错的PR值。
而很多站长热衷的交换链接,此类链接的质量和影响力大大降低,我认为这种友情链接5个都比不上有权重的网站的一篇有质量的文章中的一个投票链接有效果。
本文观点在google相关文档中早有说明,只是现在更加证实了这种说法。
另外本次google更新结果中发现link结果越来越少了,其实网站本身的外部链接并没有大量减少,基本上是保持不变的。目前本博客的link结果只有30个左右,减少一半多.另外一个问题link:www.xiuli123.com的结果没有一个来自www.whsjsoft.com的,这是说明首佳汽修汽配软件网站的权重在降低吗?目前还不能证实。
六 01
在首佳汽车维修管理这个博客中有一个“汽车4S店是什么意思?”的网页,根据google中文网站管理员工具的搜索查询的统计显示此页面点击率只有可怜的2%,平均排名4.7名算是很不错了。一般情况下,网民喜欢点击前三名的网页,此排位的点击率占据70%左右的份额,第四第五位的网页一般会有20%的占击;这里面有相互交集的数据,意思是网民可能会点击两三个网页。由此说明这个网页的点击率是非常的低。
最近看到一帖子说,长的标题不好理解,会降低10%的点击率。如果按我的习惯,搜索出来的结果我通常只看前面一半的标题,如果与关键字完全吻合我就会点进去,至于后面的副标题通常不注意。
比如来自汽车4S店管理博客的“什么是汽车4S店?汽车4S店是什么意思?”这个网页,主标题是“什么是汽车4S店?汽车4S店是什么意思?”,接着后面的“–汽车4S店管理软件-汽车4S店 …”这是网页的副标题。一般博客都有这个习惯,网页标题的组成是由文章本身的标题+博客的标题这两个相加。但是这个网页比较特殊,会搜索这个问题的人不是汽车4S店的从业人员,一般是对这个行业一无所知的人。所以后面的副标题汽车4S店管理软件跟网民一点关系也没有,可能会有排斥作用。按这个分析,我把这个网页的标题改为:什么是汽车4S店?汽车4s店是什么意思? — 汽车4S店管理
再过一个月看看点击率会提高多少?另外,如果这里给这个网页增加了外部链接,看它排名会提高一位吗?
另外一个问题也有很大关系,我们用google搜索一下“4S店是什么意思”,结果是前三位为爱词霸、百度知道、天涯问答的网页,加上天涯问答的相关答案4个,实际排第8了。点击率跟网站品牌也有很大关系,网民更容易信赖大网站的结果。
五 22
因为国家防火墙的强大,无耻到随时干扰我们普通民众的生活和工作的地步了。我们只是想google搜索一些很普通的信息也是经常被重置连接,无法正常使用google,更别说是跟敏感挨边的关键字。
最近经常用google buzz,在上面看到google最近推出的HTTPS搜索功能,支持SSL加密搜索。随后看到google官方博客的新闻说:宣布已经将Google.com列入SSL加密访问产品的范围,SSL可以帮助用户访问互联网服务时传递的数据不被窃取,包括保护密码和输入登录信息等。Google在官方博客介绍说,普通的HTTP浏览是不安全的,用户和服务器之间的通讯会被第三方监听和干扰,对于Google来说,你在Google搜索的词语会被第三方截获,如果第三方不希望你在Google搜索这个词语,还可以通过技术手段阻止用户的搜索行为。
而采用SSL加密搜索的google.com中,用户搜索的信息将无法被第三方获取,也不会出现数据泄漏的问题。自然也不会出现连接被重置了。
如果你还不知道有这么回事,那就体验一下使用google搜索连接被重置吧,比如搜索这些中文单字或词:搜索包含“吴”、“温”、“贾”、“李”、“习”、“贺”、“周”、“胡”等字的词语。还会导致一些很常用的词语,例如“学习”、“胡萝卜”、“温度计”等无法在Google搜索。
解决google搜索会被连接重置的方法:
办法1:如果用户直接访问 https://www.google.com/ 自动跳转Google香港的,请点一下页面底部的Google.com in English,然后再访问https://www.google.com/。
办法2:或者先访问 https://www.google.com/ncr ,然后再访问 https://www.google.com/
如果你打开https://www.google.com/是英语的,想用中文的搜索界面,就去设置一下界面语言。点一下右上角的Search settings,进入后在Interface Language这里的右边有一个下拉列表,选一下Chinese(Simplified)即中文简体,然后右面有一个按钮Save Preferences点一下保存设置,有一个提示是保存成功,点一下确定就返回中文的搜索界面了。
文中部分内容参考最近被焦点访谈的月光博客。
五 22
近日发现google同时收录了首佳汽车维修论坛的三个XML格式的网站地图(bbs.xiuli123.com/sitemap_1.xml、bbs.xiuli123.com/sitemap_2.xml、bbs.xiuli123.com/sitemap_3.xml),并且给这三个页面加了标题,分别是地图1、地图2、地图3。但是这个汽车维修论坛的sitemap索引页:bbs.xiuli123.com/sitemap_index.xml没有被收录。
这三个sitemap是个无标题的网页,以前有过收录,但是收录的标题就是网址或是随机抓取的,比如显示的是里面内容的一个网址。被定义成地图1、地图2这种标题是因为最近增加一个汽车维修论坛内页友情链接造成的。除此之外,这几个sitemap没有导入链接是汉字的。
google收录网页标题的原则:首先以网页本身的标题为准;如果网页无标题则随机抓取网页内的文字为标题;如果有链接指向这些网页则以链接锚文字为标题。
除了google支持以链接锚文字定义一个无标题网页的标题外,发现baidu也支持,baidu目前只收录了地图3这个sitmap。
其它搜索引擎还没有收录这几个xml文件,所以还不知道是否支持这种功能。
对于站长来说有一个好消息,百度正在内测中的站长平台开始支持由站长提交sitemap给百度,这些服务类似google的网站管理员工具。而所支持的sitemap格式跟google支持的是同一种格式,也就是说以前为google制作好的sitemap可以原封不动的直接提交给百度。
汽车修理厂管理这个站点的sitemap还没有被google收录。首佳软件的sitemap也没有被google收录.
关于如何手工制作sitemap请看这篇:google应用:如何制作sitemap.xml文件?
五 03
最近一两个月在google中文网站管理员支持论坛上经常看到站长在发帖子抱怨自己的网站的google收录数下降很严重,多数网站收录数据下滑至原来收录数的20%到30%左右的幅度,这个下降幅度确实太大了。遭遇这种问题看来比较普遍了,这应该是google收录策略调整的原因,既然成普通现象了,站长就没有必要太在乎这个问题。经常去想解决这个问题想破头皮也不见得有什么好结果,干脆就不要去烦恼这个事了,继续努力建好自己的站吧。
因为我管理的站也有这种问题,除了以这种理由去理解之外,当然我们可以做些更有利于收录的措施,比如多创造有质量的原创文章,加强内部链接,多引入有质量的外链,建立引导roboot抓取的网站地图等。
再一方面我发现google有可能有意把site结果数搞成不准确,只是一个估计数据。site结果是估计数据这种观点在google的帮助文档中有出现过。我现在可以用两个站的例子来证明site结果确实是不准确的。
第一个例子:首佳软件网站www.whsjsoft.com的收录数据目前为506,以2010-05-03下午为准。
google是支持按目录搜索的,所以我列举网站中重要的几个目录。
1、www.whsjsoft.com/Chinese/这是网站的主目录,现在的收录数是294篇。
2、www.whsjsoft.com/blog/这是汽车维修管理的博客目录,现在的收录数是141篇。
3、www.whsjsoft.com/English/这是网站的英文版面目录,现在收数是44篇。
4、www.whsjsoft.com/sitemap/是网站的静态页面的导航,现在收录数是24篇。
5、www.whsjsoft.com/weixiu/是以前朋友寄放的一个家电维修内容的目录,现在收录数据是156篇。
这五个目录的收录数据加起来是659篇,高于主域名的收录数据。
第二个例子:首佳管理软件论坛http://bbs.xiuli123.com/目前的收录数据是182篇。以2010-05-03下午为准。
此论坛主要的页面有三种,一是帖子页面,二是标签页面,三是其它重要页面。
帖子页面的网址都带thread,所以我们查site:bbs.xiuli123.com/thread的结果就知道,现在收录数为141篇,这绝对是不准确的。
标签页面以tag开头,查site:bbs.xiuli123.com/tag返回结果1150篇,是主页面收录数的6倍了。当然1150这个数字也不准,因为翻到最后只有245篇,这个更接近真实数。
以这两部分相加起来是386篇,远高于域名的收录数182篇。
这两个例子都证明site的结果不一定是准确的,一般情况下都是估计值。另外一个例子,在网站管理员工具中Sitemaps的数据来看,首佳管理软件论坛http://bbs.xiuli123.com/的编入索引数为205篇,也与site的结果不符。编入索引数这个会有波动,但是要以稳定一段时间的数据,才能作为参考。
既然site结果是估值,并不准确的数据,站长当然不需要太过于在乎它了。只要来自google的流量没有减少,说明影响还是很小的。要查询网站有多少页面被收录,还有一个手工抽查页面是否被收录,以此数据来判断,站长自己心理也就有一个底了。
本站的收录数据也有下降,再加深一点汽车修理厂管理软件的网站导航第一页、第二页、第三页、第四页、第五页、第六页。
Recent Comments