十二 08
在中文搜索引擎行业,在google被赶走后的状况不容乐观,国内品牌仍然是百度一家独大,腾讯的Soso凭借QQ的巨量用户可以占据第二;而google在宽带运营商和政府的干扰下半死不活,一般用户还真不能保证每次能正常使用。
百度是靠广大中小网站及基数比较大的低端用户养肥的一只独狼,可是养肥后的百度越来越不是东西,用户在百度心目中的地位越来越低,低到为了钱可以欺骗用户,中小网站不过是百度曾经用过的马桶,随意蹂躏。真正花了真金白银养活百度的中小企业已经成了暴发户家里的黄脸婆早就没地位了,百度早已不顾黄脸婆的利益,还经常威胁黄脸婆说:“你不想跟我混了是吧?还有大把漂亮的有钱人的女人排着队等着我上呢”,这黄脸婆为了生存只好继续苟且偷生,因为百度这斯已经国内最大的最有资源的最有钱的东家了,没了他真不好混。
最近发生的腾讯与360的PK战让大家都知道腾讯不是个好东西了,虽然360也不是个好东西,但我觉得腾讯更坏!因为腾讯的用户多,影响力更大,做点坏事就影响了更多的人。腾讯在国内搜索引擎行业,凭借QQ用户多只是稍微领先了搜狗和网易的有道,按实力SOSO完全可以占据第二并拉开其它竞争对手的距离。
前面讲了,在百度独大时,百度随意摧残中小网站,随意蹂躏付钱的中小企业,随意践踏用户利益,这就是垄断下的结果。你会希望这种局面长存吗?是时候改变了现状了,中小网站掌握着舆论风向,中小企业手里拿着钱,用户手握着生死令,我们为什么不重新思考重新选择呢?养肥百度一只独狼,还不如养肥两只独狼或者更多的狼齐驾并驱,不是更好吗?
百度的流量可以决定一个中小网站的生死,中小网站为什么不利用舆论风向改变用户的习惯。中小企业手里拿着钱,为什么不把这些钱分散到其它广告渠道去,比如soso、有道、搜狗的搜索广告,还比如google的广告、网站联盟的广告、阿里妈妈的广告。而真正决定百度生死权的用户,既然百度欺骗了你,我们可以抛弃它,选择其它产品,多一个选择多一条活路。
八 23
你可以试试问一下google有关字母缩写是什么意思这类的问题,比如4S是什么意思?5S是什么意思?PS又是什么意思?看看第一个结果一般会提供一个翻译解释。虽然翻译结果与中文语境有很大的差别,但不失为另一种有意思的解释。
ps是什么意思,翻译解释是“聚苯乙烯”。如果按照中国人日常的口语用语习惯来看,这个翻译不是中国人想要的结果,一般是指“顺便说一下、附言”的意思,或者用Photoshop修改照片的意思。当然不能排除用户就是想要“聚苯乙烯”的翻译解释。
4S是什么意思?按中国网民的搜索需求、相关搜索、搜索结果等来看,多数是要问汽车4S店的4S是什么意思?翻译解释是“4型”这个跟中文习惯就太离题了。而5S的翻译解释是“5秒”这个又更接近中文习惯。
再比如你用google搜索SB是什么意思?翻译解释是“某人”。中国成年人都知道SB是什么意思,把这google翻译理解成”某人是SB”倒是很含蓄的。
七 04
原文在这里:http://news.qq.com/a/20100702/001055.htm
新闻里面有这样一句话:
全球网络史上从未出现过的奇怪搜索现象出现了,点击“Google.cn”就会有“我们已移至Google.hk.com”提示,再点一下就到了 “Google.hk.com”。
Google.hk.com这个域名是没有正常运营的,什么时候变成谷歌香港的网站了?正确的网址是google.com.hk。犯这种低级错误的文章怎么跑到腾讯热点新闻里面去了?腾讯新闻也确实够垃圾的。低级错误有三点:
1、打开“Google.cn”,认识一点英文和中文的人都知道,正确的是“我们已移至Google.com.hk”。此妓者没有实事求是,连抄东西都太随意了。
2、纯粹一个网络文盲,有点网络知识的都不会把域名写这样。
3、丧失记者基本的职业道德,不尊重事实,胡言乱言,充当D媒走狗。
自从谷歌退出中国事件后,接着地图牌照申请被拒,ICP牌照不能通过年检,注定了google将被赶尽杀绝。杯具!
六 19
写博客的站长最怕使用自动采集程序的垃圾站长,也怕全站拷贝的这种无耻站长。更怕识别原创能力很差的垃圾搜索引擎,比如百度。
一个叫企业库的网站,网址www.qiyeku.com,其内容绝大多数是从别人的博客和网站文章采集过来。经多次联系这个站长要求停止采集,无回应。
采集文章是怎么回事呢?
有一种工具软件可以自动的从别人的博客和网站上自动收集文章内容,发布到自己的网站上,正式的名称叫网站内容管理系统CMS。正是这种CMS的存在,造就了中国互联网垃圾网站的大量存在。很多站长都是靠这种工具,大量的采集,重复的建站,从百度引来流量访问网站,以网站广告养活自己。此类站长只能称之为寄生虫!
这个博客在百度的收录一直都不是很理想,最近更严重,收录数据越来越少。随机抽查一些文章的收录,发现文章是被收录了,但是收录的却是一些垃圾站的页面,而不是我们站的,比如叫企业库的网站多数我站没有被收录的,就被那个站收录了。这很气人,个人博客是原创文章的发源地,辛辛苦苦写出来的文章,别人不费吹灰之力就抄袭走了,通过搜索引擎搜索相关内容别人的站排得比你高,你得不到任何好处,请问如此以往还有谁愿意去写原创文章啊?
为此事也向百度投诉过,但是采集的继续,原创的仍然没有收录。看这个垃圾站的收录,site:www.qiyeku.com,百度返回167万的结果,google只返回6930个结果。这两个搜索引擎还是有区别的。
在防止网络垃圾信息这件事情上,搜索引擎这个裁判长,起着相当重要的作用。百度懂事长李彦宏,在外界批评百度竞介排名带来的恶果时,就曾经为此事承诺过,表示搜索引擎界当前重任是防止网络垃圾信息,以此为借口来混淆视听。但是这两三年来,百度在防止网络垃圾信息这件事情上有多少进展呢?百度的技术有提高吗?垃圾站有减少吗?当然,都没有。
采集站为什么能得到收录,原因无非就两点,一是有权重,二是更新快。因为不停的在采集,当然是不停的在更新。如果对方的网站比我们的站有更高的权重,则会优先抓取到文章内容,百度SB就会认为这是原创的。百度识别原创文章的技术早在几年前就开始鄙视它了,比如这篇写的:百度如何判断原创与收录的问题——愚蠢的算法!
六 12
上一次讲到google收录下降站长要不要在乎它的问题,其实site语法不一定是真实的结果,有可能是google有意这样做的。不过site结果多也代表着实际收录数量也多,这是肯定的。站长除了用常规的方法引入蜘蛛抓取外,还有可以用一些特别点的方法来增加网站的收录。
常规的方法无非就是这些:坚持更新、多创造有质量的原创文章,加强内部链接,多引入有质量的外链,建立引导roboot抓取的网站地图等。
特别点的方法,还可以多引入外部链接指向网站地图,加强它的权重,增加再次抓取的机会。昨天我在首佳汽车维修论坛中增加了一个客户案例的导航页面。我发现首佳软件虽然有近1300个客户案例的页面,但是收录状况也很差,除了内容质量方面,内部链接和容易抓取方面都做得不够。经过上次的一些小小的改善目前收录增加了一点点。
另外一个很重要的问题,是自身网站的问题,比如重复内容太多自然会减少收录。还有robots.txt文件阻击了抓取,有的时候多一个抓取的入口自然就多一些收录的机会。但是为防止重复内容做一定的阻止还是有必要的。
前文讲到ASP网页动态修改网页标题的例子,就以此作为测试的一部分,看看能增加网站收录吗?此方法对百度也应该有效,让我们拭目以待吧。
六 12
用过google中文网站管理员工具的站长应该能经常看到“包含重复标题标记的页面”有多少这样HTML建议,一个页面一种标题一直是google建议站长做好网站质量的要求。而我们的网站很多情况下存在不同程度的重复标题的情况,特别是一些动态更新的新闻页面、客户案例页面等;新闻多的时候就会分页,网址就这样的news.asp?page=2。新闻越多page当然也越多了,这样的话,重复的标题页就会很多。
以有动态更新功能ASP网页为例,比如http://www.whsjsoft.com/Chinese/Bs_News_co.asp这个新闻页面,一共分了6页,以前的标题全是一样的:首佳软件公司新闻|首佳汽修汽配管理软件及汽车维修软件、汽车美容软件、汽车4S管理软件类新闻
这样就有了6个重复标题页了,因为这个Bs_News_co.asp页面代码固定了标题,所以网址请求page=2或者page=3都是一样的标题。经过测试我们可以这样改:
<title>首佳软件公司新闻第<%=reQuest.Querystring(“page”)%>页, 汽修汽配管理软件及汽车维修软件、汽车美容软件、汽车4S管理软件类新闻</title>
<%
Action=reQuest.Querystring(“page”)
if Action<2 then
response.write “<script language=’javascript’>”
response.write “document.title=’首佳软件公司新闻|首佳汽修汽配管理软件及汽车维修软件、汽车美容软件、汽车4S管理软件类新闻’”
response.write “</script>”
end if
%>
具体的效果请看首佳软件公司新闻第2页:http://www.whsjsoft.com/Chinese/Bs_News_co.asp?page=2,这页的标题跟第一页就不同了。这样等着下次来抓取时就不会提示有重复标题页面了。
以此例的成功实现动态修改网页标题,我们还做像首佳软件客户案例第3页、汽车维修行业资讯第3页、汽车维修博客文章列表第3页、首佳软件常见问题第3页、公司简介等页面的动态修改网页标题的实例。这些链接的例子全是第3页,因为刚好在中间更难抓取到。
六 05
近日在测试网页标题与点击率的关系时,发现我登录google账户后搜索“4S店是什么意思?”我站的一篇博客文章“什么是汽车4S店?汽车4S店是什么意思?”为第一位的结果,而退出google账户后搜索“4S店是什么意思?”却是不同的结果;以6月6日前的结果显示前三四位为爱词霸、百度知道、天涯问答的网页,我站博客那篇排在第五位。
这种现象说明google现在会根据用户的习惯和喜好来排定不同的搜索排名了,因为我登录google账户后,搜索这个关键字点过两三次来自我站的网页,google会认为这是喜好,喜欢这个网站的结果,所以以后再搜索时就把它排一位了。当时,我还高兴了一把,这么快有效果?换用IE再搜索一次发现结果没有变,原来是被google忽悠了一把。
有兴趣的可以试一下,看看是不是会变化?
六 05
google的PR更新在6月3日就发生了,此次更新我站没大的变化,只是内页更新了好多,详情请看这篇:2010-06-03日google PR更新,我站内页PR更新好多!
从此次更新的结果来看,让我们更加清晰更加明确的是:google认为最有效的反向链接,是中文章中的链接,此类链接是高质量的链接。
文章中的投票链接将直接提高某个页面的PR值,所以在首佳软件网站中才有很多内页获得了不错的PR值。
而很多站长热衷的交换链接,此类链接的质量和影响力大大降低,我认为这种友情链接5个都比不上有权重的网站的一篇有质量的文章中的一个投票链接有效果。
本文观点在google相关文档中早有说明,只是现在更加证实了这种说法。
另外本次google更新结果中发现link结果越来越少了,其实网站本身的外部链接并没有大量减少,基本上是保持不变的。目前本博客的link结果只有30个左右,减少一半多.另外一个问题link:www.xiuli123.com的结果没有一个来自www.whsjsoft.com的,这是说明首佳汽修汽配软件网站的权重在降低吗?目前还不能证实。
六 01
在首佳汽车维修管理这个博客中有一个“汽车4S店是什么意思?”的网页,根据google中文网站管理员工具的搜索查询的统计显示此页面点击率只有可怜的2%,平均排名4.7名算是很不错了。一般情况下,网民喜欢点击前三名的网页,此排位的点击率占据70%左右的份额,第四第五位的网页一般会有20%的占击;这里面有相互交集的数据,意思是网民可能会点击两三个网页。由此说明这个网页的点击率是非常的低。
最近看到一帖子说,长的标题不好理解,会降低10%的点击率。如果按我的习惯,搜索出来的结果我通常只看前面一半的标题,如果与关键字完全吻合我就会点进去,至于后面的副标题通常不注意。
比如来自汽车4S店管理博客的“什么是汽车4S店?汽车4S店是什么意思?”这个网页,主标题是“什么是汽车4S店?汽车4S店是什么意思?”,接着后面的“–汽车4S店管理软件-汽车4S店 …”这是网页的副标题。一般博客都有这个习惯,网页标题的组成是由文章本身的标题+博客的标题这两个相加。但是这个网页比较特殊,会搜索这个问题的人不是汽车4S店的从业人员,一般是对这个行业一无所知的人。所以后面的副标题汽车4S店管理软件跟网民一点关系也没有,可能会有排斥作用。按这个分析,我把这个网页的标题改为:什么是汽车4S店?汽车4s店是什么意思? — 汽车4S店管理
再过一个月看看点击率会提高多少?另外,如果这里给这个网页增加了外部链接,看它排名会提高一位吗?
另外一个问题也有很大关系,我们用google搜索一下“4S店是什么意思”,结果是前三位为爱词霸、百度知道、天涯问答的网页,加上天涯问答的相关答案4个,实际排第8了。点击率跟网站品牌也有很大关系,网民更容易信赖大网站的结果。
五 22
因为国家防火墙的强大,无耻到随时干扰我们普通民众的生活和工作的地步了。我们只是想google搜索一些很普通的信息也是经常被重置连接,无法正常使用google,更别说是跟敏感挨边的关键字。
最近经常用google buzz,在上面看到google最近推出的HTTPS搜索功能,支持SSL加密搜索。随后看到google官方博客的新闻说:宣布已经将Google.com列入SSL加密访问产品的范围,SSL可以帮助用户访问互联网服务时传递的数据不被窃取,包括保护密码和输入登录信息等。Google在官方博客介绍说,普通的HTTP浏览是不安全的,用户和服务器之间的通讯会被第三方监听和干扰,对于Google来说,你在Google搜索的词语会被第三方截获,如果第三方不希望你在Google搜索这个词语,还可以通过技术手段阻止用户的搜索行为。
而采用SSL加密搜索的google.com中,用户搜索的信息将无法被第三方获取,也不会出现数据泄漏的问题。自然也不会出现连接被重置了。
如果你还不知道有这么回事,那就体验一下使用google搜索连接被重置吧,比如搜索这些中文单字或词:搜索包含“吴”、“温”、“贾”、“李”、“习”、“贺”、“周”、“胡”等字的词语。还会导致一些很常用的词语,例如“学习”、“胡萝卜”、“温度计”等无法在Google搜索。
解决google搜索会被连接重置的方法:
办法1:如果用户直接访问 https://www.google.com/ 自动跳转Google香港的,请点一下页面底部的Google.com in English,然后再访问https://www.google.com/。
办法2:或者先访问 https://www.google.com/ncr ,然后再访问 https://www.google.com/
如果你打开https://www.google.com/是英语的,想用中文的搜索界面,就去设置一下界面语言。点一下右上角的Search settings,进入后在Interface Language这里的右边有一个下拉列表,选一下Chinese(Simplified)即中文简体,然后右面有一个按钮Save Preferences点一下保存设置,有一个提示是保存成功,点一下确定就返回中文的搜索界面了。
文中部分内容参考最近被焦点访谈的月光博客。
Recent Comments