preload
13

以下这些因素决定排序(按其所占的权重从高到低排)

1. 博客页面和query的相关性

相关性是博客搜索引擎中最重要的排名因素,用户搜索一个query的时候,首先对query进行分词处理,然后计算这些关键词在网页中出现的次数密度频率 ,以及关键词位置(比如在标题中出现就比在正文中出现的权重大,<h1>中的文字权重比<h2>中的大),通过这些因素的综合计算,算出搜索query和各个博客页面的相关性,这实际上和普通网页搜索没有什么区别。

2. 博客质量,按照博客网页的重要程度来排序

通过反向链接或者PageRank能大概的判断出博客页面的质量,不过由于博文有时效性,内容常常更新,新更新博客文章常常不会立即有PageRank,在这种情况下,可以通过博客文章所在的博客首页的PageRank来确定新发博文的质量:

对博客首页质量有利的因素有:

(1).博客的外链数量多

(2).博客的访问量大

(3).博客的留言量多

(4).博客的流行程度好

(5).分类与标签的使用较好

(6).博客的RSS订阅者数量多

(7).博客中原创的文章较多

同时也有一些对博客首页质量不利的因素:

(1).博客的发文频率太高,短暂时间内连续发表很多文章, 像自动的一样

(2).重复发表相同的文章,文章里面乱嵌入关键词spam

(3).博客里面很多链接都是指向一个网站,博客广告较多

(4).博客里面转载的文章太多,比如带有【转】原文网址 http://”等字样

3. 博文发表的时间

在博客搜索引擎中,博文的发表时间是很重要的。博客如同日记,具有时效性,内容常常更新,更新周期也较短,较新的文章具有更强的实时价值。博文的发表时间可以通过博文网页上的时间和博客feed中的时间来判定。

4. 用户的个性化信息

如果有可能的话,加上用户的个人信息对搜索结果进行个性化排序,效果将会更好,比如普通的人搜索“树”,可能是指植物树;而一个计算机背景的人搜“树”可能指的是数据结构,对不同背景的人才用个性化的排序也能大大提高搜索的质量。

Tagged with:
18

写独立博客,有空间容量和流量的限制,这样要是还把图片都放在自己空间的里的话,无疑会增加博客的负担,甚至会超过空间商的流量限制而得付额外费用。这时选择一个方便快捷的可以外链图片的网站就显得非常重要了。

正常的网站图片是不会支持外链的,支持外链的市面上比较主流的相册有PicasaFlickrYupooPhotobucket

上面图片来自:zdxia

1.这些当中最好的无疑是Picasa了,大家只有对Google比较放心,像可能吧里面几乎所有的图片都是用的picasa外链。我以前也试过,不过发现有的图片地址外链不起来就没用了。今天在bbs上说到这事时,deepspace同学帮解决了这个问题。

因为此前我观察发现picasa里面图片的链接,如果最后一个”/”前面不是s800、s40等s系列,一般图片都外链不起来,因为没找不到可以外链的真实地址。比如,这边一张我相册里的照片:链接 我直接查看图片,得到的图片地址为:

http://lh6.ggpht.com/_7uUELxHC9uo/SZK6HsB9nBI/AAAAAAAAAsM/G2hnrBReAsY/cwr.jpg

而其实这只是一个假地址(红色部分不是s系列),不能进行外链的,这时要做的就是相册主人登录Picasa的网站,点击图片的页面上右边的“此照片链接”,再点一下下面的“隐藏相册链接”,这时嵌入图像里的代码就变了,一下子就可以看出此相片的真实外链地址为:

http://lh6.ggpht.com/_7uUELxHC9uo/SZK6HsB9nBI/AAAAAAAAAsM/G2hnrBReAsY/s400/cwr.jpg

突破了这个之后,我们就可以自由的利用Picasa外链要插入博客里的图片了,google是一个敢于向美国政府说不网站,把照片托管在他这自然绝对放心了,除非哪天GWF把ggpht.com给盾掉……

2.Flickr是Yahoo旗下的一个网站,是web2.0下最火的图片网站,但是把照片托管给它不太可靠,会无故删除用户,所以也得谨慎使用,也曾撞过墙,还有张数限制。

3.Yupoo是国内的网站,不会被盾,速度也很快,但是它也很不靠谱:会在照片下面加广告、三个月不登陆图片就显示不出来了、还有流量限制。所以基本还是不会用的。

4.Photobucket还不错,不过也有流量限制,没用过,也还是算了吧……

综合起来,外链图片还是Picasa最好,如果哪一天Picasa被和谐掉,我就把图片直接上传到博客空间里了,因为其他的都觉得不靠谱。

Tagged with:
09

开张啦

blog_man


Tagged with:

Copyright @2009 Daniel Ting Admin