preload
13

以下这些因素决定排序(按其所占的权重从高到低排)

1. 博客页面和query的相关性

相关性是博客搜索引擎中最重要的排名因素,用户搜索一个query的时候,首先对query进行分词处理,然后计算这些关键词在网页中出现的次数密度频率 ,以及关键词位置(比如在标题中出现就比在正文中出现的权重大,<h1>中的文字权重比<h2>中的大),通过这些因素的综合计算,算出搜索query和各个博客页面的相关性,这实际上和普通网页搜索没有什么区别。

2. 博客质量,按照博客网页的重要程度来排序

通过反向链接或者PageRank能大概的判断出博客页面的质量,不过由于博文有时效性,内容常常更新,新更新博客文章常常不会立即有PageRank,在这种情况下,可以通过博客文章所在的博客首页的PageRank来确定新发博文的质量:

对博客首页质量有利的因素有:

(1).博客的外链数量多

(2).博客的访问量大

(3).博客的留言量多

(4).博客的流行程度好

(5).分类与标签的使用较好

(6).博客的RSS订阅者数量多

(7).博客中原创的文章较多

同时也有一些对博客首页质量不利的因素:

(1).博客的发文频率太高,短暂时间内连续发表很多文章, 像自动的一样

(2).重复发表相同的文章,文章里面乱嵌入关键词spam

(3).博客里面很多链接都是指向一个网站,博客广告较多

(4).博客里面转载的文章太多,比如带有【转】原文网址 http://”等字样

3. 博文发表的时间

在博客搜索引擎中,博文的发表时间是很重要的。博客如同日记,具有时效性,内容常常更新,更新周期也较短,较新的文章具有更强的实时价值。博文的发表时间可以通过博文网页上的时间和博客feed中的时间来判定。

4. 用户的个性化信息

如果有可能的话,加上用户的个人信息对搜索结果进行个性化排序,效果将会更好,比如普通的人搜索“树”,可能是指植物树;而一个计算机背景的人搜“树”可能指的是数据结构,对不同背景的人才用个性化的排序也能大大提高搜索的质量。

Tagged with:
十一 19

上个星期台湾大学机械系的陳達仁教授和资讯系的黃慕萱教授到我们所,给我们所的研究生和地方情报所员工讲授《专利》这门课程,现在来整理下我对专利的理解:

•专利的定义:

专利主要是对发明实用新型新式样(又称“外观设计”)此三者经申请并通过审查后所授予的一种权利。

•专利条件:

•各个国家的专利种类不是完全一样的,常见的是发明、新型、新式样专利。

•大多数国家都有早期公开制度。时间是自申请日起满18个月。

•专利申请与审查原则:一般国家都是采取的先申请原则,除了美国是先发明原则。

•专利的维护费用是很昂贵的

•有的专利只有形式审查没有实质审查,所以专利的数量并不能说明什么。

•国际优先权:申请人向巴黎公约任意成员国提出申请后的12个月内,于其他成员国中享受优先申请权。

•专利家族:统一发明创作在不同国家提出的专利申请,专利申请集中,形成专利家族。

•各个国家的专利申请程序有所不同,得具体分析。

•各国专利制度比较:

•INID(专利书目识别代码)为辨认专利公报书目资料项目的重要指标。

•各国专利文献各不相同,其中美国的专利说明书首页最详细。

•专利分类有:IPC、USPC、LOC、DWPI、FI/F-Term、日本意匠分类表。

•免费的专利文献数据库有:TWPAT、USPTO、esp@cenet、JPO-IPDL、SIPO、HK-IPD、WIPO、Google

付费专利文献数据库有:CPI、Delphion、WIPS,付费的数据库可以提高更好的分析功能。

•专利检索的步骤为:

确定检索主题–决定检索类型–选择专利资料库–确认珍珠(相关材料及相关专利)–拟定检索策略并检索–相关判断–确认检索结果

•专利计量包括专利数统计和专利引用分析。

•专利指标有CHI Research指标和数量指标。

•专利分析的功能有:知悉技术领域现状、监控技术领域趋势、了解竞争对手研发状况、掌握竞争对手全球布局、确认研发策略和促进技术加值应用等

•创新研发为企业经营最重要的议题。

专利对于企业来说是极其的,如果你的公司没受专利的困恼,说明你做的还不够大。当企业足够大,生产的产品如果自己不拥有专利的话,后果将是极其严重的。比如最近的中芯和台积电,中芯侵犯了台积电很多专利,最后被迫赔偿2亿美元加10%的股份再加中芯创始人离职,代价是非常惨烈的。

参考:陈达仁、黄慕萱的课件

18

写独立博客,有空间容量和流量的限制,这样要是还把图片都放在自己空间的里的话,无疑会增加博客的负担,甚至会超过空间商的流量限制而得付额外费用。这时选择一个方便快捷的可以外链图片的网站就显得非常重要了。

正常的网站图片是不会支持外链的,支持外链的市面上比较主流的相册有PicasaFlickrYupooPhotobucket

上面图片来自:zdxia

1.这些当中最好的无疑是Picasa了,大家只有对Google比较放心,像可能吧里面几乎所有的图片都是用的picasa外链。我以前也试过,不过发现有的图片地址外链不起来就没用了。今天在bbs上说到这事时,deepspace同学帮解决了这个问题。

因为此前我观察发现picasa里面图片的链接,如果最后一个”/”前面不是s800、s40等s系列,一般图片都外链不起来,因为没找不到可以外链的真实地址。比如,这边一张我相册里的照片:链接 我直接查看图片,得到的图片地址为:

http://lh6.ggpht.com/_7uUELxHC9uo/SZK6HsB9nBI/AAAAAAAAAsM/G2hnrBReAsY/cwr.jpg

而其实这只是一个假地址(红色部分不是s系列),不能进行外链的,这时要做的就是相册主人登录Picasa的网站,点击图片的页面上右边的“此照片链接”,再点一下下面的“隐藏相册链接”,这时嵌入图像里的代码就变了,一下子就可以看出此相片的真实外链地址为:

http://lh6.ggpht.com/_7uUELxHC9uo/SZK6HsB9nBI/AAAAAAAAAsM/G2hnrBReAsY/s400/cwr.jpg

突破了这个之后,我们就可以自由的利用Picasa外链要插入博客里的图片了,google是一个敢于向美国政府说不网站,把照片托管在他这自然绝对放心了,除非哪天GWF把ggpht.com给盾掉……

2.Flickr是Yahoo旗下的一个网站,是web2.0下最火的图片网站,但是把照片托管给它不太可靠,会无故删除用户,所以也得谨慎使用,也曾撞过墙,还有张数限制。

3.Yupoo是国内的网站,不会被盾,速度也很快,但是它也很不靠谱:会在照片下面加广告、三个月不登陆图片就显示不出来了、还有流量限制。所以基本还是不会用的。

4.Photobucket还不错,不过也有流量限制,没用过,也还是算了吧……

综合起来,外链图片还是Picasa最好,如果哪一天Picasa被和谐掉,我就把图片直接上传到博客空间里了,因为其他的都觉得不靠谱。

Tagged with:
09

开张啦

blog_man


Tagged with:

Copyright @2009 Daniel Ting Admin