preload
十一 04

2009年中国互联网大会11月2号和3号在北京国际会议中心举行,我在网上抢了免费的“观礼票”,去听了半天。这个大会规模盛大,牛人N多,对我来说挺开开眼界的。

会场外面:

互联网高层峰会现场:

现场观众(1500人的会场):

网易互联网领袖扑克牌(我拿了一副):

Google展台:

现场讨论最多的就是下一代互联网会是什么样 ?

Tagged with:
13

几天在所里听了一场走向web3.0的讲座,演讲者是荷兰阿姆斯特丹自由大学的黄智生教授,他的研究方向是语义网和逻辑,下面这幅图是他对web从1.0到3.0的定义:

他认为web3.0应有以下几个特征:

•新颖性(Novelty): 它不同于已有的Web1.0和Web2.0的技术,它能提供全新的一代网络服务模式(即为什么不是Web1.0或Web2.0)

•可行性(Achievability):它在现有的网络环境下,经过努力是可能实现的,它并不存在不可逾越的技术障碍(即为什么不是Web4.0或更高)。

• 迫切性(Urgency):它提供网络服务是当前社会迫切需要的,它的技术引入是能够对社会产生重大影响。(即为什么只能是Web3.0)

国内现在也有自称web3.0的网站出现了,比如雅蛙,给我的感觉就一个性化主页,类似于iGoogle。

web2.0的繁荣让我非常期待web3.0到底是怎样一个景象呢? 是一个怎么样的全新网络?我们拭目以待…………

Tagged with:
07

zuola同学说过,PR就是你在网上的RP,PR的高低是对网页质量评判的最好标准。

下面这是维基上PageRank的示意图和解释

Mathematical PageRanks (out of 100) for a simple network (PageRanks reported by Google are rescaled logarithmically). Page C has a higher PageRank than Page E, even though it has fewer links to it: the link it has is much higher valued. A web surfer who chooses a random link on every page (but with 15% likelihood jumps to a random page on the whole web) is going to be on Page E for 8.1% of the time. (The 15% likelihood of jumping to an arbitrary page corresponds to a damping factor of 85%.) Without damping, all web surfers would eventually end up on Pages A, B, or C, and all other pages would have PageRank zero. Page A is assumed to link to all pages in the web, because it has no outgoing links.

其实百度的李彦宏同学的超链分析专利和PageRank基本是一个道理,说李彦宏抄袭PR就有点昧着良心了,因为李彦宏这个专利比Google的PageRank专利要早申请的,详细信息keso这都有进行了详细的介绍,当然google更不可能是抄袭的李彦宏的成果,只能说同一创意在同一个年代一起萌芽了出来。

那么这个PageRank值有什么用呢?

1.是对网页的肯定。用来标识网页的等级/重要性,从1到10,  PR值越高说明该网页越受欢迎,对网页结构、内容的肯定 , 基本是通过网页被外链的数量来衡量的,导入链接越多质量越高,该页面的PR 值就越高。而且这个PR值跟我们的客观逻辑很接近,一个网页页面基本看一下就能大概猜到PR是几了,也从侧面的说明了PR这个值的实用有效性。

2.给网站带来流量。PR值越高,就说明网页比较重要,就拥有了排名靠前的优先权,这样就能通过搜索能够得到很多的流量。而且PR高的页面,搜索引擎可能加快对网页数据的更新 ,也因为更容易带来较高流量,是各大站长们奋斗的目标,好多人都喜欢交换链接,这样能给彼此都带来些PR高质量链接。我这博客现在的PR是1,还是以前一个空页面的时候从鼓浪听涛骗了些流量给得来的,现在正常写些内容,不知道在下次PR更新的时候能不能达到2……

3. 賺钱。PR还可以賺钱,靠出卖链接,而且收入还不菲,据ecvip透露,他08年就通过在BackLinks上出卖链接賺取了245 美元。PR值对应的价格如下(按月算)

利用BackLinks进行交易可以去ecvip那看详细的介绍。不过出卖链接有风险,可能会被Google惩罚的……

PS.再转几个提高PR的方法

1、登录搜索引擎和分类目录;友情链接别忘了,如果能获得来自PR值不低于4并与你的主题相关或互补的网站的友情链接,且很少导出链接,那样效果更好.

2、写一些高质量的软文,发布到大型网站,如果得到大家的认可,你的网址会被无数的网站转载.这种方法对于提高PR值效果最好.

3、搜索引擎收录一个网站的页面数量,如果收录的比例越高,对提高PR值越有利.

4、提供有价值的网站内容,并进行SEO优化.对提高PR值也非常的重要.

5、最好使网站被三大知名网络目录DMOZ,Yahoo和Looksmart收录,如果能被收录,对PR值的提高非常的迅速.

6、花钱买流量.去QQ群、去论坛等人气旺的地方进行宣传……

Tagged with:
28

网络上的页面日新月异,无时无刻不在变化着,而搜索引擎里面的快照也只能提供最新一次抓取时的页面。所以如果想看某个网站发展过程中的页面变化,那互联网博物馆是最好的选择了。

最出名的当然是Internet Archive了,下面这幅图是里面储存的Yahoo 各个时期的网站首页页面

国内也有个类似的网络信息博物馆,北大的infomall,教育网服务器,电信基本不能访问。收入的网站以中文站为主,所以内容也比较少。

那么这种互联网博物馆有什么用呢?

1.当然就是能了解某个网站的发展情况,历史页面。可以免费拿到些数据。

像腾讯qq.com的主页02年的时候还是老外的个人待售网站

03年的时候已经被腾讯买下做为自己的myqq的页面了

到了04年的时候开始往门户方向发展

如今已是最大的中文门户了

2.还可以解决些死链问题,Archive.org虽然慢些,但还算稳定,只要有收录的页面,都能打得开。或者当代理用,看看被GFW掉的页面是什么样子的(当然这样看到的页面不太新)。

3.名捕的BLOG里还介绍了善用互联网博物馆下载已失效的PDF文件

很早就知道互联网博物馆www.archive.org,最近发现,它不但能够保存htm,还保存PDF文件!估计其他文本类型如txt也是可以的。
那这样有什么用呢?举个例子,我昨天想起去年去过的一个站,叫老乙作坊(http://laoyiidesign.51.net),里面有不少PDF古籍目录,但昨天访问时,已失效了,提示:“尊敬的用户,您好! 您在虎翼网购买的服务已到期,请尽快办理续费事宜,我们将在收到汇款后为您重新开通服务。……”
抱着试试看的态度,在www.archive.org中输入http://laoyiidesign.51.net,然后按“Take me Back”,出现有十来个镜像存档,选择其中日期效适中的一个(因为远的不完善,近的已失效),2004年10月的,出现网页,然后按下载页的PDF存档,竟然可以下载!而且确实是保存在www.archive.org上的。
以前有不少站点的PDF下载是开放的,后来又封闭了。利用上述www.archive.org能够保存PDF存档的原理,我想应该可以找到不少好书的。

互联网博物馆现在最大的局限收录的页面太少太少了,因为因特网上面的信息实在太多太多了……

Tagged with:
25

百度虽然是中文第一搜索引擎,但受赢利方式、搜索质量和政策等的限制,经常收到各路的攻击,快要成为了业界的“过街老鼠”。连我这个曾经以李彦宏为偶像的人,现在搜索网页基本都是用Google了。但百度作为中国第一大互联网公司,还是有其他不少非常优秀的产品的。

百度产品大全:

我认为百度比较好的产品有:

1.百度贴吧:贴吧的创意来源于百度首席产品设计师俞军,是讨论某一话题的网友之间最方便的一种交流方式,针对性及时性都非常好,是百度推出的最好的一个产品。在05年芒果台超级女声选秀时聚集了大量的粉丝,所以现在贴吧里最活跃的就是各路粉丝了,像春哥吧08年就被点击了1亿多次,可见贴吧之人气。遇到什么突发事件时,百度某某吧也是最聚集人气的地方。

2.百度知道:我当年就是在百度知道推出的时候注册的百度ID,当时英文有Yahoo answer,中文互动问答不知道有啥,如今就多了,什么新浪爱问、腾讯问问之类。如今,百度知道上已经有5000万个为什么了,各种各样的问题,基本上通俗点的问题都有相关答案了,当然专业性学术性的东西知道上还远远不够,有些品牌也在知道上安排了专门的顾问(如工行小e)来解答网友们的提问。

3.百度百科:因为早期上网的时候不知道有维基百科这个东西(好像当时也被屏蔽了),所以百度才推出百科那会儿时觉得很好玩,就立即创建了我们学校的百度百科词条。相比而言,维基百科的排版和质量都比百度百科好很多,但是它词条太少了而百度百科却有146万条,而且维基是美帝国主义的网站,比较民主自由,经常有对我党不利的词条,所以搜索某些关键字时会被盾(比如上海帮),用代理的有点麻烦而且比较慢,所以百度百科还是必不可少的。

4.百度mp3:百度mp3最大的优势就是全,基本上想找的中文歌曲都能找得到。百度当年靠mp3起家,搜索出来的mp3不像其他小站乱跳广告,下载或在线听也都很方便。百度mp3给网民提供了很大的方便,但却因侵权官司不断,不过在中国侵权太普遍了,像视频网站上侵权视频太多太多了。不过现在百度mp3用的比较少了,一般想随便听听歌就用QQ music,要听一些整张专辑就去verycd找了,但遇到一些比较难找的歌或找歌词还是得去百度mp3上找。

5.百度新闻:相比其他搜索引擎提供的新闻搜索而言,百度新闻收入的源最多,所以无可挑剔搜索最新新闻时会用百度新闻。而且百度新闻支持任何关键字订阅,比如我考研的时候就订阅了“百度新闻-考研”,能够第一时间了解考研方面的大小动态。

6.百度快照:因为搜索引擎有时很多网页更新的比较慢,所以经常碰到一些死网页,这时快照的作用就发挥出来了,而且碰到有些不可靠的小站,防止有病毒,也可以用快照进行查看。百度快照稳定快速,而Google不支持快照,所以再用代理看的话就嫌麻烦了。(中文谷歌有支持快照,但一般不用中文谷歌的,都直接用英文大Google

7.hao123:好123可谓一个奇迹,如此简单实用的网站竟然有这么大的流量,当年是很多人电脑的主页,但随着近年来搜索引擎的兴起,找一些网站可能不需要去hao123,而是直接搜索关键字就可以了。但是对于不懂电脑的菜鸟来说,hao123无疑是上网冲浪最好的导航了,要是我爸妈用电脑了,我肯定给他们电脑的主页设置为hao123.com。不过我一直觉得hao123不应该卖给百度。

8.百度图片:其实百度图片搜索图片效果不好,不过Google图片经常显示的太慢,好像搜狗的图片搜索比较好,不过在如今光学识别技术还不是很发达的年代,我对图片搜索的效果都不报啥太大期望,就随便用个百度图片搜搜了。

9.百度视频:平时看视频一般都是直接到优酷找,不过优酷自身的搜索效果太烂,好多明明有的视频搜不出来。所以以前经常是通过百度视频搜索然后链接到优酷、土豆等其他网站,不过最近优酷宣布不让搜索引擎抓了,这样搜索优酷的视频还是只能去优酷网直接找,优酷没有的就用百度视频再搜,因为百度视频索引量比较大些。

10.百度空间:百度空间页面简单,速度快,更主要的是我一直在百度空间写个人生活博客,也骗了差不多10万的点击率(好多都是通过百度搜索带来的流量),写了好几年了也有感情了,所以也会一直持续下去。百度空间里90后很多,是年轻一代的乐园。

11.博客搜索:跟新闻搜索一样,因为百度的收入量比较大,所以同样不用google而用百度,不过百度对独立博客收入比较低,这也是站长们都不喜欢百度的一个原因,经常听建站的人说,你不交钱给百度就在百度上删了你的站,百度流氓的确挺流氓的。博客搜索里面质量挺高,原创的东西很多很多,时效性也很好,我很喜欢用。

12.文档搜索:这个用的不算多,一般都直接在Google 里直接xxx filetype:doc搜索了。但因Google里面“View as HTML”也被盾了,所以百度文档有时还是需要的。

13.百度数据中心:最为几亿网民用的最多的一个网站,百度数据还是有很大的参考性的,像最近的湖南卫视-百度沸点娱乐年度盘点晚会就是完全依照在百度中搜索的次数进行颁奖的,像周杰伦2008年一年在百度中被搜了23亿次,真是太强大了。百度数据中心的行业报告对企业而言也是非常具有参考价值的,代表着大家关注的情况。

14.百度风云榜:显示网民们关注的各类热点话题。今日上升最快top50一般都是最新最热的新鲜话题,可以丰富丰富我的网络生活,知道大家都在关注着啥。

百度的拼音提示和相关搜索其实也都还不错,当然还有很多没有用过的百度产品:国学、安全、少儿、专利、黄页、传情、游戏、电影、杀毒、邮箱等等,所以也不好说。

下图是Alexa上百度二级域名的访问情况:

Tagged with:

Copyright @2009 Daniel Ting Admin