奇想录 www.qixianglu.cn: 2006/08/11

阿拉伯数字的google索引数

阿拉伯数字google索引数
零0	5190000000
一1	14680000000
二2	10910000000
三3	10850000000
四4	10340000000
五5	10070000000
六6	7010000000
七7	7000000000
八8	8040000000
九9	5900000000

这条曲线这些数字是否隐藏了人类生活的某些秘密呢？这条曲线是否会随着历史的发展而逐渐变化？在不同搜索引擎中，这条曲线是否吻合？在普遍使用阿拉伯数字的不同语言中，这条曲线是否有差异？ www.forcode.net 060811
--
"奇想录"http://www.forcode.net
"热贴榜"http://bbs.forcode.net
"2MTV音乐网"http://www.2mtv.cn/

在google搜索“的”字会出来什么？

在google搜索"的"字会出来什么？

这是一个有趣的做法，你使用google这个全球最大的搜索引擎来搜索一个最常见的汉字："的"，我现在看到的数据是：about 1,250,000,000 for 的，也就是说，一共有12.5亿条信息里包含了"的"字。如果在google中输入"is"这个最常见的英文，能够出来13,530,000,000 for is，也就是说，一共有135.3亿条信息里包含了"is"，这个数值与google数据库里所有信息的条数应该有一个基本稳定的比率，加入google收录了600亿个网址，那么，这个比例就是600：135.3，我相信在一个语言中，面对这样庞大的信息，语言本身的规则和人们的习惯决定了这个比值是稳定的。如果哪位朋友有办法即时获得google收录的网址总数，我们就可以验证一下这个猜想。当然，我们有另一个方法，那就是搜索下列几个关键词：it/is/are/that/yes/no，我们可以获得这些常见英文单词在任何一个时刻的索引页面数。我记录一下此时此刻这几个关键词的索引数量：it是113.9亿，is是135.3 亿，are是111.1亿，that是98.9亿，yes是12.1亿，no是79.7亿。我们可以看到，it、is、are三个关键词索引的信息量是比较接近的。it：is＝0.8418，are：that＝1.1234，yes：no＝0.1518，对于yes和no的比值悬殊很有意思，说明人们喜欢说no而不喜欢说yes，或者说，在人类的沟通中，说no的时候多于说yes的场合。但是因为在英语中，有时候no可以双重否定来表示肯定，或者，有时候用no开头的句子本来就是回答肯定的意思，所以这个比值实际上并没有这么悬殊。利用google对这几个关键词进行对比，只是一个开始，利用google这种跨时代的工具，学术界可以做更多以前不可想象的事情，我想，我以后可以在这方面做一些工作。我们可以跟踪几十年甚至几百年，看看互联网上这些比值会往哪个方向演变下去，而这种演变的背后，有何种力量在左右。
--
"奇想录"http://www.forcode.net
"热贴榜"http://bbs.forcode.net
"2MTV音乐网" http://www.2mtv.cn/

The coolest picture of wake turbulance you will see today

URL：
http://p.airliners.net/photos/photos/5/0/1/1091105.jpg

奇想录 www.qixianglu.cn

2006-08-11

阿拉伯数字的google索引数

在google搜索“的”字会出来什么？

The coolest picture of wake turbulance you will see today

The coolest picture of wake turbulance you will see today

我的简介

先前的博文