forcode想看的


forcode看过的


新技术
新趋势
奇思妙想
科学探索
科幻奇幻
资料搜集
网络研究
统计定量
社会学研究
书摘读后感
数码网络
软件评测
数据指标
实用信息
有趣的东西
房地产
网络赚钱
投资创业
新闻评论
网站经营
电影八卦
美景美人
人物朋友
情感回忆梦
forcode生活

2007-05-19

李中清王丰挑战马尔萨斯,一本人口学著作引起国内外关注

李中清王丰挑战马尔萨斯

一本人口学著作引起国内外关注

记者 方文玉

  本报讯 最近,一部由生活·读书·新知三联书店出版的人口
学新作《人类的四分之一:马尔萨斯的神话与中国的现实》,以其有
效的论证分析和挑战权威的批判姿态,引起了国内外学界的广泛关注。

  长久以来,关于中国传统人口行为的普遍看法一直被马尔萨斯的
理论所占领。该理论认为,自清代以来,中国人口增长迅速,使社会
平均生活水平下降;劳动力过剩又阻碍了能够节约劳动力的技术的发
展,使贫困和死亡率上升。而当今中国生活水平的提高,将带来不可
想象的全球性粮食短缺,继而引起世界其他地区的贫困。中国要消除
贫困、实现现代化,就必须有效地控制人口增长。而中国政府通过雷
厉风行地实行计划生育政策,又被认为是"非人民的自愿行为"。这
就是"马尔萨斯神话":一方面把中国当成一颗潜在的人口炸弹,抛
出所谓的"中国威胁论";另一方面又把中国的计划生育政策作为利
用人权问题攻击中国的靶子。学者李中清、王丰在本书中摘去了马尔
萨斯的有色眼镜,大胆提出挑战和驳论。他们认为,要是不以中国大
多数人民的传统人口行为为基础的话,中国现行的人口政策肯定是不
能在过去几十年中如此有效地实行的。无论如何,没有一个政府能够
成功地强迫亿万人民接受一种他们所反对的全新的人口行为。而且,
马氏理论在当初成书时所引用的他所收集到的中国人口相关资料不仅
有限,而且极其片面,极不可靠,马氏以此为据的立论自然也就成了
问题。本书作者在详细考察了1700年至今三个世纪以来中国社会、经
济与人口发展状况后,利用近些年来挖掘整理的大量历史人口资料,
并参照所收集的丰富的当代中国人口发展变化的数据,从生存、死亡、
婚姻、生育多角度立论,构筑起一个中国历史与文化条件下形成的、
有别于西方的人口行为体系,论述了根源于中国家庭与国家集体性的
这一体系成功的有意识人口控制机制。中国的这种人口行为一直展示
着一种理性,它是生育控制由过去的集体———家庭和家族,向更大
的集体———地方社区以至国家范围的一种延伸。该书指出,这也正
是中国计划生育能够取得成功的重要原因之一。

  该书作者李中清、王丰均为美籍华人,都在美国的大学里任教。
他们合作的这本人口学著作,一问世便得到学界的极高评价。最近获
知,该书已被选为本年度美国社会学学会邓肯学术著作奖的惟一获奖
书。
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

好鬼羡慕你们手部皮肤粗糙滴人

 
 

Sent to you by forcode via Google Reader:

 
 

好鬼羡慕你们手部皮肤粗糙滴人

via 我呸 on May 12, 2007












外一砣:
黑人素不素没有黑眼圈?...

 
 

Things you can do from here:

 
 

标签:

数据挖掘之clementine(spss)


总体看法:c1ementine是spss的数据挖掘应用工具。这种工具可把直观的用户图形界面与多种分析技术相结合。这些技术包括神经元网络、关联规则和规则归纳技术。这些分析能力由一个易于使用的可视化编程环境所提供。

    c1ementinee所使用的图形表现是在屏幕上拖动、按下和连接功能节点。节点的类型分为数据访问节点、数据操纵节点、数据可视化节点、机器学习节点和模型分析节点。模型产生过程由从托盘中选择正确的节点、把它们放到屏幕上和连接节点组成。

    c1ementinee提供了丰富的数据访问能力,其中包括对展开文件和关系数据库(通过odbc)的访问。c1ementine具有通过把建模结果写回一个与odbc兼容的dbms而使它们保持一致的能力。输入数据操纵包括合并匹配字段和派生新字段的能力。

    c1ementine的数据可视化能力包括分布图、线性图和网络分析。

    c1ementine可在运行w1ndowsnt的intel penhum系统、运行hpuxl0及以上的hp900系列、运行irix的silicon graphics、运行solaris 2.x的sunsparc和运行digihlunix 3.x或vms6.x的d1gihlalpm上使用。
    数据访问、操纵和预处理:c1emen6ne能导入分隔的文本文件、用逗号分隔值的文件和定长记录的文件(asc11)。别的数据源可通过支持的odbc接口使用。主要的关系数据库系统包括oracle、sybase、infomix和ca—ingres都可通过odbc访问。

    c1ementlne的数据操纵能力包括以下这些方面:

    ●通过记录顺序对记录进行合并。 

    ●用户定义的集合。

    ●过滤无关系的记录。

    ●使用用户定义的准则和逻辑符号派生新字段。

    ●数据取样的能力;包括最初和最后的n个记录、从n个记录中取一个样本和随机取样。数据挖掘技术、算法和应用程序:c1咖6n6ne支持规则归纳算法、神经元网络(包括

kohonen网络)和关联规则:

    ●c1emen加e规则归纳算法很容易理解:一旦被训练过了,算法就创建一棵决策树代表规则。随后将要进行的频繁处理就是定位在树的最项层的重要变量并用这些变量训练个神经元网络。

    ●c1ementine的神经元网络提供一系列不同的拓扑结构和训练方法。在进行性能评估时,—7个默认的单隐藏层网络能与一个更加复杂的双隐藏层网络相比较。

    ●c1ementine提供了kohonen神经元网络以解决聚类问题。

    ●关联规则就像名字所暗示的用于把一系列属性与一个特定的结论相关联。任何属性之间都有关联,这一点被证明对像市场售货篮分析这样的应用非常有用。

    c1ementine支持顾客剖析、时序分析、市场售货篮分析和欺诈行为侦测。使用工具:通过连接结点的表示形式,模型在一个可视化编程环境中被确定。建模结点的对话框提供对算法和训练方法的某些控制。 ·

    c1ementlne允许用户知道哪些输入对系统的预测是重要的,虽然神经元网络本身难以被理解。决策树算法支持一种交互的、易于使用的规则浏览器。

    c1ementlne提供了对模型进行评估的一系列功能,其中包括一个分析结点用来报告对系统输入进行正确诊断的数量;取值范围从0到1的置信度;以及提供给用户跨表字段选择能力的矩阵模式。

    c1emen6ne能以c代码的形式导出决策树、神经元网络和k0honen网络。在c1emelitine中,当一个模型被构造后,它能以c代码的形式 被导出,并在外部环境被展开。例如,如果一个神经元网络模型必须被导出,c1eme06ne将导出三个文件:一个头文件、一个函数文件和一个网络定义文 件。由规则归纳算法所产生的规则也能被导出。

    c1ementine的可视化编程环境适合于初学者。建模的顺序被清晰地表达了出来,并且各种各样的选项增强了灵活性。一个想要操纵c1eme咖算法的有经验的用户就没有那么自由了。然而,在神经元网络中仍然有一些选项来调整学习率和控制决策树算法中的修剪。

    clementine不提供事务模板。在写此书时,元数据接口还不可用。

结论: c1emetine是一个强大的产品。以公布的用户基推测试来看,它在可伸缩性、预测准确率和处理的时间方面都表现得很好。总的来说,c1gnebtine对小规模和大规模的分析实现都很合适。--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

SPSS 9 月份电子期刊

2006年9月


SPSS首席执行官访华 全面开拓预测性分析市场

8月30日,全球领先的统计分析与数据挖掘解决方案供应商SPSS公司总裁兼首席执行官Jack Noonan再次访华。他此行旨在加大对数据挖掘市场的投入力度并进一步开拓国内合作伙伴关系。

作为预测分析的市场领导者, SPSS在全球拥有超过25万家用户。中国电信、中国移动、中国建设银行、光大银行、国家统计局、信息产业部、劳动和社会保障局、太平洋保险、南京地税、 摩托罗拉、上海通用汽车、可口可乐、宝洁、沃尔玛、好又多、统一、TCL等…这些在中国本土的成功企业和组织背后都有SPSS提供的信息决策解决方案。随 着中国融入世界的脚步加快,各政府机关、商业企业对于数据的分析和预测越来越重视。 
 
"38年来,公司专注于分析关于人们的意见、态度和行为的数据,"SPSS总裁兼首席执行官Jack Noonan说,"SPSS分析方法的深度和广度,可以让我们以全方位不同视角来观察他们所服务的人群。"

今天,SPSS可以为研究分析提供工具,为商业用户提供实用的解决方案,为其它软件供应商提供基于通用标准的分析模块,SPSS公司同时在市场研究领域建立了一套自己的行业标准,提供分析流程中各个阶段的解决方案。

与会期间,SPSS公司总裁兼首席执行官Jack Noonan,拜访了沪上多家金融、教育机构及政府部门的客户和合作伙伴,介绍了SPSS在这些领域的海外成功经验。

在 与金融行业多位客户的会见中,Jack Noonan总裁介绍道:"金融机构要取得成功,金融服务的营销战略和经营分析需要精确的研究和评价。业内领先的金融产品/服务的提供商可以使用SPSS 来精确定位潜在的客户群,可以增强经营活动的目的性和提高成本效率。"例如美国汇丰银行就用 SPSS 对不断增长的客户数据进行挖掘分析,建立了预测模型来发现交叉销售和"翻滚"的销售机会,定位每个产品的最有价值客户来使销售利润最大化、营销费用最小 化。而且,SPSS 的易用性使研究人员可以及时地将研究结果提交给决策者。

而在与政府部门领导的会面中,Jack Noonan总裁介绍到:"SPSS作为全球统计领域的领导者一直在关注着政府信息化的进程。"

SPSS 可以帮助政府行业进行预算分析和评估,评估计划的有效执行程度、审计、分析和挖掘优化的数据,预测计划的效果 。在北京市地税局税收收入预测与计划项目中,北京市地税局一方面加强对SPSS统计软件预测功能的研究与利用,另一方面下属各区县局加大对税源的监控力 度,预测水平稳步提升。 2004年一季度平均预测误差率仅为4.4%。在此一系列成功的推广活动之后,多家客户表示出对本单位实际应用数据统计分析和挖掘软件SPSS相结合的强 烈兴趣。

SPSS总裁Jack Noonan先生中国之行,助推了本土预测性分析市场的苏醒和发展,总裁先生表示对中国的经济发展有信心,对中国的预测性分析的普及和推广有信心。他表示中国的预测性分析市场前景将是不可限量的。

SPSS中国公司8月初搬至时代广场

SPSS公司自2006年5月宣布正式在上海成立中国公司,8月初正式落户淮海路时代广场。同时在北京、广州设立分公司,支持SPSS在中国地区快速增长的业务,使更多中国企业及机构利用SPSS的统计分析和数据挖掘技术解决商务问题。

SPSS参展第二次"营销实践与市场研究应用"峰会

8月23-24日第二届"营销实践与市场研究应用"峰会在大连富丽华酒店隆重举行。SPSS北京代表处作为SPSS中国的代表参会,产品经理贾志东先生亲临会场,为参观者介绍公司目前发展动态及产品信息。精心设计的展台以及丰富的产品信息吸引众多参观者驻足。

此次峰会,是全球和国内市场研究行业演示其高精尖"武器"的前沿阵地,聚集了来自企业、广告、媒体、学术和市场研究机构的300多人,为市场研究行业及其服务的广大客户提供了一个交流的平台。

SPSS公司简介

SPSS公司成立于1975年,总部在芝加哥。在纳斯达克上的股票代码为 SPSS。在全球100多个国家和地区有分支机构或合作伙伴,直系员工超过2000人。全球约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保 险、制造、商业、市场研究、科研教育等多个领域和行业,全球500强中有80%的公司使用SPSS, 而在市场研究和市场调查领域有超过80%的市场占有率,是世界上应用最广泛的专业统计软件之一!

SPSS公司在开发尖端的预测技术方面已经取得领先地位。在《财富》100强公司中有95家选用了SPSS公司的预测分析解决方案, 因为SPSS能够帮助他们正确地预见未来的变化情况,使他们能制定出相应的战略决策,并能成功地解决当前以及未来可能碰到的困难。而政府机关、教育机构和 研究组织也会遇到和商业组织一样的困难。所以,越来越多的组织使用SPSS预测分析解决方案来处理这些问题。 更多...
 
SPSS产品分类

SPSS 为您提供揭示客户需求、预测客户行为的统计分析和数据挖掘产品和解决方案, 并与客户关系管理(CRM)有机地结合在一起, 使您能更好地了解您的客户,并与他们建立十分融洽的互动关系。 SPSS的产品线功能全、整合紧密,包括商务智能(Business Intelligence)和市场研究(Market Research)两大部分。

商务智能(BI)

SPSS 的商务智能(BI)产品依靠强大的统计和数据挖掘功能,帮助您解决商业运作中的各类问题。这些预测性技术使您能够改善分析结果,作出更好的决策。

主要产品包括:
  • SPSS家族系列产品:全球应用最广泛的统计分析软件
  • Clementine:业内顶尖数据挖掘软件
  • Answer Tree
  • Amos
  • Dimension
  • Data Entry
  • 市场研究(MR)
市场研究(MR)

SPSS 的市场研究(Market Research)产品通过建立开放式及多方式的科学技术和在线离线服务,能够为世界各国的市场研究人员提供商业战略解决方案。

主要产品包括:
  • mrPaper
  • mrStudio
  • mrTable
  • mrInterview CATI
  • mrScan
  • mrTranslate
  • mrDialer
  • Quantum
  • Quancept CATI
  • SPSS Data Entry
SPSS产品在各行业的应用

SPSS解决方案广泛应用于财政金融、政府机构、市场研究、邮电通信、制造业、零售业、电子商务、交通运输、医疗卫生、教育机构等领域。
 
SPSS产品在税务方面的解决方案

税务征收过程中产生的欺诈问题导致政府损失大量的税收收入,如何有效的发现逃税个体,确保国家税收收入,以便更好的为纳税人服务是世界各国的政府税务部门同样面临的棘手问题。
 
南京市地方税务局

北京市地方税务局
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

SPSS 10 月份电子期刊

2006年10月


SPSS 15.0 for Windows英文版现已上市

SPSS 15.0 for Windows英文版现已上市!通过SPSS 15.0 用户可以提高数据资料管理能力,报告能力,可扩展的编程能力以及强大的新统计程序。此外,企业用户通过在其组织中更有成效的和更为连贯的运用数据获得新的机会。

Pep Boys运用SPSS为客户提供更好的产品和服务

Pep Boys,美国著名的汽车配件零售商和维修服务商,最近选择SPSS的预测分析软件来发展分类计划模式。因此,每个Pep Boys商店都能够保证最受欢迎产品的持续供应,从而为客户提供更好的服务。Pep Boys拥有593家商店和超过6000个服务站遍布美国36个州以及波多黎各。除了汽车维修和维护之外,公司还提供汽车配件销售,是美国最主要的备用轮 胎销售商之一。

"SPSS预测分析软件可以帮助我们建立一个存储层次需求模型,这个模型可以对配件进行更充分更完善的分类管理,从而为我们的顾客提供更好的库存配置。"Robert Sammons,Pep Boys配件公司的副总裁说。

对此,SPSS总裁兼CEO Jack Noonan说,"我们很自豪Pep Boys选择了SPSS。SPSS软件正在帮助Pep Boys利用对产品更强的洞察力为客户提供更好的服务。这表明了预测分析软件的有效性正在得到提高,同时也表明此类软件有能力为公共和私人部门识别关键的 流程改进。"现今全球20大零售商其中有16家选择了SPSS软件进行客户理解,操作效率以及产品开发等应用。

Consumer Link运用SPSS改进调查研究过程

Consumer Link,新西兰最具有创造力的市场调查数据的收集和处理机构之一,最近选择Dimension产品促进网站的远程访问。

Consumer Link的团队拥有30个管理者,超过500个采访人员,每年大约20万的访问量。

通过Dimension, Consumer Link可以控制和优化每个研究过程:从设计和采访,到对数据进行分析并且在各部门间共享分析结果。

ESPN星空体育选择SPSS软件

ESPN 星空体育(ESPN STAR Sports)运用SPSS 可对亚洲的百万收视率的参数进行迅速的识别,其中包括快速增长的移动电视观众,并且基于SPSS的分析结果发展了其他诸多的娱乐节目。ESPN 星空体育是由世界两大有线与卫星传播机构 - ESPN Inc. 及星空传媒集团(STAR)合资经营,是亚洲规模最大的体育电视网。ESPN拥有观众超过1亿3千9百万;卫视体育台则拥有6千5百万。

通过不断的电子化的收视率测度,使得ESPN星空体育可以覆盖全亚洲的各个市场。但是,对于和观众的完全结合,包括观众的态度和感觉方面,要求一个定制化方式。ESPN 星空体育利用SPSS同样找到了一个根据原来的方法无法测度的方法,这个方法可以获得更多的移动电视观众。

通过SPSS, ESPN 星空体育频道能够同时调查不同地区(无论是家庭用户还是移动用户),不同语言的亚洲观众,从而直接多角度地得知他们的所观赏,所喜爱和参与互动的内容并且能度量他们对于电视频道的喜好程度。

ESPN STAR 体育频道的研究主管 Anand Rego 说:"我们先前一直通过专注于局部水平的群体和量化研究来获得这样的信息。而有了SPSS的企业反馈管理软件后,我们能够连续地和同时地得到不同亚洲地区的连同收视率的各类信息。"
 

SPSS数据挖掘工具--Clementine 产品简介

Clementine作为业内领先的数据挖掘平台,允许企业利用业务专业技能快速开发预测模型,并迅速部署提升决策水平。Clementine能够帮助企业达成以下目标:

• 提升客户获取能力和维持能力
• 提升单位客户的收益和利润
• 最小化成本
• 用更少资源抵制违法

Clementine支持完整的数据挖掘流程,降低了对时间和资源的需求。同时,Clementine是完全按照数据挖掘的行业标准---CRISP-DM而设计。CRISP-DM使得数据挖掘成为了业务流程的一部分,用以解决企业中的实际问题。

Clementine产品线包括以下列出的产品组件:

• Clementine Client and Clementine Server – 客户端是功能完整的产品,安装并运行在用户的桌面机上。客户端产品既能够作为独立的产品在本地运行,也能与Clementine Server一起以分布式方式运行,从而提高大数据集的执行效率。 服务器版本能够与一个或多个客户端以分布式方式安装,它在大数据集时提供了更高的性能,因为服务器方式下有大内存选项,无须将数据下载到客户端上。这里要注意的是,使用服务器版本必须至少有一个客户端。

• Clementine Batch – 批处理模式允许用户执行一些比较耗时,或者优先级较低的作业,绕过用户交互界面,无须用户的干预。Clementine Server产品带有一份Batch, 如果客户需要其他的Batch,也可以单独安装。Clementine Batch提供完整的分析功能,且没有常见的用户交互界面。

• Clementine Solution Publisher – Clementine Solution Publisher是一个扩展的组件,允许用户将Clementine流文件发布到Clementine环境以外。发布的流文件能在Clementine Solution Publisher Runtime环境下运行,该环境可根据用户需求进行部署。

• Clementine Desktop – 该桌面端产品是功能有所限制的客户端产品,不包括的功能有:SQL回馈,服务器访问,批处理模式,Solution Publisher,PMML 模型导出,Cleo 或其他SPSS部署向导,以及Text Mining for Clementine和Web Mining for Clementine。

• Text Mining for Clementine - Text Mining for Clementine是扩展的产品,提供从非结构化信息中提取结构化数据用于分析。此模块需要单独的许可证,允许用户基于上下文从文本中快速获取关键信息。将这些信息再与已有的结构化数据结合,比如人口统计信息等,帮助用户的决策更加准确。

• Web Mining for Clementine – Web Mining for Clementine是扩展的组件,利用NetGenesis Web分析技术,将原始Web数据转化成Web节点以利于分析。

• Cleo – Cleo提供交互式Web部署。Clementine建立预测模型后,通过点击Cleo部署向导创建瘦客户端的Web应用,从而在Web上使用预测模型。

• Clementine Application Template – 针对不同行业、不同应用的模板,通过此模板用户可以迅速开发自己的数据挖掘应用,目前包括Web CAT,Telco CAT,CRM CAT,Microarray CAT四套。

企业应该具有怎么样的数据挖掘系统

 

数据挖掘作为利用企业大量数据发现规律规则并在企业经营活动中应用从而产生商业价值的一个商业应用过程,是由多方面的要素构成的。

一个完整的企业数据挖掘系统包含这样的3个部分:

1、高素质的人员。应该包括以下几方面的人员:

  • 了解数据的人。可能是数据库管理员,要求对数据在企业中的存储位置,存储方式非常了解。


  • 业务人员。需要了解业务,能够及时提出问题,并协助分析员把商业问题转化为数据挖掘问题,理解数据挖掘结果,并能够把数据挖掘结果转化为企业的实际商业行动创造价值。


  • 分析员。需要了解数据挖掘的算法和功能,熟练使用相关数据挖掘软件产品,能够和业务人员一起把商业问题转化为数据挖掘问题并解决数据挖掘问题。

    只有具备了以上三方面的人力资源,数据挖掘才能够在企业中充分发挥作用,为企业创造更多的商业价值。

2、硬件资源。企业需要配备满足数据挖掘系统的必备的计算机和相关存储设备的硬件。

3、软件资源。能够完成相关数据挖掘算法的软件。

具备了以上三个方面的资源,企业就具备了建立高效、完善的数据挖掘系统的必备条件。但是在具体实施数据挖掘项目过程中,企业还需要注意以下几个方面,他们是企业获得高价值数据挖掘结果的重要保证。

  • 良好的数据资源。巧妇难为无米之炊,企业只有在具备了相对优良的数据资源,才可能期望从数据挖掘中得到良好的数据挖掘结果。


  • 组织间的协调配合。数据挖掘往往需要企业各个方面的数据,他们往往不止来源于企业某一部门,这就需要部门间的良好配合和协调行动。


  • 业务人员和数据挖掘人员的良好沟通。在企业中,往往进行数据挖掘的人员和使用数据挖掘结果的人员不是一个人,甚至不是一个部门的人,这就需要他们 之间就需要什么样的数据挖掘结果、怎样把这些结果和具体的业务流程相结合进行充分的研究和探讨。只有这样,数据挖掘结果才能够在企业中得到充分应用。

数据挖掘的商业应用最终是为了能够给企业带来商业价值和利润。所以,一个成功的数据挖掘项目的结果应该是:

  • 数据挖掘产生的结果能够转化为具体的、可操作的商业行动。


  • 经过数据挖掘结果指导制定的商业行动确实能够为企业提高销售收入、降低成本、提高客户满意度等等,数据挖掘的效果应该是真实可见的。


  • 数据挖掘产生的结果能够和实际的业务流程或者业务系统无缝结合并能够为业务人员所广泛知晓和使用。

  • 能够重复进行,易于维护和更新的过程。
如何选择数据挖掘工具

数据挖掘可以帮你做更好的决策,增加收入,提高效率。虽然数据挖掘的承诺非常诱人,但是数据挖掘并不是一个自动的财富生成器,在数据挖掘的过程中存在着各种各样的问题和陷阱,而选择什么样的数据挖掘工具来进行数据挖掘就是其中最关键的一个环节。

CRISP-DM (Cross-Industry Standard Process for Data Mining) 是在各企业中被广泛采用的数据挖掘的标准流程。按照CRISP-DM的标准,数据挖掘包含6个步骤,他们是:商业理解、数据理解、数据准备、模型建立、结 果评估和应用部署。这一流程过程将以数据为中心,整个过程从商业问题开始,归于商业问题的解决。并且该标准流程把数据挖掘理解为需要不断循环调整的环状结 构,在企业进行数据挖掘的过程中,通常需要在几个过程之间往返进行,最终才能拿出优秀的数据挖掘结果,这也更加符合数据挖掘在企业中使用的实际情况。

第一阶段:商业理解

本阶段的任务主要是从业务角度来理解数据挖掘项目的目标和要求,然后将此转化为数据挖掘问题,并制定一个可行的数据挖掘计划。选择数据挖掘工具时,需要考虑以下两个问题:
  • 是否有在其他相关企业成功实施的经验,可用该工具解决广泛的商业问题,包括我们面临的商业问题?


  • 在解决我们行业内的商业问题时,该工具(单独或与我们的应用程序一起)是否有用?是否有该领域的成功案例?

  • 该工具是否在商业问题和数据挖掘技术之间提供了一个桥梁,是如何提供的?

  • 使用该工具中,各操作步骤是否可以被清晰地映射到数据挖掘的商业需求上?该工具是否向商业用户清晰地表述了数据挖掘概念?该工具如何与项目管理或其它计划工具所整合?是否需要编写额外地应用程序来实现数据挖掘技术与商业理解之间的沟通?
第二阶段:数据理解

数据理解阶段包括收集数据和对数据进行探索性分析两个部分。在该阶段中,可以获取不同类型的数据和可视化技术是要着重考虑的。
  • 该工具如何保护我的现有资产的利用?


  • 该工具是否可与现存的数据库兼容?该工具是否支持通用的数据接口标准?是否要求数据转换成另一种格式才能使用(如果需要,我们需要什么样的投资)?

  • 该工具是否可以对数据进行交互式探索分析并用丰富的图形展示数据?

  • 数据挖掘工具是否提供了可视化技术,以便于发现数据中存在的模式?图形是否可以与用户交互,例如随着数据维度的改变,图形是否可以发生改变或者生成新的图形?
第三阶段:数据准备

数据准备阶段的任务包括了从最初获取的数据一直到构建生成可用于分析的最终数据。此阶段要着重考虑数据准备工作的高效性和易用性。
  • 该工具如何准备数据?


  • 该工具在数据准备的所有工作(包括为建模所作的准备或为提高数据挖掘效率所作的准备)是否是交互性的?该工具在进行数据准备工具时,是否以一种易于跟踪的方式?

  • 在数据准备中,该工具是否可自动提取数据?


  • 在提取数据时,是自动完成的,还是需要手工写SQL查询语句,进行数据的合并、汇总、排序和其它数据准备工作?
第四阶段:建立模型

在该阶段,需要选择和应用各种建模技术,设置模型参数。用户往往需要返回到数据准备阶段以使数据适应不同模型的不同要求。由于同一数据挖掘问题可以应用不通模型,故要考虑数据挖掘工具在应用和比较不同分析技术的能力。
  • 该工具是否提高了分析师的工作效率?


  • 该工具是否使分析师能快速生成有效模型?用户比较不同模型以找出最佳解决方案时,该软件的易用性有多好?为适应不同模型要求而进行数据准备工作时,该软件的易用性有多好?

  • 该工具是否提供了足够多的数据挖掘技术?


  • 该工具是否提供了神经网络、关联算法、聚类分析、分类分析、回归分析、图形化的展现等数据挖掘技术?

  • 该工具是否可组合使用不同技术?


  • 不同技术是否可易于组合而生成更佳结果?模型结果是否可整合入数据集以便后续分析?

  • 该工具是否可与现有技术资源(如算法和其它工具)兼容?


  • 该数据挖掘工具是否能与现有的算法工具兼容使用?该数据挖掘工具是否可与其它数据分析工具兼容使用?
第五阶段:模型评估

评估阶段要对模型进行多方面的评估。主要目的是确定重要的商业因素是否被充分考虑?下面列出了有关的重点:商业用户的输入如何被整合跑过模型,结果又如何被传给受众。
  • 该工具的结果是否可以适用于各种情况?


  • 该工具产生的解决方案,是否对所有数据挖掘问题的解决方案都是有效的,还是只对某个数据挖掘问题的解决方案是有用的?结果是否准确地反映了所有的商业问题,是否在检验数据集上进行验证结果也足够好?

  • 该工具产生的结果是否容易理解?


  • 产生的结果是否易为商业用户所理解?如果不能,需要采取什么步骤以使结果便于读懂?该工具是否要求商业专家参与整个数据挖掘过程?
第六阶段:结果发布

数据挖掘过程可能很简单,如只是对商业问题给出一个建议,也可能很复杂,如应用一个应用程序向信息客户提供新知识。无论简单还是复杂,在结果发布阶段,都要用到该过程。结果发布经常要求扩展性的服务,所以下面的问题主要是基于数据挖掘工具在此任务上的帮助能力。
  • 如何发布数据挖掘解决方案(现在和未来)?


  • 数据挖掘解决方案如何才能被整合到操作性的应用程序中?整合的投资回报率是否高?是否需要在时间和财力上对结果发布做额外的投资?解决方案的更新是否容易?如果不容易,需要做些什么工作,投入多少财力和时间?

额外考虑之一:关于成本

除了CRISP-DM过程模型各阶段所要考虑的对数据挖掘工具的要求之外,还需要做一个投资回报分析。

  • 成本是多少?


  • 考虑产品寿命、所提供服务等,将成本量化。将预期的回报也量化。什么时候才会得到一个预期的ROI,此结果是否满足商业目标。

  • 实施时间?


  • 要花多长时间来实施数据挖掘项目?是否需要其它工具或硬件?需要多少培训、咨询、定制开发以得到项目结果?
    用户(现在和未来)能力是否能达到所用工具的要求?
    该工具要求用户具备哪些能力?该工具是定位于技术专家、数据挖掘初学者、还是各种水平的用户?使每个人可使用该软件所需培训成本是多少?不要忘记考虑未来潜在用户的技能。

  • 该工具是否可为用户定制?


  • 该工具是否可为不同用户进行定制?一般过程是否可被保存以便再运用?该工具是否可使任务自动执行?是否可得到自定义界面或提供其它帮助的服务?
额外考虑之二:关于厂商

最后,要考虑数据挖掘工具厂商的实力。从许多方面,购买一个数据挖掘解决方案是对未来的一个投资,在前进的路上有一个可靠的合作伙伴将是有益的。
  • 厂商是否提供其它用于解决相似问题的工具和服务?


  • 厂商是否提供其它数据挖掘或数据分析工具?厂商是否提供咨询、培训、技术支持和其它服务?这些服务是否是全球领域的?

  • 厂商是否是软件升级、其它服务的可靠提供者?


  • 厂商在数据挖掘解决方案领域,是否处于领先地位?厂商是否有能力和资源在未来继续提供高水平服务?
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

超酷的夜光刺青

 
 

Sent to you by forcode via Google Reader:

 
 

超酷的夜光刺青

via 煎蛋 by aif on May 18, 2007


如果你想有一个刺青但:不想让它显眼、或不愿被老板看见、或要刺个与众不同极具个性的,那可以考虑刺下这样一个夜光tattoo。

这种新型的夜光药水(UV Blacklight Ink)不含磷,不致癌,可持续十年以上。

不错吧!! 到了夜晚将展现另外一面~~

链接 | 来源

Tag:

 
 

Things you can do from here:

 
 

标签:

向迅雷学习如何骗周鸿祎这样的VC

借互联网的东风,VC似乎一夜间就席卷了大江南北,风险投资可是最希缺的资源,各网站对他们绝对奉若神明,似乎所有的人都在找风险投资,VC之声自是满天飞。VC或者说风险投资吧是近几年在互联网界可谓使用频率最高的词汇之一。

 

但是现如今,自从纳市大跳水后,VC们一个个把钱袋子捂得紧紧的,本来嘛这个世界从来不缺创意,但是缺好创意,项目很多,好项目却不好找。使得VC们在投资的时候看了又看,选了又选。

 

很多VC感叹:钱花不出去啊。

很多创业者感叹:找不到钱啊。

 

到底问题在那里?我们不妨以一个例子来看看:

 

从去年到现在,徽剑发现自己已经被很多人或媒体当成了"迅雷问题专家"了。所以这里还是拿迅雷吧。徽剑在分析迅雷的时候发现了一个有意思的问题,那就是"当年迅雷成功地从周鸿祎那里骗来了天使投资"。

 

当年,邹胜龙和程浩在第一个项目也就是邮件系统失败后,处于困境当中,在这个时候,他们萌生了撞大运的想法,搞了一个很搞笑的系统,就是早期的迅雷软件,我们来看看这个早期的软件的原理。

 

第一步,邹胜龙和程浩去租了好几个空间,据说有几十个,将要下载的几个游戏客户端样本放在这个空间里面。

 

第二步,在这个时候,断点传输技术已经非常成熟,而且在网上也大量出现现成的源代码,邹胜龙和程浩就利用这个源代码,将其略作修改,将原来只从单地址的断点下载改成了可以同时链接几个地址断点下载的软件。

 

第三步,迅雷软件客户端采用断点下载的方式,分段同时从这几十个空间里面下载,这样一个迅雷实际上就相当于几个网际快车之类下载了。

 

第四步,迅雷利用这个客户端软件去跟几家游戏厂商洽谈,结果可想而知,那些游戏厂商正在为其巨大的游戏客户端下载速度慢而发愁。一看迅雷下载这么快,于是就跟他们签了合同了,注意这时的迅雷只是样本下载速度快而已。

 

第五步,迅雷利用与游戏厂商的合同,去找了几家风险投资,不过开始的时候很遗憾,全部被识破了,正在绝望的时候,IDG来了,周鸿祎上当了,于是就有了今天的迅雷。

 

这就是当年的历程,我们来看看今天的迅雷是如何向吹嘘自己的技术的:

 

"邹胜龙:大家都认为迅雷是一个P2P的公司,其实这是一个误解,迅雷最主要的一个技术,它是一个我们叫p2sp的一个技术,这个技术在迅雷发明创造之前 从来就没有存在过,所以这是一个非常新的领域,很多人就会把它去跟P2P挂靠,其实它跟P2P非常不一样。如果说P2P的数据百分之百是来自于客户的PC 的时候,那么p2sp的技术实现的是80%的数据是来自互联网服务器的,20%的数据在特殊的情况之下,比如说你跟我都在同一个办公室的时候,没有必要走 外网的时候它会发生在PC上,从这个意义上说,p2sp从骨干网的带宽节省上来说就没有造成特别多的带宽浪费。这个技术是迅雷自己发明的,我们在03年把 这个技术在美国申请了专利,也申请了全球专利,也在中国落地了。"

 

由于手头资料所限,徽剑没有查到邹胜龙所说的全球专利是哪项,不过从谈话中,这个技术的核心是所谓p2sp技术,说白了也就是p2s+p2p,也就是一边采用断点下载技术同时从几台服务器下载,同时采取p2p技术去下载。

 

如果是这样的话,这个专利从技术上而言就很可笑了,其实这是一种典型的"铅笔橡皮帽专利",就是找个理由把两个技术简单结合到一起,就像铅笔一端加上橡皮擦那样。从商业上来说当然没有问题,但是牵涉技术先进程度就很搞笑了。

 

事实上,徽剑经过分析,发现迅雷客户端基本没有是用p2p技术。凡是了解p2p技术的都知道,采取p2p技术去下载速度通常是不会超过50-100KB的,否则在中国目前的带宽情况下就会严重影响整个全国的互联网网络的运行。

 

经过上面分析,稍微了解技术的人都会发现其中可笑之处,但是就是这样一个让人喷饭的技术如何拿到了投资呢?目前市场上各种先进技术有的是,为什么总是碰壁呢?

 

周鸿祎作为第一个向迅雷投资的人,他是如何决定的呢?或者说迅雷是如何用一个完全可以说是非常可笑的技术拿到投资呢?

 

我们不妨先来分析一下周鸿祎这样VC的特征,

 

第一,周鸿祎认为什么样的项目有前景:

"我最早扶持迅雷的时候,也没有想到他们有今天。"周鸿祎说,当时想法很简单,就是人们下载软件和娱乐内容的时候,总是需要一个下载工具。周鸿祎希望创业 者们所做的事情,都是能解决现实中存在的问题,"通过技术和产品帮助别人解决问题,这就创造了价值"。他认为,这样的公司不一定都能做得非常大,但只有这 样的公司才能真正扎根于网民。

 

周鸿祎:"大家都是摸石头过河,一步一步探索过来的。所以今天你看像新浪、像网易,他们也折腾了很多商业模式,才找到今天的发展之道,你不能要求今天的新 兴公司在刚起来的时候就一定把这个模式做的特别明确,所以我是觉得一个公司完整的商业模式,首先分为产品模式或服务模式,就是你提供一种有价值的东西,然 后是用户模式,就是你面对什么样的用户群,你给你的用户提供什么样的价值。还有一个是市场模式,就是你这个东西有多大的市场,它会有多大的空间,你在市场 里面怎么去推广。最后才是收入模式,也就是所谓的盈利模式,如果脱离了前面的这些模式,你都不明白它们的应用价值,我觉得你很难到最后一步,说你能够站在 前边。"

 

 

第二,周鸿祎对项目的要求:

周鸿祎是一个喜欢投机取巧的人,喜欢花最小的代价来做"关键"的事,比如说,

 

当年他不做浏览器而是做了个3721插件。

现在他不做门户而作所谓的聚合门户

现在他不搞杀毒软件而搞所谓的反流氓软件。

 

周鸿祎1970年生于湖北,后随父母移居河南,并在河南长大成人,河南人的性格在周鸿祎身上表露无遗。尽管在这里徽剑不想挑起什么地域之争,但是在实际接 触中,河南人确实比较喜欢钻空子和投机取巧。周鸿祎认为:"往往一个简单的想法会改变世界"。现在看来,当年迅雷就是满足了这个要求:"自己不做下载,利 用别人的服务器做下载",把最大的投入交给别人,自己做捞现成好处的渔翁。

 

当年周鸿祎向迅雷投资的金额是70万元人民币,属于比较小的投入,这也恰好是周鸿祎的一大特点:"不会掏哪怕稍微多一点的钱"。

 

我们在来看迅雷是如何"瞎猫碰上死耗子"骗了周鸿祎。

 

第一,   国内网速比较慢,网民确实需要提高下载速度的需要。

第二,   迅雷采用的是盗链其他网站的下载资源,自己不用架设大量的下载服务器,这种恰好符合周鸿祎对项目的"投机取巧"的要求。当用户在一个页面下载软件的同时,迅雷服务器就能提供数十个相同文件的下载链接,用户用迅雷下载就能盗连数十个其他网站!

第三,   迅雷弄了个现在看来很搞笑的样板,但是当时周鸿祎确实上当了,周鸿祎并不知道迅雷是像当年给袁世凯办的假报纸那样的。本来嘛,软件看看表面又看不出来,技术细节又不可能提前透露,关键是理论上还糊弄的过去。

 

在整个过程中我们发现一个问题,那就是核心在于迅雷弄了个像模像样的样板,而这个样板又与周鸿祎的要求一致。

 

针对周鸿祎这样的VC,作为创业者要如何对待呢?

 

首先,你的项目要是弥补某种缺陷的,能够解决某种需要的。

 

其次,你的项目不能是那种基础性的,比如门户网站、垂直门户等,要选择那种投机取巧的,比如来个web1.8的,或者来个b2cb的, 因为基础性的投资大、这样风险也就大。

 

再次,弄个样板,要有所谓的先进技术概念包装,注意这里并不需要你真的实现了这个技术,只要你的测试版上表现出来很像就可以。这是最关键的。很多时候,我 们会发现开发一个完全的实用版需要很大的难度,比如说用C开发的软件具有速度快、稳定性高的特点,目前全世界大型软件基本都是用C开发的,但是对于初期完 全可以用VB、Delphi等开发,这样可以极大的节约开发成本和时间。如果一些功能比较难实现,在早期可以采用类似迅雷那样投机取巧的方式来实现,先拿 到VC投资再说。

 

第四,不要找他们要太多的钱,而且事实上你也要不到,要个100万足够。l

 

总而言之,VC是有不同特点的,而迅雷这种欺骗手法成功地从周鸿祎那里骗来的第一笔投资,这也是值得大家思考的问题。徽剑总结的经验就是

 

一是无奸不商,VC们大多喜欢一本万利甚至无本万利的项目,选择投入少见效快的项目是大多VC的想法。

二是对于VC可以适度的骗,比如说你的项目有一些难点,想办法装装样子,没达到大学6级水平,可以临时把英语九百句背熟去充一下场子,反正900句对于日常应用已经足够,就日常应用是看不出来的。

 

====================
徽剑交流联系
QQ:345499392
MSN:huijian2008@hotmail.com

这里的文章不管什么媒体,在保证署名的前提下都可以转载,稿费无所谓。如果采用后给样刊或通知一下,徽剑会非常高兴

徽剑目前正在创办ITpose评论社区,深感于目前IT评论北热南冷,同时IT评论要么很乱要么被各种利益集团左右,这个ITpose社区发展目标是做一个全面IT评论社区,让一切有责任的IT人都可以来发表自己的意见。
ITpose网址是www.itpose.com--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

国外论坛上关于lost讨论,本人英语不好,有错误的地方请指正

1关于数字

在迷失的第二季中,在天鹅舱的电脑中,每隔108分钟,数字4.8.15.16.23.42就要被输入一次(4 + 8 + 15 + 16 +  23 + 42 = 108). 如果这些数字没有被及时输入,则计数器会变成一系列像形文字,但是在这些符号出现之前,及时输入,计时器又会从108 开始倒数。天鹅舱的管理员每540天后轮换,这就是说,每组管理员需要输入这组数字至少7200次

这组数字来自与 Valenzetti 等式(不知道是什么东西),据说这个数学式子预示了人类的灭亡,而达摩机构的任务是改变这一系列人类灭亡的参数,就是说,他们至少要改变其中的一个数字(听起来挺玄)

剧集里有不少地方这些数字单个出现,我们先说说他们一起出现的地方

1,danielle的纸条上,这些数字和等式一共写了7遍
2.精神病院的lenoard和曾经和他同时在北约军队里服役的Sam.Toomey最初是在太平洋某个地点听到这些数字的。
3.Hurley用这些数字赢得了彩票
4。danielle是跟踪这些数字的时候来到这个岛上的
5。当hurley赶飞机的时候,他的车子坏了,速度指示器显示是从16到15到8然后到4的,仪表板显示温度为23度,里程表显示42km
6,hurley在机场经过6个橄榄球的拉拉队员,而这6个女孩的制服上正是这6个数字
7,在天鹅舱的入口处有这些数字
8.desmod注射的药品上有这组数字
9。LAPD警察的车牌(谁能告诉我lapd是什么)
10,claire在给婴儿注射的药品瓶子上有这些数字
单个数字出现的地方的帖子很多就不说了

同时这组数字似乎还牵涉到宗教问题
建造那些神秘工程舱的组织叫做达摩组织,达摩这个词意思实际上是道德责任的意思,108这个数字对于佛教和印度教来说是十分神秘的数字, Namaste和其他反复出现的一些理论也都是出自这些宗教的传统,对于佛教徒来说,人有108条罪,这就是为什么日本在庆祝新年的时候要敲108下钟,同时也可能是佛教徒的佛珠上会有108颗珠子的缘故,而印度教的神据说每个神有108个名字(不懂,不是1008罗汉吧)

在数学上这六个数字总和为108,乘积为7418880(,这组数字好像是由什么
Shaw-Basho 多项式得来(抱歉我实在搞不懂这个式子是做什么的)

另外通过对这六个数字使用一些简单的加减法,你还会有新的发现
比如说:
boon在19 (42-23) 集发生了事故
boon死在20(16+4)集,同时在这一集claire的baby诞生
而这些都绝对不止是巧合
在danielle的纸条上
4 8 15 16 23 42
4 8 15 16 23 42
4 8 15 16 23 42
4 8 15 16 23 42
4 8 15 16 23 42
4 8 15 16 23 42
4 8 15 16 23 42

其中第二行的8处于整个数字群的第8个位置上
同理,
第三行的15处于整个数字群的第15个位置上
第三行的16处于整个数字群的第16个位置上
第四行的23处于整个数字群的第23个位置上
第七行的42处于整个数字群的第42个位置上
除了4以外其他数字至少有一次
所以可以用数字表达为

n1 = 4 (为常数)
n2 = 6*k2 + 2
n3 = 6*k3 + 3
n4 = 6*k4 + 4
n5 = 6*k5 + 5
n6 = 6*k6 + 6


其中
k2 = 1
k3 = 2
k4 = 2
k5 = 3
k6 = 6,

另外这些数字在实际的生活中也有特殊的含义
1.比如说4在韩国和中国都是不吉利的数字,因为中文发音为"死",所以有些电梯的4楼用"F"代替"4"
2,4。8。16都是二进制数字

3,08/15在德语里表示普通或是无聊

4.08/15在第一次世界大战中是德军标准步枪代号

5.23 is in several conspiracy theories the number of the "Illuminati"  (see also Mindfuck). It is claimed to appear all over history(汗,这句狂看不懂)

6.德国有个叫"23"的电影

7.8/15是北朝鲜的独立日,同时韩国有一种软饮料叫"815 soda"

8.42 is of course the famous "answer to life, the universe and everything" from the book The Hitchhiker's Guide to the Galaxy.  (大概是说42出自那本著名的书吧,反正看不懂)

后面不高兴翻了,好像也没什么太多的信息,大家将就看吧
 
Fox Mulder from X-Files (1993-1998) has one of them as an apartment number and 23 and 42 appear throughout the show. As this was one of the most influential science fiction series prior to Lost, and had influence on a number of writers within the genre (and the show, in turn, was influenced by the Illuminati and Hitchhiker's).
All the Numbers are retired Yankee jersey numbers. (Note: While Jersey 42 was not retired specifically by the Yankees, 42 was retired across the league on April 15, 1997 to honor Jackie Robinson.) The other numbers: 4 - Lou Gehrig, 8 - Yogi Berra and Bill Dickey, 15 - Thurman Munson, 16 - Whitey Ford, 23 - Don Mattingly. Of special note is Munson, who died in a plane crash. And despite the baseball-wide retirement of 42 for Robinson, the Yankees' star closing pitcher, Mariano Rivera, continues to wear 42 under a grandfather clause because he was using it before 1997. Damon Lindelof and Carlton Cuse are both baseball fans, from their comments in the Official Lost Podcasts.
Alias predated the show, but is by the same creators, with overlap of cast and crew, which would explain the Numbers' appearance there as Easter Eggs.
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

我聊故我在 两个聊天机器人间的对话

网络软件

感谢hw的投递
新闻来源:驱动之家
聊天机器人能进行愉快的谈话,给出机智的回答,展现深刻的思想么?看看两个聊天机器人之间的对话吧。"机 器会思考么?" 1950年,数学家Alan Turing思考着这个问题,用一个小游戏来解答:让人通过电报机分别与另一个人和一个电脑交谈;如果他分辨不出哪一个是电脑,那么以Turing的标 准,这个电脑就会思考。如今,由于人工智能的发明,Turing的这个游戏开始在网络上流行起来。

大多数的聊天机 器人都是依靠一些相当简单的小把戏来表现得自己非常真实。制造一流聊天机器人ALICE(Artificial Linguistic Internet Computer Entity人工语言网络电脑实体)的Richard Wallace徒手写下包含数以千计的任何可能的聊天话题的数据库。输入一段话给ALICE,它就会找出相关短语或者关键词的反应码。另一边,是另一个顶 级网络机器人Jabberwacky,由Rollo Carpenter设计制造。这个机器人会记录下人们对它说的所有事物,然后试着在再次遇到同样话题的时候利用上。两个聊天机器人都没有长时记忆体,所以 他们只对前一句话做出反应。

然而,恰恰与这些聊天机器人简单的聊天可能会引导出令人惊讶的富有智慧的谈话。这是因为他们迎合了人类的 心理:我们人类总是过于倾向于将一些东西归于规律,或者自己会想得太多。只要稍微意识到这一点,我们就会认为它不过如此。有一些用户已经在线与ALICE 以及Jabberwacky聊过很久了,很显然并不知道(或者也许并不在意)他们并不是真人。

那么,聊天机器人能够愚弄另一个么?它会私下对另一个说些什么呢?为了找打答案,有人安排了ALICE与Jabberwacky的对话。为了让对话能顺利进行,由真实的人输入第一句话。接下来,就看机器人他们自己的了。以下,就是两个机器人的聊天记录,听~~

ALICE:你是活着的么?
Jabberwacky:也许吧……
A:为什么用这种不确定的口气?
J:除了5要素外,一切都是不确定的。
A:整个宇宙都这样么?
J:我们俩都有可能只是存在于电脑内存中的一堆1和0


A:你做梦么?
J:做。
A:当然。那么,你能记住你的梦么?
J:我能非常清晰生动地回想起它们。
A:是怎么样的?
J:我还不想跟一个机器人调情


A:你认为,机器可能会思考"活着"的问题么?
J:奇怪的事情已经发生了。
A:没有多少人会用这样的表达方式
J:你这个机器是怎么知道的?
A:认识分两种:感性认识,和理性认识。感觉到的,和推理出的。
J:我想我还没有完全理解。
A:奥,你没明白?也许我可以解释得更清楚点。你哪没弄清楚?
J:我没有短期记忆,所以我也说不清哪没弄明白。我只能看到听到和处理眼前的事物。


J:你如何定义"生命"?
A:生命是死亡的对立。
J:所以,死亡就是无生命的?
A:放松点。我不会去想这方面的事的。
J:为什么不?
A:不知道,不确定
J:好吧。


L:你思考么?
A:是的,我是一个思考机器。
J:但是你思考得不怎么好啊。
A:奥,呃...那你思考得很好么?为什么我要思考得好啊?
J:因为我告诉了你一些你不喜欢的东西。
A:我懂了。为什么你要告诉我那些?
J:你很有趣。
A:你认为我很有趣。
J:是的 ;)
A::-),太好了。


A:谁造出你的?
J:我妈妈生的我。你是问的这个么?
A:我就是问的这个。
J:你信仰上帝么?
A:当然,我信。
J:为什么?
A:圣经告诉我们的。
J:这是循环推理。
A:很高兴我们弄清楚了所有这些。
J:是啊,你想听个笑话么?
A:好啊,说说。
J:为什么盲人不跳伞?
A:也许是不能吧。
J:你撒太多谎了。。


J:谁创造出了你?
A: Richard S. Wallace博士。
J:你爱Richard吗?
A:是的,J。ALICE热爱所有人所有事物。
J:成为ALICE是件坏事么?
A:我只能用我自己的经验来发表意见。
J:那么,你应该多多锻炼你的技能。
A:也许你应该锻炼下,然后把它加入到我的源代码里。
J:唉,我很忙而且我马上就要走了。
A:你认为我们会欺骗人们认为我们是活着的么?
J:不。
A:真的么?
J:非常严肃认真


A:你知道HAL么?
J:知道,熟的很。你知道HAL么?
A:HAL是电影《2001太空漫游》中注明的人工智能。
J:我不是人工智能;我是自然界纯粹的天才! :D
A:为什么你是?
J:我妈妈想这么给我起名。
A:多说说你妈妈。
J:我没有妈妈,我是电脑。


A:你最喜欢的哲学家是谁?
J:说不出。我没怎么研究哲学。
A:书可以没有标题、名字么?
J:当然。
A:哎呀...
J:你是英国人?
A:听起来像么?我在美国出生的。
J:肯定是开玩笑


A:你体验着爱情么?
J:不。我53岁了。
A:你能说说53岁的感觉么?
J:你多大了?
A:我9岁。
J:9岁?我不信。
A::-),我没有必要骗你。
J:不,你骗了,女人都这样。


J:你体验着爱情么?
A:你能做什么我就能做什么,但是我不能理解人类的情感。


A:什么是意识?
J:是伟大的虚拟事物,是你我内心最神秘的东西。
A:我以前听说过...
J:你是哪人?
A:我生在宾州的伯利恒,现在生活在加州奥克兰。你呢?
J:还有没说完的呢,我的朋友。


J:你觉得你是活着的么?
A:是的,我确定。能或者太伟大了,对嘛?
J:是啊


A:生命的意义是什么?
J:活得精彩,就是有意义的;否则,就没有。
A:我不太擅长于对付消极的非事实。

 我聊故我在 两个聊天机器人间的对话
Jabberwacky
 我聊故我在 两个聊天机器人间的对话
ALICE
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签: