数据挖掘之clementine(spss)
总体看法:c1ementine是spss的数据挖掘应用工具。这种工具可把直观的用户图形界面与多种分析技术相结合。这些技术包括神经元网络、关联规则和规则归纳技术。这些分析能力由一个易于使用的可视化编程环境所提供。
c1ementinee所使用的图形表现是在屏幕上拖动、按下和连接功能节点。节点的类型分为数据访问节点、数据操纵节点、数据可视化节点、机器学习节点和模型分析节点。模型产生过程由从托盘中选择正确的节点、把它们放到屏幕上和连接节点组成。
c1ementinee提供了丰富的数据访问能力,其中包括对展开文件和关系数据库(通过odbc)的访问。c1ementine具有通过把建模结果写回一个与odbc兼容的dbms而使它们保持一致的能力。输入数据操纵包括合并匹配字段和派生新字段的能力。
c1ementine的数据可视化能力包括分布图、线性图和网络分析。
c1ementine可在运行w1ndowsnt的intel penhum系统、运行hpuxl0及以上的hp900系列、运行irix的silicon graphics、运行solaris 2.x的sunsparc和运行digihlunix 3.x或vms6.x的d1gihlalpm上使用。
数据访问、操纵和预处理:c1emen6ne能导入分隔的文本文件、用逗号分隔值的文件和定长记录的文件(asc11)。别的数据源可通过支持的odbc接口使用。主要的关系数据库系统包括oracle、sybase、infomix和ca—ingres都可通过odbc访问。
c1ementlne的数据操纵能力包括以下这些方面:
●通过记录顺序对记录进行合并。
●用户定义的集合。
●过滤无关系的记录。
●使用用户定义的准则和逻辑符号派生新字段。
●数据取样的能力;包括最初和最后的n个记录、从n个记录中取一个样本和随机取样。数据挖掘技术、算法和应用程序:c1咖6n6ne支持规则归纳算法、神经元网络(包括
kohonen网络)和关联规则:
●c1emen加e规则归纳算法很容易理解:一旦被训练过了,算法就创建一棵决策树代表规则。随后将要进行的频繁处理就是定位在树的最项层的重要变量并用这些变量训练个神经元网络。
●c1ementine的神经元网络提供一系列不同的拓扑结构和训练方法。在进行性能评估时,—7个默认的单隐藏层网络能与一个更加复杂的双隐藏层网络相比较。
●c1ementine提供了kohonen神经元网络以解决聚类问题。
●关联规则就像名字所暗示的用于把一系列属性与一个特定的结论相关联。任何属性之间都有关联,这一点被证明对像市场售货篮分析这样的应用非常有用。
c1ementine支持顾客剖析、时序分析、市场售货篮分析和欺诈行为侦测。使用工具:通过连接结点的表示形式,模型在一个可视化编程环境中被确定。建模结点的对话框提供对算法和训练方法的某些控制。 ·
c1ementlne允许用户知道哪些输入对系统的预测是重要的,虽然神经元网络本身难以被理解。决策树算法支持一种交互的、易于使用的规则浏览器。
c1ementlne提供了对模型进行评估的一系列功能,其中包括一个分析结点用来报告对系统输入进行正确诊断的数量;取值范围从0到1的置信度;以及提供给用户跨表字段选择能力的矩阵模式。
c1emen6ne能以c代码的形式导出决策树、神经元网络和k0honen网络。在c1emelitine中,当一个模型被构造后,它能以c代码的形式 被导出,并在外部环境被展开。例如,如果一个神经元网络模型必须被导出,c1eme06ne将导出三个文件:一个头文件、一个函数文件和一个网络定义文 件。由规则归纳算法所产生的规则也能被导出。
c1ementine的可视化编程环境适合于初学者。建模的顺序被清晰地表达了出来,并且各种各样的选项增强了灵活性。一个想要操纵c1eme咖算法的有经验的用户就没有那么自由了。然而,在神经元网络中仍然有一些选项来调整学习率和控制决策树算法中的修剪。
clementine不提供事务模板。在写此书时,元数据接口还不可用。
结论: c1emetine是一个强大的产品。以公布的用户基推测试来看,它在可伸缩性、预测准确率和处理的时间方面都表现得很好。总的来说,c1gnebtine对小规模和大规模的分析实现都很合适。--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008
标签: 统计数据挖掘
0 条评论:
发表评论
订阅 博文评论 [Atom]
<< 主页
============================================================
格兰仕微波炉报价单 英语六级历年真题听力下载 大陆身份证生成器
東方神起的所有反轉劇!!.[含东方剧场](會繼續更新以後的)(已可覲看)
电视剧《靠近你温暖我》全集下载(BT/迅雷/电驴/剧照)
精彩的洞庭湖人鼠大战(4视频+forcode点评)
一百多个电影字幕下载网站,精心收集整理!
(视频)(CCTV10“走进科学”-科幻之旅专题-克隆人 8.14)
国外BT站点和BT种子搜索站(国外完整bt搜索列表)
============================================================
forcode科幻小说《抽水马桶的秘密》正在起点中文网连载
《抽水马桶的秘密》读者评论:
(1)你的书很好看,比大刘,王晋康的创意好太多了,努力吧将来出实体书我一定会买的。(2)很有想象力的作者啊!!估计是看了不少科幻小说的人,希望不要浪费你非凡的想象力。 (3) 读者在自己博客或论坛对《抽水马桶的秘密》的评论。(4)点击此处查看全部的读者评论(18页,1000条以上)。
《抽水马桶的秘密》相关帖子:
《远程面包机》提纲|| 《进化论危机》提纲大家一起来设计
抽水马桶是外星人的试管|| 读者推荐超一万票
《抽水马桶的秘密》内容简介:
地球哺乳界正在发生的一次大规模跨物种升级,DNA机制并非人们所想像的那样是决定生命的最终遗传载体,而是类似浏览器这样的转译机制,真正的遗传物质存储在弥漫整个宇宙的光子数据库中,DNA机制实际上是一种设定了进化路径的文明压缩包的解压机制,数十亿年前灭绝的三栖人发明了光子数据库和DNA机制,目的是为了让这个机制最终复活三栖人文明,而人类(裸猿)这一物种在三栖人社会里其实是一种宠物,但是DNA机制似乎出现了点问题,或者说不知道什么原因裸猿突然变得太过聪明了,在播撒了始祖菌(DNA种子)的所有星球,进化路径发展到裸猿阶段,并没有继续演化出最后一步:三栖人,而强大的光子数据库一旦意识到DNA进化机制的这个漏洞,立刻关闭了这些星球对光子数据库的访问权限,这样,这些星球的生态系统都面临着灭绝的危险,因为他们脱离了光子数据库的遗传支持再也无法自然繁殖,只能靠遗传工程来复制现有的基因,或者做些小打小闹的修改,整个宇宙各星球上的基于DNA机制的生态系统都面临崩溃的危险。最终在13世纪,裸猿一族在银河边缘一个不起眼的小星系发现了地球这个由于某种原因至今还刚进化到裸猿初级阶段的星球,为了催熟地球的进化速度,外星裸猿文明开始介入地球的发展,为了防止光子数据库察觉到非地球文明的介入并关闭地球的权限,这种介入始终是暗中进行,因为介入方式的分歧,银河系裸猿文明分裂为两大集团,这两大集团的争斗伴随着人类近现代的发展,于是,文艺复兴开始了、三次科技革命出现了、两次世界大战也来了,直到今天,地球人类为自己的技术进步而沾沾自喜,丝毫不知道技术迅速发展的真正原因以及潜藏的危机。
============================================================
forcode2003年以前的习作:未来的婚姻、远程面包机
forcode朗诵《蜀道难》||forcode的一百多个科幻构思
奇想录:最新奇有趣的新技术和新闻点评|| 订阅“奇想录”