SPSS 10 月份电子期刊
2006年10月 | |
| |
SPSS 15.0 for Windows英文版现已上市 SPSS 15.0 for Windows英文版现已上市!通过SPSS 15.0 用户可以提高数据资料管理能力,报告能力,可扩展的编程能力以及强大的新统计程序。此外,企业用户通过在其组织中更有成效的和更为连贯的运用数据获得新的机会。 Pep Boys运用SPSS为客户提供更好的产品和服务 | |
SPSS数据挖掘工具--Clementine 产品简介 Clementine作为业内领先的数据挖掘平台,允许企业利用业务专业技能快速开发预测模型,并迅速部署提升决策水平。Clementine能够帮助企业达成以下目标: • 提升客户获取能力和维持能力 • 提升单位客户的收益和利润 • 最小化成本 • 用更少资源抵制违法 Clementine支持完整的数据挖掘流程,降低了对时间和资源的需求。同时,Clementine是完全按照数据挖掘的行业标准---CRISP-DM而设计。CRISP-DM使得数据挖掘成为了业务流程的一部分,用以解决企业中的实际问题。 Clementine产品线包括以下列出的产品组件: • Clementine Client and Clementine Server – 客户端是功能完整的产品,安装并运行在用户的桌面机上。客户端产品既能够作为独立的产品在本地运行,也能与Clementine Server一起以分布式方式运行,从而提高大数据集的执行效率。 服务器版本能够与一个或多个客户端以分布式方式安装,它在大数据集时提供了更高的性能,因为服务器方式下有大内存选项,无须将数据下载到客户端上。这里要注意的是,使用服务器版本必须至少有一个客户端。 • Clementine Batch – 批处理模式允许用户执行一些比较耗时,或者优先级较低的作业,绕过用户交互界面,无须用户的干预。Clementine Server产品带有一份Batch, 如果客户需要其他的Batch,也可以单独安装。Clementine Batch提供完整的分析功能,且没有常见的用户交互界面。 • Clementine Solution Publisher – Clementine Solution Publisher是一个扩展的组件,允许用户将Clementine流文件发布到Clementine环境以外。发布的流文件能在Clementine Solution Publisher Runtime环境下运行,该环境可根据用户需求进行部署。 • Clementine Desktop – 该桌面端产品是功能有所限制的客户端产品,不包括的功能有:SQL回馈,服务器访问,批处理模式,Solution Publisher,PMML 模型导出,Cleo 或其他SPSS部署向导,以及Text Mining for Clementine和Web Mining for Clementine。 • Text Mining for Clementine - Text Mining for Clementine是扩展的产品,提供从非结构化信息中提取结构化数据用于分析。此模块需要单独的许可证,允许用户基于上下文从文本中快速获取关键信息。将这些信息再与已有的结构化数据结合,比如人口统计信息等,帮助用户的决策更加准确。 • Web Mining for Clementine – Web Mining for Clementine是扩展的组件,利用NetGenesis Web分析技术,将原始Web数据转化成Web节点以利于分析。 • Cleo – Cleo提供交互式Web部署。Clementine建立预测模型后,通过点击Cleo部署向导创建瘦客户端的Web应用,从而在Web上使用预测模型。 • Clementine Application Template – 针对不同行业、不同应用的模板,通过此模板用户可以迅速开发自己的数据挖掘应用,目前包括Web CAT,Telco CAT,CRM CAT,Microarray CAT四套。 企业应该具有怎么样的数据挖掘系统 数据挖掘作为利用企业大量数据发现规律规则并在企业经营活动中应用从而产生商业价值的一个商业应用过程,是由多方面的要素构成的。
2、硬件资源。企业需要配备满足数据挖掘系统的必备的计算机和相关存储设备的硬件。
数据挖掘的商业应用最终是为了能够给企业带来商业价值和利润。所以,一个成功的数据挖掘项目的结果应该是:
| |
如何选择数据挖掘工具 数据挖掘可以帮你做更好的决策,增加收入,提高效率。虽然数据挖掘的承诺非常诱人,但是数据挖掘并不是一个自动的财富生成器,在数据挖掘的过程中存在着各种各样的问题和陷阱,而选择什么样的数据挖掘工具来进行数据挖掘就是其中最关键的一个环节。 CRISP-DM (Cross-Industry Standard Process for Data Mining) 是在各企业中被广泛采用的数据挖掘的标准流程。按照CRISP-DM的标准,数据挖掘包含6个步骤,他们是:商业理解、数据理解、数据准备、模型建立、结 果评估和应用部署。这一流程过程将以数据为中心,整个过程从商业问题开始,归于商业问题的解决。并且该标准流程把数据挖掘理解为需要不断循环调整的环状结 构,在企业进行数据挖掘的过程中,通常需要在几个过程之间往返进行,最终才能拿出优秀的数据挖掘结果,这也更加符合数据挖掘在企业中使用的实际情况。 第一阶段:商业理解 本阶段的任务主要是从业务角度来理解数据挖掘项目的目标和要求,然后将此转化为数据挖掘问题,并制定一个可行的数据挖掘计划。选择数据挖掘工具时,需要考虑以下两个问题:
在解决我们行业内的商业问题时,该工具(单独或与我们的应用程序一起)是否有用?是否有该领域的成功案例? 使用该工具中,各操作步骤是否可以被清晰地映射到数据挖掘的商业需求上?该工具是否向商业用户清晰地表述了数据挖掘概念?该工具如何与项目管理或其它计划工具所整合?是否需要编写额外地应用程序来实现数据挖掘技术与商业理解之间的沟通? 数据理解阶段包括收集数据和对数据进行探索性分析两个部分。在该阶段中,可以获取不同类型的数据和可视化技术是要着重考虑的。
该工具是否可与现存的数据库兼容?该工具是否支持通用的数据接口标准?是否要求数据转换成另一种格式才能使用(如果需要,我们需要什么样的投资)? 数据挖掘工具是否提供了可视化技术,以便于发现数据中存在的模式?图形是否可以与用户交互,例如随着数据维度的改变,图形是否可以发生改变或者生成新的图形? 数据准备阶段的任务包括了从最初获取的数据一直到构建生成可用于分析的最终数据。此阶段要着重考虑数据准备工作的高效性和易用性。
该工具在数据准备的所有工作(包括为建模所作的准备或为提高数据挖掘效率所作的准备)是否是交互性的?该工具在进行数据准备工具时,是否以一种易于跟踪的方式? 在提取数据时,是自动完成的,还是需要手工写SQL查询语句,进行数据的合并、汇总、排序和其它数据准备工作? 在该阶段,需要选择和应用各种建模技术,设置模型参数。用户往往需要返回到数据准备阶段以使数据适应不同模型的不同要求。由于同一数据挖掘问题可以应用不通模型,故要考虑数据挖掘工具在应用和比较不同分析技术的能力。
该工具是否使分析师能快速生成有效模型?用户比较不同模型以找出最佳解决方案时,该软件的易用性有多好?为适应不同模型要求而进行数据准备工作时,该软件的易用性有多好? 该工具是否提供了神经网络、关联算法、聚类分析、分类分析、回归分析、图形化的展现等数据挖掘技术? 不同技术是否可易于组合而生成更佳结果?模型结果是否可整合入数据集以便后续分析? 该数据挖掘工具是否能与现有的算法工具兼容使用?该数据挖掘工具是否可与其它数据分析工具兼容使用? 评估阶段要对模型进行多方面的评估。主要目的是确定重要的商业因素是否被充分考虑?下面列出了有关的重点:商业用户的输入如何被整合跑过模型,结果又如何被传给受众。
该工具产生的解决方案,是否对所有数据挖掘问题的解决方案都是有效的,还是只对某个数据挖掘问题的解决方案是有用的?结果是否准确地反映了所有的商业问题,是否在检验数据集上进行验证结果也足够好? 产生的结果是否易为商业用户所理解?如果不能,需要采取什么步骤以使结果便于读懂?该工具是否要求商业专家参与整个数据挖掘过程? 数据挖掘过程可能很简单,如只是对商业问题给出一个建议,也可能很复杂,如应用一个应用程序向信息客户提供新知识。无论简单还是复杂,在结果发布阶段,都要用到该过程。结果发布经常要求扩展性的服务,所以下面的问题主要是基于数据挖掘工具在此任务上的帮助能力。
数据挖掘解决方案如何才能被整合到操作性的应用程序中?整合的投资回报率是否高?是否需要在时间和财力上对结果发布做额外的投资?解决方案的更新是否容易?如果不容易,需要做些什么工作,投入多少财力和时间? 额外考虑之一:关于成本
考虑产品寿命、所提供服务等,将成本量化。将预期的回报也量化。什么时候才会得到一个预期的ROI,此结果是否满足商业目标。 要花多长时间来实施数据挖掘项目?是否需要其它工具或硬件?需要多少培训、咨询、定制开发以得到项目结果? 用户(现在和未来)能力是否能达到所用工具的要求? 该工具要求用户具备哪些能力?该工具是定位于技术专家、数据挖掘初学者、还是各种水平的用户?使每个人可使用该软件所需培训成本是多少?不要忘记考虑未来潜在用户的技能。 该工具是否可为不同用户进行定制?一般过程是否可被保存以便再运用?该工具是否可使任务自动执行?是否可得到自定义界面或提供其它帮助的服务? 最后,要考虑数据挖掘工具厂商的实力。从许多方面,购买一个数据挖掘解决方案是对未来的一个投资,在前进的路上有一个可靠的合作伙伴将是有益的。
厂商是否提供其它数据挖掘或数据分析工具?厂商是否提供咨询、培训、技术支持和其它服务?这些服务是否是全球领域的? |
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008
标签: 统计数据挖掘
0 条评论:
发表评论
订阅 博文评论 [Atom]
<< 主页
============================================================
格兰仕微波炉报价单 英语六级历年真题听力下载 大陆身份证生成器
東方神起的所有反轉劇!!.[含东方剧场](會繼續更新以後的)(已可覲看)
电视剧《靠近你温暖我》全集下载(BT/迅雷/电驴/剧照)
精彩的洞庭湖人鼠大战(4视频+forcode点评)
一百多个电影字幕下载网站,精心收集整理!
(视频)(CCTV10“走进科学”-科幻之旅专题-克隆人 8.14)
国外BT站点和BT种子搜索站(国外完整bt搜索列表)
============================================================
forcode科幻小说《抽水马桶的秘密》正在起点中文网连载
《抽水马桶的秘密》读者评论:
(1)你的书很好看,比大刘,王晋康的创意好太多了,努力吧将来出实体书我一定会买的。(2)很有想象力的作者啊!!估计是看了不少科幻小说的人,希望不要浪费你非凡的想象力。 (3) 读者在自己博客或论坛对《抽水马桶的秘密》的评论。(4)点击此处查看全部的读者评论(18页,1000条以上)。
《抽水马桶的秘密》相关帖子:
《远程面包机》提纲|| 《进化论危机》提纲大家一起来设计
抽水马桶是外星人的试管|| 读者推荐超一万票
《抽水马桶的秘密》内容简介:
地球哺乳界正在发生的一次大规模跨物种升级,DNA机制并非人们所想像的那样是决定生命的最终遗传载体,而是类似浏览器这样的转译机制,真正的遗传物质存储在弥漫整个宇宙的光子数据库中,DNA机制实际上是一种设定了进化路径的文明压缩包的解压机制,数十亿年前灭绝的三栖人发明了光子数据库和DNA机制,目的是为了让这个机制最终复活三栖人文明,而人类(裸猿)这一物种在三栖人社会里其实是一种宠物,但是DNA机制似乎出现了点问题,或者说不知道什么原因裸猿突然变得太过聪明了,在播撒了始祖菌(DNA种子)的所有星球,进化路径发展到裸猿阶段,并没有继续演化出最后一步:三栖人,而强大的光子数据库一旦意识到DNA进化机制的这个漏洞,立刻关闭了这些星球对光子数据库的访问权限,这样,这些星球的生态系统都面临着灭绝的危险,因为他们脱离了光子数据库的遗传支持再也无法自然繁殖,只能靠遗传工程来复制现有的基因,或者做些小打小闹的修改,整个宇宙各星球上的基于DNA机制的生态系统都面临崩溃的危险。最终在13世纪,裸猿一族在银河边缘一个不起眼的小星系发现了地球这个由于某种原因至今还刚进化到裸猿初级阶段的星球,为了催熟地球的进化速度,外星裸猿文明开始介入地球的发展,为了防止光子数据库察觉到非地球文明的介入并关闭地球的权限,这种介入始终是暗中进行,因为介入方式的分歧,银河系裸猿文明分裂为两大集团,这两大集团的争斗伴随着人类近现代的发展,于是,文艺复兴开始了、三次科技革命出现了、两次世界大战也来了,直到今天,地球人类为自己的技术进步而沾沾自喜,丝毫不知道技术迅速发展的真正原因以及潜藏的危机。
============================================================
forcode2003年以前的习作:未来的婚姻、远程面包机
forcode朗诵《蜀道难》||forcode的一百多个科幻构思
奇想录:最新奇有趣的新技术和新闻点评|| 订阅“奇想录”