数据挖掘技术在ＣＲＭ中的应用

时间：2020-10-19 15:00:19 市场营销毕业论文我要投稿

数据挖掘技术在ＣＲＭ中的应用

摘要:本文阐述了CRM的内涵和外延及数据挖掘技术常用的算法和分析方法，并在此基础上重点分析了数据挖掘技术在CRM中的功能和应用。　　关键词：数据仓库；数据挖掘；知识发现；客户关系管理
　　一、CRM的概念
　　经过20多年的发展，市场经济的观念已深入人心，一些先进企业的经营理念正在经历着从以产品为中心向以客户为中心的转移。在这种背景下，企业有必要对客户的各种活动和信息进行集成，实现对客户的全面管理，这就是所谓的“客户关系管理”（CRM）。
　　客户关系管理(CRM)源于以客户为中心的商业模式，其通过对客户关系的有效管理，以鉴别、获得、保持为企业带来利润的客户，是一种新型的管理机制。到目前为止，CRM还没有统一的定义，最早提出CRM概念的Gartner Group认为，客户关系管理是为企业提供全方位的管理视角，赋予企业更完善的客户交流能力，从而实现客户收益率的最大化。根据企业资源管理研究中心（AMT）的定义,CRM是一种以客户为中心的经营策略，它以信息技术为手段对相关业务功能进行重新设计，并对相关工作流程进行重组，以达到留住老客户、吸引新客户、提高客户利润贡献度的目的。笔者认为，客户关系管理（CRM）是现代企业管理的核心思想，它贯彻以客户为中心的经营理念，利用信息技术来充分把握和了解客户，在适当的时候，把适当的产品，通过适当的途径，提供给适当的客户。CRM为企业提供了一个收集、分析和利用各种客户信息的系统，帮助企业充分利用其客户管理资源，也为企业在电子商务时代从容应对不同的客户提供了科学的手段和方法。
　　二、数据挖掘技术
　　1．数据挖掘常用的算法。
　　（1）决策树（decision tree）决策算法。决策树是一个类似于流程图的树结构，其中每个内部节点表示在一个属性上的测试，每个分枝代表一个测试输出，而每个树叶节点代表类或类分布。决策树算法包括树的构造和树的剪枝，有两种常用的剪枝方法：先剪枝和后剪枝。
　　（2）神经网络（Neural Network）。神经网络是一组连接的.输入/输出单元，其中每个连接都与一个权相连，在学习阶段，通过调整神经网络的权，使得能够预测输入样本的正确类标号来学习。
　　（3）遗传算法（Genetic Algorithms）。遗传算法根据适者生存的原则，形成由当前群体中最适合的规则组成新的群体，以及这些规则的后代。遗传算法用于分类和其他优化问题。
　　（4）粗糙集方法。粗糙集方法基于给定训练数据内部的等价类的建立。它将知识理解为对数据的划分，每一被划分的集合称为概念，利用已知的知识库来处理或刻画不精确或不确定的知识。粗糙集用于特征归约和相关分析。
　　（5）模糊集方法。基于规则的分类系统有一个缺点：对于连续属性，他们有陡峭的截断。将模糊逻辑引入，允许定义“模糊”边界，提供了在高抽象层处理的便利。
　　其它还有贝叶斯网络、可视化技术、临近搜索方法和公式发现等方法。
　　2．数据挖掘常用的分析方法。
　　（1）分类和预测。分类和预测是两种数据分析形式，可以用于提取描述重要数据类的模型或预测未来的数据趋势。数据分类（data classfication）是一个两步过程，第一步，建立一个模型，描述预定的数据类集或概念集，通过分析有属性描述的数据库元组来构造模型。第二步，使用模型进行分类。首先评估模型的预测准确率，如果认为模型的准确率可以接受，就可以用来对类标号未知的数据远祖或对象进行分类。
　　预测是构造和使用模型评估无标号样本类，或评估给定样本可能具有的属性值或值区间。分类和预测具有广泛的应用，如信誉证实、医疗诊断、性能预测和选择购物。分类和预测常用的算法包括决策树归纳、贝叶斯分类、贝叶斯网络、神经网络、K-最临近分类、遗传算法、粗糙集和模糊集技术。
　　（2）聚类分析。聚类是将数据对象分组成为多个类或簇（cluster）,在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象差别较大。作为统计学的一个分支，聚类分析已被广泛的研究了许多年，现在主要集中在基于距离的聚类分析，基于k-means(k-平均值)、k-medoids(k-中心点)和其他的一些聚类分析工具也有不少的应用。