计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

探讨关联规则挖掘在汽车营销决策中的应用

2013-07-29 01:02
导读:市场营销论文毕业论文,探讨关联规则挖掘在汽车营销决策中的应用样式参考,免费教你怎么写,格式要求,科教论文网提供大量范文样本:   摘要:通过对汽车销售历史数据进行概化和总结,给出关联

  摘要:通过对汽车销售历史数据进行概化和总结,给出关联规则挖掘算法,并针对具体的事例加以分析,进行各个客户购买属性之间的关联规则的挖掘。可以有效地发掘顾客购买行为和汽车属性之间蕴藏的内在联系。此模型可以用于辅助汽车营销决策。
  关 键 词:交通流分析;关联规则;数据挖掘
  1  引言
  随着中国经济持续快速的发展,人民生活水平的不断提高,中国的家庭用车,特别是轿车的市场越来越大,2001 年1 11 月,轿车销量增长为22. 90 %[1 ] ,2002 年1 10 月份,轿车产量达到了8618 万辆,比去年同期增长48163 %[1 ] ,中国现在的汽车人均拥有量远远低于其他国家,所以市场的发展有很大的空间。在加入WTO 之后,中国的轿车市场是各大汽车公司争夺的焦点,越来越多的国外汽车制造企业(大众、通用、福特、丰田、现代等) 进驻中国,再加上本土的一些汽车企业以及合资的汽车企业,轿车市场上呈现出百花争鸣的现象,中国的轿车销售竞争越演越烈,各大厂商都准备在中国扩大自己的市场份额。轿车的品种繁多,而且各个客户需求往往都不一样,受到地区、文化等影响比较大,所以,对于各个轿车制造企业来说,如何在最短的时间内取得客户需求的信息,也就是如何最快的满足汽车用户的个性化需求,如何最快的响应客户信息,如何准确的预测市场走向,将成为轿车制造企业的生存发展的关键之一。
  2  汽车营销分析的关联规则算法
  关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度[2 ] 。
  设R = { I1 , I2 , I3 , I n} 是一组条件的集合,W 是一组事务集。在W 里每个事务T 都是由一组项目构成,T < R 。假设有一个项目集合A ,一个事物T ,如果A < T ,则称事务T 支持项目集合A。设W 中支持项目集A的事物中,有c %事务同时也支持项目集B ,则关联规则A →B 的可信度为c % , c % = P ( B | A ) 。设W 中有s %的事务同时支持项目集A 和B ,s %称为关联规则A →B 的支持度, s % = P ( A ∩B ) 。设W 中有e %的事务同时支持项目集B ,e %称为关联规则A →B 的期望可信度, e % = P( B) 。可信度与期望可信度的比值称为作用度L ,L = P( B| A ) / P( B) 。可信度是对关联规则准确度的衡量,支持度是对关联规则使用范围的衡量,它表明了这条规则在所有事务出现的概率。这4 种度量中,最常用的是可信度和支持度。

(科教范文网 lw.AsEac.com编辑整理)


  在汽车营销分析中,可用R = { I1 , I2 , I3 , I n} 来表示各种购买属性的项目集合,事物T 可以用来表示购买同一品牌的客户的各个属性之间的联系。
  关联规则的挖掘问题就是在事务数据库中找出等于用户给定的最小支持度(min- sup) 和最小可信度(min -conf) 的规则。此问题可以分解为2 个步骤:
  (1) 找出事务数据库中所有频繁集A ,即项目集A 的支持度c % Emin - sup ;(2) 对于每个频繁集A ,如果B < A , B ≠< ,并且A →B 的支持度s % E min - conf 。针对第一步,可以参考Apriori 算法[2 ] 。算法流程图如图1 所示。 输入:
  m- sup (表示最小支持度) ,数据库中的事务集输出:
  频繁集R 以及它们的支持度Xki表示Ck 集合里面的每一个子项,包括支持度。
  L k 集合存放的是Ck 集合中所有满足支持度大于m- sup 的全体项集和支持度图1  寻找频繁集的算法流程图3  关联规则具体实例在客户信息数据库中,有客户的客户类型、年龄、收入水平、文化水平、家庭住址区等,要研究这些客户属性和客户购买的车型之间的关系,需要对客户信息进行抽象概化。
  在销售系统中,购买每个轿车品牌的顾客,都有不同的属性(如文化水平、收入水平、职业、所在地区、年龄等) ,再加上每个轿车品牌自己的属性(如品牌、动力性能、舒适性、外观等) ,这样在销售系统中构成了庞大的离散的数据。我们需要全面分析这些顾客属性和轿车品牌属性之间的联系,例如文化水平为大学,爱好古典音乐的客户,倾向于购买哪种品牌的轿车 考虑的因素主要是哪些 就要应用关联规则进行挖掘,首先要对轿车销售的数Z3} ,分别表示低档轿车(价位20 万以下) 、中档轿车(价位20~40 万) 、高档轿车(价位40 万以上) 。客户类型项目集表示为: P{ P1 , P2 , P3} ,分别表示个人、企业、政府行政部门。文化水平项目集表示为: M{ M1 , M2 , M3 , M4} ,分别表示大学以下、大学、硕士、硕士以上。家庭住址区项目集表示为: (转载自中国科教评价网http://www.nseac.com
  A { A 1 , A 2 , A 3 , A 4 , A 5 , A 6 , A 7 , } ,分别表示海淀、宣武、朝阳、丰台、昌平、崇文、西城。
  根据表1 ,可以得出客户信息数据概化。
  3. 2  关联规则算法的应用 和关联规则算法,可以进行客户的各种属性和购买车型之间的联系分析
  得出频繁集根据关联规则的概念和客户属性数据概化的结果,各个客户属性(包括客户类型、文化水平、收入水平) 的项目集合为R = {Z1 ,Z2 ,Z3 , P1 , P2 , P3 ,B1 ,B2 ,B3 , T1 , T2 , T3 ,M1 ,M2 ,M3 ,M4 ,A1 ,A2 ,A3 ,A4 ,A5 ,A6 ,A7}
  假设,要研究购买车型为低档轿车的客户的文化水平、收入水平以及年龄之间的联系,并且关联规则的支持度必须> 30 % ,可信度要≥90 %。
  从表中抽出事务集WW = { ( T2 ,M2 ,B2) , ( T2 ,M1 ,B2) , ( T1 ,M2 ,B3) ,( T2 ,M1 ,B1) , ( T2 ,M1 ,B2) , ( T1 ,M1 ,B1) }
  (1) 首先寻找频繁集的算法,得出支持度> 30 %的所有频繁集如图2 所示。
  (2) 找出可信度≥90 %的关联规则根据可信度的定义Confidence (A →B) = P( B | A ) ,得出可信度计算结果。
  根据表3 得出满足支持度和可信度的规则有5 条,分别是M1 →T2 , T2 →B2 , B2 →T2 , B1 →M1 , ( B2 , M1) →T2联系各个规则所代表的意义,可以得出以下详细规则:
  (1) 购买20 万以下价位车的客户当中,文化水平为本科的客户年龄一般是30~50 岁。
  (2) 购买20 万以下价位车的客户当中,一般是收入水平为3000~5000 ,年龄为30~50 岁的客户。
  (3) 购买20 万以下价位车的客户当中,收入水平为3000~5000 的客户,文化水平为本科。
  (4) 购买20 万以下价位车的客户当中,收入水平为3000~5000 并且文化水平为本科的客户,年龄为30~50岁。
  得出这些规则之后,可以进一步研究这些规则产生的内在原因。
  同样,如果要分析购买高价位轿车的客户的各个属性相互之间有什么关联规则。只要从事务集中找出和Z3相关的事务,并进行分析,根据上述的运算规则,就可以得出客户属性之间的各个关联规则。
上一篇:浅析小案例在《市场营销学》教学中的运用 下一篇:没有了