数据仓库技术在CRM中的应用研究(2)
2015-06-25 01:06
导读:三、CRM系统中的数据仓库设计 1. 数据仓库设计的一般步骤。由于数据仓库系统的原始需求不明确, 且不断变化与增加, 同时数据仓库是在现有数据库系统基
三、CRM系统中的数据仓库设计
1. 数据仓库设计的一般步骤。由于数据仓库系统的原始需求不明确, 且不断变化与增加, 同时数据仓库是在现有数据库系统基础上进行开发, 着眼于有效地抽取、综合、集成和挖掘己有数据库的数据库资源, 因此, 采用以数据驱动的原型法来进行数据仓库的开发。一般可以分为以下几个步骤( 如图1) : ( 1) 概念模型设计; ( 2) 技术准备工作;( 3) 逻辑模型设计; ( 4) 物理模型设计; ( 5) 数据仓库生成;( 6) 数据仓库运行与维护。
2. CRM数据仓库设计。
( 1) 概念模型设计。数据仓库概念模型设计首先应该通过对原有数据库系统的设计文档以及在数据字典中的数据库关系模式, 获得对原有数据库系统的一个完整而深刻的理解。①界定系统的边界。在设计CRM数据仓库的起始阶段, 作为设计人员, 首先应该了解下面的一些需求( a) 决策类型: 是统计分析、关联分析、还是回归预测等( b) 决策者感兴趣的是什么问题; ( c) 这些问题需要什么信息来回答; ( d) 要得到这些信息需要包含原有数据库系统的哪些部分的数据。从建立CRM数据仓库的初衷看来, 决策者要进行的CRM分析主要有: 客户特征分析、客户行为分析、客户信任程度分析、交易分析。要进行以上的分析,所需数据应包括: 客户固定信息、产品销售信息、客户接触信息( 客户服务信息) 。于是我们可以将系统的边界定为包含客服子系统、产品销售子系统的集合。②确定主要的主题域。根据以上的系统边界划分的基础上, 确定CRM数据仓库的三个基本主题: 客户、产品、客服。
( 2) 技术准备工作。这一阶段的工作包括: 技术评估,技术环境准备。工作成果是技术评估报告、软硬件配置方案、系统总体设计方案。
(转载自http://www.NSEAC.com中国科教评价网)
( 3) 逻辑模型设计。逻辑模型设计是指: 在数据仓库中如何将一个主题描述出来。它是对概念模型设计的细化。一般来说, 数据仓库都是在现有的关系型数据库基础上发展来的。所以数据仓库中的数据仍然是以数据表格的形式进行组织的。逻辑模型就是要把不同主题和维的信息映射到数据仓库的具体的表中。
逻辑模型设计包括如下内容: 分析主题域, 确定当前要装载的主题; 确定粒度层次划分; 确定数据分割策略; 关系模式定义; 记录系统定义。
逻辑模型设计的成果是, 对每个当前要装载的主题的
逻辑实现进行定义, 并将相关内容记录在数据仓库的元数据中, 包括: 适当的粒度划分; 合理的数据分割策略; 适当的表划分; 定义合适的数据来源等。
( 4) 物理模型设计。数据仓库的物理模型就是逻辑模型在数据仓库中的实现模式。为了确定数据仓库的物理模型, 设计人员必须做这样几个方面的工作: ①确定数据的存储结构。一个数据库管理系统往往都提供多种存储结构供设计人员选用, 不同的存储结构有不同的实现方式, 各有各的适用范围和优缺点。由于目前数据仓库是以传统的数据库技术作为存储数据和管理资源的基本手段, 每个主题在数据仓库中都是由一组关系表实现的, 因此确定数据的存储结构主要是确定面向主题的数据表和对表的分割、适当引入冗余、细分数据等。②确定数据存放位置。同一个主题的数据并不要求存放在相同的介质上。在物理设计时, 常常要按数据的重要程度、使用频率以及对响应时间的要求进行分类, 并将不同类的数据分别存储在不同的存储设备中。重要程度高、经常存取并对响应时间要求高的数据就存放在高速存储设备上, 如硬盘; 存取频率低或对存取响应时间要求低的数据则可以放在低速存储设备上。③确定存储分配。确定存储分配主要是对数据库管理系统提供的一些存储分配的参数进行处理, 如块的尺寸、缓冲区的大小和个数等, 一般要在对服务器和系统软件进行实际调试后确定出来。
( 5) 数据仓库生成。这一阶段的工作是接口编程, 数据装入。工作成果是数据己经装入到数据仓库中, 可以建立数据仓库的应用。