论文导读::数据挖掘技术简介。传统的烟草消费者细分方法及其局限。传统的烟草消费者细分。在制定烟草控制措施时。
论文关键词:数据挖掘技术,烟草消费者,细分,营销措施,烟草控制
1 引言
中国是世界最大的烟草生产国和卷烟消费市场, 1996 年调查,全国 15 岁以上人群总吸烟率为37.6%( 男66.9%, 女4.2%),预计烟民3.2亿[1]。近几年我国烟草行业的发展更加迅速,卷烟生产企业众多、产品多样化,以及中国加入WTO之后,烟草产业国内市场国际化的压力增大,使得烟草行业面临更加激烈的市场竞争。要应对市场的挑战,必须及时分析卷烟市场信息,制订有效的营销策略。同时随着我国加入《世界卫生组织烟草控制框架公约》[2],在制定烟草控制措施时,必须考虑到不同消费者群体的需求特点,采取有针对性地税收等措施,以便在减少烟草消费的同时,同时提高政府税收。
数据挖掘是一个利用各种分析方法和分析工具在大型数据库或数据仓库中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。通过数据挖掘可以对大量、庞杂的信息进行快速有效的分析,为烟草企业制定适宜的营销计划,提高竞争力和烟草控制者制定政策提供依据。
2 数据挖掘技术简介
数据挖掘(Data Mining,简称DM)是从大型数据库或数据仓库中发现并提取隐藏在其中的有用信息的一种新技术,是数据库研究中的一个很有应用价值的领域。它可以从大量的数据中抽取出潜在的、有价值的知识、模型或规则营销措施,有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果。[3,4,5,6]
2.1数据挖掘的过程。数据挖掘包括四个阶段:(1)数据准备阶段:分析问题,选择相关的数据,再对数据进行净化,消除噪声数据、无关数据和冗余数据,完成数据的转化。经过处理过的数据存储在数据仓库中。(2)挖掘阶段:该阶段是数据挖掘的核心步骤,根据数据挖掘的目标,应用相应的数据挖掘算法,分析数据并通过可视化工具表述所获得的模式或规则。(3)结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。(4)知识运用:将分析所得到的知识集成到业务信息系统的组织结构中去。
2.2数据挖掘的方法。主要有:(1)概念/类描述论文网站。概念描述以简洁汇总的形式描述给定的任务相关数据集,提供数据价值的一般特性,一般应用于CRM中的描述式数据挖掘。概念或类描述由特征比和比较或区分组成,有两种一般方法:基于数据立方体OLAP的方法和面向属性归纳的方法。(2)关联分析。关联分析发现关联规则,广泛用于购物蓝、商务管理和决策分析,是商业分析中应用最为广泛的一种数据挖掘方法和模式。(3)分类和预测分析。分类和预测是CRM中数据分析的两种重要形式,可以用于提取描述重要数据类的模型或预测未来的数据趋势。主要方法包括:决策树/判定树、贝叶斯法、BP神经网络算法、遗传算法、粗糙集、模糊集等。(4)聚类分析。属于无指导学习。对象根据最大化类内的相似性、最小化类内的相似性的原则进行聚类或分组。聚类分析在CRM中有广泛的应用,它可以用作独立的数据挖掘工具来获得对数据分布的了解,也可以作为其他数据挖掘算法的预处理步骤。主要方法包括:划分方法、层次方法、基于密度的方法、基于网格的方法、基于模型的方法等。(5)孤立点分析。对于欺诈探测、定制市场及其它CRM任务是非常有用的。基于计算机的孤立点挖掘方法包括统计学方法、基于距离的方法和基于偏差的方法。(6)演变分析。用于CRM中的趋势分析、相似性搜索、与时间有关的序列模式挖掘和周期模式挖掘。(7)复杂类型的数据挖掘。是数据挖掘技术的当前一个重要的研究领域,极大提升了CRM数据分析能力的深度和广度,主要包括:多媒体数据挖掘、文本挖掘和Web挖掘等。
3 传统的烟草消费者细分方法及其局限
3.1 传统的烟草消费者细分。传统的烟草消费者细分主要采用地理、人口和行为因素的相对稳定标准。
3.1.1 地理因素即按消费者所处的地理位置、自然环境来细分
(1)按省区细分。
(2)按消费水平细分。城市、郊区及乡村的情况不同,城镇居民卷烟消费档次与农村居民比显著高许多。
(3)按城市规模细分。在分析全国分省区城镇卷烟消费特征的同时,开展36家重点城市的卷烟消费特征研究。
3.1.2 人口因素指各种人口统计因素
(1)按年龄细分。消费者的欲望和能力,会因年龄不同而发生变化。青年消费者与老年消费者在卷烟需求方面,就有不少的差异。
(2)按户主从业类型细分。职业会影响其消费模式,不同从业类型对卷烟产品会产生不同偏好,从业类型对卷烟消费的影响是明显的。
(3)按收入细分论文网站。卷烟消费者通常依据收入条件做出消费和购买决定,企业可以进一步依据人均收入的不同档次细分市场。消费者的经济状况既与个人能力有关,也与整个经济形势有关。通常收入高的消费者吸食高档烟,收入低的消费者吸食低档烟。
(4)按教育程度细分。受教育程度不同的卷烟消费者在价值观念、生活情趣、审美观念和消费方式等方面会有很大的差异。
3.1.3 行为因素即按照消费者的购买行为细分市场
(1)消费量细分。依据卷烟产品购买、使用或消费的数量因素,可将卷烟消费者分为少量消费者、中量消费者及大量消费者,分别研究其构成特征。大量消费者虽然在消费总人数中所占比重较小,但购买、消费卷烟产品的比重却很大,并往往具有某种共同的特征。
(2)消费价值量细分。固定卷烟消费者对卷烟产品的消费价值量也很悬殊。
3.2 传统的烟草消费者细分的局限
传统的对消费者进行的细分方法一般是基于经验的分类方法或基于统计的简单划分方法。最初的消费者细分是由经验描述法开始的,这种方法一般由决策者根据以往的经验对消费者进行类别划分,因此具有较强的主观性;基于传统统计方法的消费者细分一般是根据对消费者属性特征的简单统计来划分消费者类别。虽然这些划分对企业的消费者管理也是很有意义的,但却无法满足诸如对消费者消费偏好、消费者消费替代倾向等更高等复杂分析需求。随着管理信息系统的广泛应用和电子商务的深入发展,企业将积累越来越多的消费者数据,面对海量的消费者数据,传统的消费者细分方法更将显得力不从心[3,6]。
4 数据挖掘在烟草消费者细分中的应用
4.1 基于数据挖掘的烟草消费者细分框架
消费者细分的主要任务就是确定这些概念与消费者间的对应关系。消费者数据中包含若干离散消费者属性与连续消费者属性,以每一消费者属性作为一个维度,每个消费者作为空间的一点,则企业消费者数据库中的所有消费者可以构成一个多维空间,称该空间为消费者的属性空间。
消费者属性与概念的映射关系既可以通过解析的方法建立营销措施,也可以通过样本学习的方法建立。解析方法主要是以传统的经验法和统计方法为基础,分析没一种概念类所应具有的属性特征,从而建立起属性空间与概念空间的映射。然而许多的概念类与消费者属性间没有明显的解析对应关系,这时就需要通过样本学习的方法建立映射关系。样本学习的方法主要是通过对数据库中已知概念类消费者数据进行数据挖掘,自动归纳出消费者属性空间与概念空间的映射,这个数据挖掘过程有称为样本学习。
设B═{G1,G2,…,Gn},由B可以确定一组概念类L═{L1,L2,…,Lp}, ,C’是概念类已知的消费者集合。消费者细分包括三个步骤:
1)确定一个映射p: C→L,使,若c∈Li ,则p(c)= Li ;
2),通过求p(c)确定所属的概念类。
3)进行功能分析。
本文提出了如图所示的基于数据挖掘的消费者细分过程模型
图1:基于数据挖掘的消费者细分模型
(资料来源,稍有改动: Chen, Yun., Zhang, guozheng., ets., CustomerSegmentation in Customer Relationship Management Based on Data Mining[C], 2006,in International Federation For Information Processing(IFIP), Volume 207. KnowledgeEnterprise: Intelligent Strategies in Product Design, Manufacturing, andManagement,eds. K. Wang, kovas G.., (Boston: Springer).pp.288-293 )
该模型中的消费者细分过程主要包括学习和应用三个主要步骤:
(1) 分类模型的学习
运用相应得算法,找出描述并区分数据类或概念类的分类模型或分类函数。得到的分类模型可以用多种形式表示,如关联规则、神经网络、决策树等。在分类模型的建立过程中需要使用类标号已知的消费者数据。这个数据集的数据源是消费者关系管理系统中的数据或数据仓库,一般可由数据源导入或使用聚类、手工标类等方法在数据源的基础上建立。
(2)分类规则的应用
使用消费者分类模型和分类函数营销措施,对待分类消费者进行分类。在分类模型训练后,得到规则或网络等分类模型,利用该模型对未知分类号的消费者进行分类。
1/2 1 2 下一页 尾页 |