1039
浏览关键词: 客户价值;聚类分析;健身休闲行业;客户分类;RFM模型
摘要: 本研究改进了原始RFM模型,构建了新的客户价值识别模型RFMD,用于对健身休闲行业客户进行分类,并根据所提出的模型识别出该行业的不同价值客户群体。研究使用了上海一家民营体育场馆的真实数据,在RFM模型中新增客户平均消费持续时长指标D,并采用两步聚类与K-means聚类相结合的两阶段聚类算法对客户进行聚类。研究结果表明,基于RFMD模型可将健身休闲行业客户分为“重要价值客户”、“一般价值客户”和“低价值客户”。
1. 引言
在人工智能热潮席卷全球之时,越来越多的研究利用机器学习算法从海量数据中探寻隐藏的价值信息,实现客户类型识别,预测客户的行为,以及发现未来的规律信息,为企业针对不同类型客户采取针对性保留措施提供指导,推动企业客户关系管理战略的实施,减少企业在吸引新客户和维系老客户方面的成本。
在国家经济的发展下,人们生活水平不断提高,对美好生活的需要日益增长。人们的消费观念也逐渐发生了转变,消费需求也愈加旺盛。随着健康消费理念的深入人心,越来越多的消费群体在闲暇时间走进体育健身、休闲娱乐场所,健身休闲成为个人消费的新热点,成为潮流趋势。2016年10月,国务院办公厅印发《关于加快发展健身休闲产业的指导意见》,提出大力支持健身休闲产业发展,积极推动“互联网 + 健身休闲”、“大数据 + 健身休闲”的发展,产业总规模在2025年将达到3万亿元。在国家的大力助推下,功能逐渐完善、门类逐渐齐全的健身休闲场所也越来越多,健身休闲企业间的竞争也逐渐加剧,如何实现现有客户的分类管理和保留,为客户提供更具针对性的服务,提高他们对企业的满意度和忠诚度也是当前健身休闲企业应该面临的问题。
本文基于上海L体育场馆的客户消费数据,探究健身休闲行业客户分类问题。根据行业客户消费特点改进原始客户价值识别模型RFM模型,形成具有行业客户消费特点的RFMD模型,并基于改进模型采用聚类分析方法对所有客户群体进行价值划分。通过将所有客户划分成了多个更小的、有意义的、相对同质化的客户群体,识别出该行业的重要价值客户,有利于企业了解不同价值客户的消费偏好,为企业实现更精准的客户分类提供指导,使企业能更好地响应客户需求,提高竞争力。
2. 文献综述
市场细分的概念最早由Smith于1956年提出,他认为整个市场可以看作是一组内部具有同质性的异质细分市场 [1]。自被提出以来,市场细分得到了许多学术研究的进一步支持,被认为是学术界和实践中日益重要且被广泛接受的概念之一。
细分对于了解相应市场的特征、预测客户行为、发现和探索新的市场机会以及识别值得追求的群体具有显著贡献 [2] [3]。客户行为细分基于预测理论,根据客户过去和当下的消费行为对客户未来行为进行预测,是一种基于行为模式数据和信息技术的细分方法 [4]。
RFM模型最初由Hughes (1996)提出,它根据数据库中过去的客户行为活动来分析和预测客户的行为 [5]。它由三个度量组成,即近度R (Recency)、频度F (Frequency)和值度M (Monetary),R指自上次购买以来的时间间隔(如天或月),F衡量在特定时期内的购买次数,M代表在特定时期内的购买总金额。随着以客户为导向的细分方法的出现,RFM模型在分析和预测客户行为,进而进行客户细分方面的应用越来越广泛。
RFM模型在过去的二十几年中得到了发展,一些研究尝试通过考虑额外的变量或根据产品或服务的性质排除一些变量来开发新的RFM模型,验证它们是否比传统的RFM模型表现更好。很多学者在考虑到原始模型指标的不足以及不同行业客户行为特点时,通过移除或替换部分指标对RFM模型进行了扩展,使之在特定行业的客户行为分析上具有更强的适用性。如郭崇慧等(2015) [6] 认为R指标在汽车维修客户细分中的作用不大,因此移除R,并新增客户保留时长Y和客户汽车行驶里程数K两个指标,构建了新的YKFM模型。张斌等(2017) [7] 根据铁路货运客户行为的特点,以近期发货行为能力K替代R,以货运收入贡献率A替代M,并加入了发货倾向预测值A,使改进模型更适用于铁路货运客户的细分。任春华等(2019) [8] 基于F和M存在共线性的问题,以平均购买金额A替代M,并新增平均购买时间T,发展了LRFAT模型。
近年来,不同类型的RFM模型在美发、汽车、旅游、铁路货运等各种行业的客户细分中得到应用并表现良好,这些关于不同领域的大量研究已经表明了学术界对这个主题的持久兴趣,以及RFM模型在理解客户消费行为和细分客户方面的效率。
聚类是实现根据客户的需求和偏好的相似性对他们进行分组的常用工具,客户聚类,又称客户细分,是现代营销和客户关系管理成功的关键因素之一 [9]。聚类分析是市场细分分析中最常用的技术,它根据客户之间的相似性或差异性对客户进行分组。基于RFM模型细分基础和聚类技术的客户细分方法已在不同行业的客户划分中得到了应用(见表1)。如基于RFM模型,Wei等(2013) [10] 结合SOM与K-means聚类研究了美发客户的类别,而Zhou等(2020) [11] 对K-means算法进行了改进,并将其应用于中国移动电信网络客户的分类问题研究。基于LRFM模型,Li等(2011) [12] 运用层次聚类与K-means聚类对纺织品购买客户进行分类研究,;Wei等(2012) [13] 运用SOM聚类实现了牙科诊所客户的分类管理。K-means聚类算法在商业银行基金 [14]、铁路货运 [7] 等行业的客户细分中也得到了应用。
表1. 基于RFM模型和聚类技术的客户细分应用
RFM模型特征被有效地用于理解和分析客户行为特征,但它忽略了提供客户消费意愿的客户的消费持续时间,而在一些行业中,客户的消费持续时长对企业评估客户价值、开展营销活动所要参考的关键信息。此外,在经典的RFM中,定义的近度变量R只考虑客户的最近一次交易,但在很多情况下,由于客户的行为呈现出时间变化,近度可能不能正确地反映客户的重复消费或访问倾向。除此之外,尽管在不同的应用领域中存在着一些关于如何细分客户以改善客户关系和营销策略的研究,但在健身休闲行业中,如民营体育场馆、KTV等,关于客户细分的研究却很少。
3. 基于客户价值的健身休闲行业客户分类模型设计
3.1. 改进RFM模型评价指标
经典的RFM模型中的R (近度)特征仅是基于客户的最后一次交易计算最后一次交易时间距离观察时间的长度,在健身休闲行业中由于具有会员制度,客户可能会为了消耗账户内的少量余额而进行最后一次消费,若其计划消耗完余额后没有再次消费计划,近因R无法反映其重访倾向。因此,为了能够更准确地揭示客户的重访行为,本文对RFM模型中的近因变量R进行修改,考虑客户的最后N次消费,将R修改为最近N次消费与观察期截止日期的平均时间间隔。本文将新提出的RFMD模型:客户消费新鲜度(R)、客户消费频度(F)、客户消费金额(M)和客户消费持续时长(D)的定义如下:
Recency (R):客户消费近度,本文将R指标修改为客户的n次最近消费与观察期的最后日期之间的平均间隔天数。因此,在RFMD模型中,近度R计算公式如下:
其中, date_diff(tenddate,tm−i+1) 表示客户距离观察期结束日期 tenddate 的最近消费日期与 tenddate 之间的间隔天数, 为最后一次消费时间, m 为总消费次数,n为考虑的距离观察期结束日期的最近消费次数。值得注意的是,在式子(1)中,当考虑最近消费次数为1次,即 n=1 时,R即为原RFM模型中的最近一次消费与观察期结束日期的时间间隔,因此,本文改进的R指标也包含了原模型的R指标。平均时间间隔越短,R值越小,表明客户的消费就越近,因此该客再次重访或消费的可能性就越高。
Frequency (F):客户消费频度,指客户在观察期内到健身休闲场所消费的总次数,如一季度10次,一个月5次或一周3次等。F指标值部分反映了客户的健身习惯与需求,客户的重复消费行为是客户忠诚的基本行为表现 [13]。频度越高,F值越大,客户忠诚度越高。
Monetary (M):客户消费总金额,指在观察期内客户的总消费金额,反映了客户对企业收入的贡献。一般地,客户的消费金额越高,M值越大,客户对企业的价值贡献越大,客户越重要。
Duration (D):指客户在观察期内每次消费平均持续时间(以分钟为单位),该指标与观察期内频度F和每次消费持续时间有关。对于按时间向客户收取费用的服务,客户消费平均持续时间越长,D值越大,客户的贡献度越大,客户对该服务的需求和黏性越大。D计算公式如下:
4.1. 数据准备
这项研究调查的L体育场馆是一家全国著名的连锁体育场馆品牌,本文所使用的原始数据集是从该公司的系统中提取的上海场馆的相关数据,它包含了2020年9月1日至2020年11月30日期间52,122名客户的近38万条消费记录。在此期间,有几个客户只去过一两次场馆运动,因为改进RFM模型RFMD的改进指标R对于去场馆进行运动消费不到3次的客户来说被认为是无用的,所以本文排除了去过场馆消费不到3次的客户,最后得到50,672名客户有效数据。
由于数据是从企业交易系统中导出的原始数据,可能某些交易记录数据存在缺失、异常等情况,脏乱数据的直接使用会导致模型效果出现偏差,因此需要对原始数据集进行预处理,包括缺失值和异常值的检验和处理、数据类型的转换、数据归一化等操作。
对预处理后的数据进行初步探索性分析,以了解和掌握数据的概况,分析变量之间的关系提供参考,也有利于后续进行客户分类结果分析。基于客户消费的开始时间对场馆一天内某小时的消费情况进行考察,分时段统计落在各时段内的消费记录数,按星期日期统计一周内每天的消费情况,结果如图1所示。图1显示,客户去场馆运动的时间集中于晚上20~23点和夜间0~5点。客户的高消费日分布于周六和周日,周一到周五每天的消费记录数差异不大。企业可以根据客户的消费时间分布规律开展相关活动,如娱乐篮球赛、小组pk赛等,以吸引到更多客户参与,使活动效果达到最大化,同时提升客户的体验和兴趣。
图1. 消费频次按时段(左)和星期日期(右)分箱统计分布图
该企业客户所持有卡的类型有散客卡、会员卡、白领卡、散客包场卡、A类卡和B类卡6种,分别统计持有不同类型卡客户的消费频次和累计交易额、累计持续时长数据,结果如图2所示。图2(左)显示,在统计周期内,会员卡客户的消费次数远大于其他类型卡客户,散客卡的消费次数次之,A类卡和B类卡客户很少到场馆进行消费。图2(右)中,与消费次数相一致,会员卡客户的累计交易额和持续时长均居第一,白领卡客户具有消费次数少、持续时长短,但交易额高的特点;散客卡的客户虽然运动累计持续时长比较长,但交易金额却比较少;A类卡和B类卡客户的累计交易额和持续时长均很少。由此可见,不同卡类型客户的消费频次与交易额和持续时长无明显必然联系,某类型卡的客户消费次数很多,但不代表其能产生较大的交易额。
图2. 不同卡类型消费频次(左)及交易额和持续时长(右)分布统计图
4.2. 健身休闲场所客户分类模型验证与结果分析
4.2.1. 改进RFM模型指标数据获取
作为客户分类的第一步,为每个客户计算RFMD模型的特征。根据3.1节中改进后的RFMD模型各指标的含义和计算方式,从原始数据集中提取各指标数值。本文以样本数据获取的截止日期2020年11月30日作为考察时间距离的结束日期,各指标具体计算方式为:
R为最近3次消费时间距2020年11月30日的平均间隔天数,单位:天;
F为客户在2020年9月~11月时间段内的累计消费次数,单位:次;
M为客户在2020年9月~11月时间段内的累计消费金额(交易额),单位:元;
D为客户平均每次消费持续的时长,与客户的累计消费持续时长和消费次数F有关,D = 客户的累计消费持续时长/消费次数F,体现了客户消费的规律性,单位:分钟。
提取五个指标后,需要分析每个指标的数据分布,数据范围如表3所示。
表4. RFMD模型指标数据示例
本研究的数据来源于真实企业的日常交易记录,数据真实可靠,因此本文在计算RFMD模型指标数据时直接使用实际客户数据,不对各指标做权重的区分,并假设所有模型变量的权重相等(即同等重要)。
4.2.2. 基于聚类分析的客户分类结果
1) 聚类结果分析
本文利用构建的两步聚类算法对标准化后的RFMD模型指标数据进行聚类分析,首先在SPSS Modeler中执行“二阶聚类”(两步聚类)的第一步,由于RFMD各指标均为连续变量,距离测量选择“欧式(N)”,获得最佳聚类数目k = 2,此时凝聚和分离的轮廓测量(轮廓指数)值接近1,聚类质量为较好,代表聚类模型效果较好。当k = 3时,凝聚和分离的轮廓测量值也大于0.8。同时利用The Elbow Method手肘法得出结果如图3所示,拐点在2和3的位置最明显。因此,结合企业的实际客户价值情况和现实意义,本文最终确定k = 3,即将客户划分为3个类别,分别用标签1、2、3表示。
表5. ANOVA表
表5中方差分析显示,显著性都为0.000,都小于显著性水平,即p < α = 0.05,说明每一个变量在最后得到的3个类别间都存在显著差异。最终聚类类别和客户数量如表6所示,有效客户总数为50,672,A类卡、B类卡、白领卡、会员卡、散客包场卡、散客卡的客户总数分别为151、57、476、38,213、494、11,281,3个类别的客户总数量分别为38,962、10,307、1403,分别对应标签1、2、3。其中在3个类别客户中人数最多的都是会员卡客户,各约占该类别客户总数的73%、85%和68%;其次都是散客卡客户数,各约占该类别客户总数的25%、12%和27%;其余卡类型客户数在各类别客户总数的合计占比分别约为2%、3%和5%。
图4. 客户特征分析
2) 客户价值分析
根据聚类中心进行特征分析如图4 (雷达图)所示,由于在聚类时将R转化为了1/R,因此1/R越大(即R越小)越好,则客户群1的1/R属性最小(R最大),客户群3的1/R、F、M属性最大,D属性较小;客户群2具有最大的D属性。根据体育运动企业的具体业务分析,通过比较集群间各指标的大小,评价一个集群的特征。例如,客户群3具有最大的1/R (最小的R)、F、M属性和最小的D属性,可以说R、F、M是客户群3中的优势特征。在客户群2中,D和F属性重要程度更高,在客户群1中主要是D属性,其他三个属性都很小。
表7展示了每个类别客户的RFMD属性的平均值和RFMD分数,以总结各集群客户的RFMD特征。在形成最后一列RFMD分数时,本文参考了Ha和Park (1998)的方法。在该方法中,如果聚类的平均R、F、M或D值大于所有客户的该指标数据的总平均值,则该指标以向上箭头符号(↑)表示,否则以向下箭头符号(↑)表示。
表7. 基于RFMD的两阶段聚类结果
根据上述特征分析的图表显示,每个客户群都有显著不同的表现特征。为了解释基于RFM模型的客户细分结果,Marcus (1998)提出了基于频率(F)和货币(M)变量的客户价值矩阵,形成了最佳客户(F↑M↑)、挥霍客户(F↓M↑)、不确定客户(F↓M↓)和频繁客户(F↑M↓)四大客户类型。通过将消费持续时长(D)纳入RFM模型,并以前述研究为基础,本文将确定的客户集群定义为三个级别的客户类别:低价值客户、一般价值客户、重要价值客户,如表8所示。
表8. 各客户集群名称和概述
根据RFMD分数,集群2和3的R值均低于平均值,表明两个集群中的客户都与企业有着密切的关系,这些集群中的客户也可以被视为亲近客户,并且,两个集群客户的F和M值都高于平均值,运动较为频繁,对企业收入的贡献度较大。然而,这两个群体的平均消费持续时长(D)不同,集群2客户的D值高于平均值,集群3客户的D值小于平均值。此外,尽管集群3是所有集群中最小的,客户数仅为2.8%,但该组中的客户在所选时间跨度内的总消费额(M)占比最大,即不到3%的客户数却贡献了企业约25%的收入。因此,集群3可以被定义为“重要价值客户”,集群2以20.3%的客户数贡献了企业36%的收入,定义为“一般价值客户”。在集群1中,消费近度R大于平均值,并且F、M、D值均小于平均值,说明这些客户最近没有去且平时也不怎么经常去该企业的场所运动消费,而且该集群客户的每次运动时间也比较短,单个个体对企业的贡献度不大,约77%的客户数仅给企业带来40%的收入,因此,将这个集群客户划分为“低价值客户”。
对于具有不同价值的客户类型,在提供同等资源的条件下他们对企业的收入贡献是不同的。重要价值客户数量虽少,但他们对企业的收益起着不可或缺的重要作用,值得企业在投入资源时给予更多关注和资源倾斜,并注重积极维护好与这些客户的关系。一般价值客户数量不大,对企业的收入贡献有限,但通过有效的经营方法和营销策略,可以进一步挖掘他们的价值将其转为重要价值且更忠诚的客户。低价值客户数量占比很大但对企业的收入贡献却不足,这些客户跟企业关系没那么紧密,运动消费也比较零散,没有特定的规律可循,若企业对其投入的资源过多,客户却给不到应有的利益回报,那只会增加企业自身的运营成本。低价值客户较高的近度和如此低的频率和运动时间也许是这些客户可能离开公司的信号,这表明该集群中的客户比较容易成为流失客户。但该集群客户占了该企业客户数的绝大部分,到底是哪些具体的客户会流失,需要进行更准确的识别。
由此可知,客户的合理化分类并在客户管理中实施差异化策略,是企业维系好客户关系,在同类市场中增强自身竞争力的关键。并且,对具有不同价值的客户,尤其是可能具有流失信号的客户进行流失情况的探索,并将流失可能性大的客户转化为忠诚的高贡献度客户,对于一家企业提高盈利能力也是至关重要的。
5. 总结与展望
本文围绕健身休闲行业客户分类问题进行研究,通过文献分析方法来梳理国内外研究现状并从中发现考虑客户的消费时间问题的客户价值分析相关研究较少,尤其是在健身休闲行业客户分类的研究相对空白。针对现研究的不足,本文提出考虑客户消费持续时间价值的客户价值识别模型RFMD,并将两步聚类和K-means聚类算法相结合,对健身休闲行业客户进行分类,帮助企业识别价值客户,为企业进行差异化精准营销创造前提条件。研究结果发现重要价值客户数量虽很少但贡献了企业较多的利润,而低价值客户数量占比非常高但消费额占比却未能与客户数量级别相匹配,能为企业创造的利润少之又少。为了实现资源的合理配置,企业应该优先考虑重要价值客户的管理与运营。
结合本文研究,对健身休闲行业相关企业的客户管理工作提出了以下建议:
1) 激发和增强客户的自主消费意愿,使客户延长消费时间。客户在馆内消费时间越长,其产生的消费额越大,对于那些几乎每次消费时间不超过半小时或者在半小时左右的客户,企业可采取调研、访谈等形式获取和分析其消费时间较短的原因,并根据原因采取针对性改进措施。
2) 通过分析客户特征,探索群体特点,对客户进行更准确的细分。对客户细分群体采取个性化、创新式的运营及管理,能够让客户产生被重视的感觉,从而提高客户的满意度,激发客户的购物潜能,进而提高企业的收益。
由于数据收集和研究者能力的局限性,研究中仍有一些不足之处,如由于数据收集上的不足,未能获取客户的基础信息,如客户性别、年龄、职业等,在客户分类后未能结合客户的统计学信息进行进一步分析客户群体的特征,未来可以考虑在可以获取完整客户数据的情况下在客户分类后从多维度对不同价值客户进行特征分析。
参考文献
[1] Smith, W.R. (1956) Product Differentiation and Market Segmentation as Alternative Marketing Strategies. Journal of Marketing, 21, 3-8.
https://doi.org/10.1177/002224295602100102
[2] Huerta-Muoz, D.L., Ríos-Mercado, R.Z. and Ruiz, R. (2017) An Iterated Greedy Heuristic for a Market Segmentation Problem with Multiple Attributes. Euro-pean Journal of Operational Research, 261, 75-87.
https://doi.org/10.1016/j.ejor.2017.02.013
[3] Liu, J., Liao, X., Huang, W. and Liao, X. (2019) Market Segmen-tation: A Multiple Criteria Approach Combining Preference Analysis and Segmentation Decision. Omega, 83, 1-13.
https://doi.org/10.1016/j.omega.2018.01.008
[4] 刘英姿, 吴昊. 客户细分方法研究综述[J]. 管理工程学报, 2006, 20(1): 53-57.
[5] Hughes, A.M. (1996) Boosting Response with RFM. Marketing Tools, 5, 4-10.
[6] 郭崇慧, 赵作为. 基于客户行为的4S店客户细分及其变化挖掘[J]. 管理工程学报, 2015, 29(4): 18-26.
[7] 张斌, 彭其渊. 基于KFAV的中国铁路货运客户细分方法研究[J]. 交通运输系统工程与信息, 2017, 17(3): 235-242.
[8] 任春华, 孙林夫, 吴奇石. 基于LRFAT模型和改进K-means的汽车忠诚客户细分方法[J]. 计算机集成制造系统, 2019, 25(12): 3267-3278.
[9] Chen, X., Fang, Y., Yang, M., et al. (2018) PurTreeClust: A Clustering Algorithm for Cus-tomer Segmentation from Massive Customer Transaction Data. IEEE Transactions on Knowledge & Data Engineering, 30, 559-572.
https://doi.org/10.1109/TKDE.2017.2763620