本文摘要:摘要:基于AARRR模型定义了移动游戏中用户获
摘要:基于AARRR模型定义了移动游戏中用户获取、用户活跃与留存、用户付费等数据指标。在此基础上运用K-Means聚类算法建立了移动游戏的用户画像。对移动游戏《精灵传奇》的数据进行了分析。结果表明,运用KMeans聚类算法能在不依赖人口统计信息的前提下得到有效的聚类结果。
关键词:聚类分析;数据指标;数字营销;移动游戏
近年来,移动游戏产业的发展非常迅速,由中国音数协游戏工委(GPC)与中国游戏产业研究院发布的《2020年中国游戏产业报告》可知:2020年中国移动游戏市场实际销售收入达到2096.76亿元,同比增长32.61%;中国游戏用户规模总量达到6.65亿,同比增长3.7%[1]。游戏公司之间的竞争日趋激烈。为了提高移动游戏的运营效率,分析移动游戏数据、获取有价值的结果至关重要。
游戏论文范例:中国电子游戏产业发展研究综述
刘异[2]基于传统通信领域的研究成果,结合移动游戏行业的特点,设计了移动游戏运营的数据指标。崔家阳[3]利用数据标签分类法对保险领域的用户数据进行了处理,得到用户画像。吴瑞溢[4]基于RFM模型分析了大学生的行为画像,分析了用户的消费频率和消费金额。刘异设计的移动游戏数据指标没有涵盖运营的全部环节,定义的数据指标还存在不规范问题。崔家阳给出的标签分析法过度依赖与人口统计信息相关的数据,移动游戏运营商无法获取足够的数据,以至于研究人员无法得出准确的分析结果。
吴瑞溢给出的基于RFM模型的方法不能很好地与移动游戏用户的行为数据结合。为了解决上述问题,笔者在考虑完整的移动游戏运营周期的同时,以AARRR模型为基础定义了用户获取、用户活跃与留存、用户付费等数据指标,运用K-Means聚类算法建立了移动游戏的用户画像,并对移动游戏《精灵传奇》的数据进行了分析。结果表明:运用KMeans算法能在不依赖人口统计信息的前提下得到有效的聚类结果,区分度也比较高;K-Means算法能用于研究移动游戏用户的多种行为模式,展现很高的灵活性。
1移动游戏数据指标定义
1.1AARRR模型
AARRR模型是由McClure[5]首先提出的,AARRR模型中的5个字母分别表示Acquisition(用户获取)、Activation(用户激活)、Retention(用户留存)、Revenue(获得收入)和Referral(推荐传播),分别对应用户生命周期中的5个环节。后来,AARRR模型常用于分析电信运营商的用户获取和用户留存等指标。
1.2移动游戏数据指标定义
用户获取(acquisition)和用户激活(activation)用于描述通过数字营销、口碑传播和渠道导入等手段获取新用户的过程,其中新用户指的是未曾在服务器注册的账户。服务器通常按照唯一设备ID或者唯一数字ID判定用户是否为新用户。数字营销的商业模式是多种多样的,因此用户获取和用户激活的收费方式也是不一样的。常用的计价方式有如下几种:
一是按照销售额(CPS,costpersale)计费的方式,其中销售额是指在特定合同和结算周期内产生的有效收入;二是按照点击量(CPC,costperclick)进行计费的方式,该计费方式是广告 被点击次数乘以不同时段的单价;三是按照广告投放时段(CPD,costperday)进行计费的方式,该计费方式通常是移动游戏运营商按买断广告时段进行收费的;四是按照用户行为(CPA,costperaction)进行计费的方式,这里所说的用户行为包括下载、激活和注册等,移动游戏运营商根据服务器后台数据进行核算,最终提供结果给广告平台。下面定义新增用户和活跃用户的数据指标。
我们把新增用户分为日新增(DNU,dailynewusers)和月新增(MNU,monthlynewusers),把活跃用户分为日活跃(DAU,dailyactiveusers)和月活跃(MAU,monthlyactiveusers)。这些数据指标可通过结构化查询语言(SQL,structuredquerylanguage)来定义,即selecta.day1asDate,count(distincta.role_id)asDNUselecta.month1asDate,count(distincta.role_id)asMNUselectdt,count(distinctid)asDAUfromtable1groupbydtselectdt,count(distinctid)asMAUfromtable2groupbydt在新增用户和活跃用户数据指标基础上,可定义用户留存的相关指标。
用户留存(Retention)反映的是用户在首次注册或者激活之后一段时间是否再次登录。如果按照时间段统计,用户留存可以划分为日留存(DRR,dailyretentionrate)、周留存(WRR,weeklyretentionrate)和月留存(MRR,monthlyretentionrate),留存的界定标准为注册之后至少有过一次登陆行为。也可以按照具体业务需求自定义留存率,比如,把注册一周内有3天登陆行为的用户统计为周留存用户。
定义用户留存的相关指标后,可以研究用户的商业价值。为了从多角度研究付费行为,设定以下数据指标:收入(Revenue)、付费率(PUR,payuserrate)、平均每个用户的付费(ARPU,averagerevenueperuser)、平均每个付费用户的付费(ARPPU,averagerevenueperpayinguser)、生命周期价值(LTV,lifetimevalue)和投资回报率(ROI,returnoninvestment)。
在以上语句中,DPU为日付费用户数(按照ID作去重处理),Revenue为特定统计周期内移动游戏产生的总收入,R(t)为留存函数,ARPU(t)为平均用户付费函数,NetRevenue为渠道分成后实际的净收益。定义了移动游戏运营数据指标以后,以此为基础处理移动游戏客户端收集到的原始数据,建立用户画像。
2用户画像的建立
2.1基于数据标签分类法的用户画像
为了建立移动游戏的用户画像,常用数据标签分类法对游戏数据进行标签分类和频数统计。近年来,由于移动游戏隐私政策的逐渐完善,获取用户的职业、年龄、性别和教育背景等数据变得越来越困难。因此,在使用标签分类法对用户进行分类时,会遇到数据不完整的情况,只能凭借单一维度的数据进行处理。现在以游戏《精灵传奇》从2016年5月—6月的运营数据为例,利用标签分类法建立付费用户画像。先按照单日付费总额划分3个付费区间,分别为小额付费区间[1,10)、中等付费区间[10,198)、高额付费区间[198,19440),再统计5月22日—6月1日各付费区间的付费用户占比。
2.2运用K-Means聚类算法建立用户画像
以某一角色扮演(RPG)游戏为例,运用K-Means聚类算法建立游戏用户画像,涉及的问题包括以下几个方面:有哪些特征的用户更愿支付高额费用,有哪些特征的用户更愿组队完成游戏任务,有哪些特征的用户更愿同其他用户建立友谊并发展线下关系,有哪些特征的用户更愿体验游戏内的多人竞技。为了解决以上的问题,笔者将使用K-Means聚类算法进行分析。利用K-Means聚类算法将数据划分到不同的类,通过数据处理发现用户的行为[6]。K-Means聚类算法可以有效降低数据的复杂度,在建立用户画像时具有很大的优势。
2.3实验结果分析
现在利用K-Means聚类算法分析2016年5月—6月间移动游戏《精灵传奇》的运营数据。先从运营数据库中提取包括账号(ID)、登陆天数(DL)、平均用户付费(ARPU)、收入(Revenue)、渠道、付费率(PUR)和日均时长等维度的数据,再将以上数据导入SPSS软件进行K-Means聚类分析,将聚类参数K设定为3,迭代次数N设定为10。
2.4传统方法与K-Means聚类算法的对比
利用传统方法划分付费区间具有强的主观性,人为设定的差异导致了分类结果的差异,数据分类结果的区分度也比较低;利用K-Means聚类算法划分付费区间具有强的客观性,得到的聚类效果非常好,不同画像的聚类距离较远,区分度较高,相同画像的聚类距离较近。传统方法无法关联用户在游戏内的行为数据,RFM模型只能统计付费频率和付费金额,而K-Means聚类算法能关联不同付费金额用户的其他行为数据(如登录天数、日均时长等)。运营商可根据自己的需求提取用户等级、虚拟物品的使用量等数据,以此分析数据维度之间的相关性。
3结束语
在本文中,笔者基于AARRR模型定义了移动游戏运营数据指标,通过K-Means聚类算法建立了用户画像,并通过实验证明了该算法的有效性。在下一步的研究中,将使用区块链、机器学习和神经网络等方法来建立用户画像。
参考文献:
[1]中国音数协游戏工委,中国游戏产业研究院.2020年中国游戏产业报告[R/OL].(2020-12-17)[2021-08-29].
[2]刘异.移动游戏数据分析[EB/OL].(2018-08-22)[2021-08-29].
[3]崔家阳.技术赋能:大数据在用户画像的应用与改进:以人寿保险为例[J].中国商论,2021(15):99-101.
[4]吴瑞溢.基于RFM模型的福建省高职大学生行为画像分析[J].厦门广播电视大学学报,2021,24(2):78-84.
作者:苗地
转载请注明来自发表学术论文网:http://www.fbxslw.com/jjlw/29007.html