TICK IT

http://www.linyi.press

消费者市场细分还可以这么玩

市场细分(market segmentation)是指营销者通过市场调研,依据消费者的需要和欲望、购买行为和购买习惯等方面的差异,把某一产品的市场整体划分为若干消费者群的市场分类过程。每一个消费者群就是一个细分市场,每一个细分市场都是具有类似需求倾向的消费者构成的群体。

这个定义来自互联网,准确的说应该叫做消费者细分。细分本质上是个聚类的过程,包括现在所谓大数据领域流行的用户画像,实质上干的是一个事情。玩聚类少不了会用到K-means算法。K-means算法计算量比较大,但原理很简单:

  1. 给定一群对象(针对细分就是人),先随机分配各类中心点
  2. 计算每个个体与中心点的距离,将个体分配给距离最近的类中心
  3. 随后更新中心点重复上述过程,重复过程2直到类中心移动距离满足一定条件,过程结束,分类完成

这个过程对于大部分情况是很好用的,这里需要说明的是,由于起始点的随机性,类中心的移动速度通常很慢,k-means往往达不到全局最优,解决的办法可以考虑组合算法,例如可以想办法先找到一个还不错的起始点。但如果还是分不出来怎么办,世界非因我们而生,令人迟迟不能按时回家吃饭的问题比比皆是。

千言万语不如一张图,我们用2个正态分布数据簇模拟下面左图情况, 红色群体表现稠密,深蓝色群体相对稀疏(“凝聚力不足”),而且真实的深蓝边界已经深入到红色阵地,k-means往往得不到一个非常理想的情况,我们可以看到(下右)边界部分已经有些分不清楚了,这里我用红色标记不能被kmeans正确分类的点。

回归问题的本源,市场细分的根本需求往往并不只是要能够分出不同类别就完事,因为这样没有操作意义。细分的目的在于区分市场并能够找到特定市场的人群,找到这些的人需要靠特征,特征来自于总体,因此我们需要能够尽量正确判断每个人所属总体,这是很朴素的统计学思想。

事实上,如果采用GMM(高斯混合模型)方法可以帮助我们比较好的“猜”到每个点的总体特征,这里只需要设法拟合包含2个密度函数的GMM模型(下左可以直观看出),过程就不啰嗦了。可以看到(下右),采用GMM方法可以比较好的帮助区分每个个体所属的真实群体,这里错分个体只剩下2个。

GMM对付“各部落凝聚力”相差较大的情况还是很不错的选择,理论上GMM可以不必是高斯混合,也可以是其他多种理论分布的混合,最核心的部分在于拟合分布函数的参数。kmeans可看做是GMM的特例,算法表面上看起来风马牛不及,本质是同一个思想。

GMM更广泛的应用在于视频监控领域,视频图像所包含的目标区域与背景区域在灰度上有一定差异,呈现双/多峰-谷形状。通过建模,针对运动中的物体通常还需要根据数据实时学习并更新模型参数,以便很好的抓取目标监控对象(目标区域),这个过程涉及机器学习范畴。

模型的美妙之处就在于此。

Jun 07, 2016 Publish Date
算法 建模 细分