画像体系(二):标签

发布时间 2023-08-27 16:41:52作者: 天戈朱
  • 一、用户画像基础
  • 二、标签指标体系
  • 三、标签平台管理
  • 四、标签数据开发
  • 五、标签数据存储
  • 六、标签调度推数
  • 七、用户画像系统
  • 八、用户画像应用

二、标签指标体系


 构成用户的标签可以是多种多样的,也应该能够渗透到丰富的业务场景中去,因而标签就需要兼顾广泛性和精确性,这就引入了标签体系的概念。说白了,所谓标签体系,标签体系就是分类

1、按维度划分体系 

     标签体系化是建立用户画像的关键环节,也是在标签开发前要进行的工作,具体来说就是需要结合本公司的业务情况设定相关的指标。从建立的标签维度来看,可以将其分为用户属性、用户行为、用户消费、风险控制、社交属性等五大常见类型。如下图:

2、标签分类和层级

   不同公司分级不同,最常见的为以下四级标签,又可以分为三种: 

   第一、二级标签称为标签的类目;  三级标签称为标签、四级标签级标签称为:三级标签值。

   各个公司的标签分类都大差不差,分为以下三类:

  •  

 1)、统计类标签(事实标签)

  • 统计类标签的规则放之四海皆准,每个公司的定义都差不多,如性别指的就是人的性别,不会有歧义,偏客观。
  • 直接提取的标签,又叫事实标签。比如:性别,年龄,最近一次登录时间,月均消费。
  • 有非常通用且明确的定义,是最为常见的标签。

 2)、规则类标签

  • 规则类标签与统计类标签不同在于概念上的差别,技术上差不多,往往各个公司的业务人员根据公司的需求灵活定义,偏主观。
  • 从程序员角度来说,统计类标签与规则类标签没有本质差别。
  • 需要自定义规则,比如:高价值用户、意见领袖、电子产品爱好者、黄牛党。
  • 需要运营、产品、业务人员,根据企业自身的业务特征,设计适合自身的规则定义。往往同一个名称的标签,在不同企业的规则不同。

 3)、挖掘类标签

  • 挖掘类标签是企业做用户画像的分水岭,通常来说,这个标签不是由人来制定规则,因为有些规则没有办法通过人类语言描述清楚,或者人类语言描述的不准确,尤其是预测相关的规则,规则随着时间的变化也在不停的变化。
  • 一般通过机器学习算法进行预测的标签。又叫预测类标签。比如:预测性别、预测年龄、潜在流失用户。
  • 通常是很难根据某一个规则得到的标签。需要机器学习通过系统现有的数据,反复迭代获得一个模型算法,再根据算法得到标签。
  • 开发周期长,难度大,准确度不能保证。但是往往也是最有价值的标签,因为从数据得到的数据,有时往往比定死的规则更反映真实情况。

生命周期标签示例


什么是生命周期模型呢?

  • 其实本质上,就是用户的一种分层、分类的方法论。是按照用户在产品中的阶段进行的划分,反映了用户从接触产品到离开产品的整个过程。
  • 从技术层面,可以理解成一个用户标签,标签值有新用户、成长期用户、流失用户等。

通常来讲,用户的生命周期分为如下图的五个阶段:

  •  

其中:

  • 引入期:用户刚刚开始使用产品或者服务,初步建立起品牌的认知
  • 成长期:用户对产品服务开始逐渐信任,使用频次、深度不断加强
  • 成熟期:用户对平台的服务非常熟悉,可以无障碍地完成各种内容,使用的频次深度趋于稳定
  • 休眠期:用户逐步丧失对平台的兴趣,使用频率、热度越来越低
  • 流失期:用户完全不再使用该产品

生命周期模型能做啥呢?针对不同阶段的用户,可以进行精细化的运营、精准施策。

那如何判断一个用户是属于什么阶段呢?这个其实就是标签的计算逻辑了;计算的方式有千千万,但总体上来讲,基本分了两类:

  • 一类是通过逻辑规则进行判断生命周期的阶段,
  • 一类是通过算法来进行判断。

1、通过逻辑规则,判断生命周期阶段

     先来一个示例图,这是一个用户生命周期的划分(和上面的例子比,更加细分了一下,但逻辑是一致的)

   这里最主要的几个数据,包括:

  • 用户首单时间、
  • 有效订单量及发生时间、
  • 最近一单时间、
  • 购物频率

   的数据,就可以计算出比较系统的用户的生命周期。

  这里设置了四个时间边界参数,分别是:形成边界、活跃边界、沉睡边界、流失边界。这四个是判断时间的主要参数。可以按照不同的业务特点进行灵活设置。具体的计算逻辑上,可参考下面的逻辑全景图:

  •  

2、通过算法,判断生命周期阶段

  • 在算法层面,其实给用户计算生命周期,本质上就是进行用户分类的过程。
  •  关于如何进行用户分类,算法就比较多了,比如可以使用朴素贝叶斯、SVN等。 

 

参考案例二:https://zhuanlan.zhihu.com/p/628233089


对应的客户生命周期类别标签如下:线索——潜在客户——新客户——活跃客户——预警客户——休眠客户——流失客户,还有2个转化过程阶段:唤醒客户和召回客户。这就是以时间为轴,通过判断客户在某个时间节点做了或没做什么给其贴上对应识别标签。

 Flag:

  • 时间边界确定标签多少

参考: