画像体系(四):系统

发布时间 2023-08-27 16:41:52作者: 天戈朱
  • 一、用户画像基础
  • 二、标签指标体系
  • 三、标签平台管理
  • 四、标签数据开发
  • 五、标签数据存储
  • 六、标签调度推数
  • 七、用户画像系统
  • 八、系统搭建示例

七、用户画像系统


 自建用户画像系统是互联网企业、在转型的传统企业必经之路。画像系统一方面用于企业精细化运营,提高客单价,通过洞察用户特征,更加了解用户。另一方面拓客拉新,与外部数据打通,寻找更加精准人群,帮助提升收入。具体有一下使用场景。

1、用户人群圈定与推送 

  • 通过规则筛选出一批有相同特征的用户群体。
  • 存后将生成圈定人群的规则,而后依据该规则生成圈定人群推送到服务端。

   下面介绍提供产品化服务的调度流程:

  •  

 2、多维透视分析 

  •  多维透视分析提供根据现有用户标签圈定用户的功能。进一步地用户可以将这些标签进行组合,筛选出同时包含这些标签的用户群,从多个维度(如地域、性别、消费水平、活跃度等)进一步分析该批用户群的特征。从而为精细化运营提供支持. 
  • 和用户分群功能的一样,多维透视分析功能也可以组合标签圈定用户群,计算对应人群的数量。不同的是:多维透视分析功能可以从多个维度去分析圈定用户群的特征,可以进行人群的对比分析;用户分群功能侧重的是将筛选出来的用户群推送到业务系统,提供服务支持。 

八、系统搭建示例


1、标签开发内容

  • 标签分:人口属性标签、用户行为标签、用户偏好标签

 

2、数据建模

 

3、数据字典总目录

 

4、权重配置

5、时间衰减

     用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重

    1)、行为类型权重:用户浏览、搜索、收藏等不同行为对用户而言有着不同的重要性,一般而言操作复杂度越高的行为权重越大。该权重值一般由运营人员或数据分析人员主观给出;

    2)、时间衰减:用户某些行为受时间影响不断减弱,行为时间距现在越远,该行为对用户当前来说的意义越小;

  • 时间衰减公式:F(x)=exp(ln(k)/t)x, 其中衰减系数为(ln(k)/t),用来控制时间衰减的幅度。参数为k(预设衰减幅度)、t(预设衰减周期)。自变量为x,表示当然计算日期距离初始日期的间隔时间。

   3)、行为次数:用户标签权重按天统计,用户某天与该标签产生的行为次数越多,该标签对用户的影响越大;

   4)、TF-IDF计算标签权重:每个标签的对用户的重要性及该标签在全体标签中重要性的乘积得出每个标签的客观权重值;

  • TF:表示这个标记次数在用户P所有标签中所占的比重
  • IDF:表示标签T在全部标签中的稀缺程度,即这个标签的出现几率。如果一个标签T出现几率很小,并且同时被用于标记某用户,这就使得该用户与该标签T之间的关系更加紧密
  • IDF算法:用户标签权重:TF*IDF