下面我们再来介绍如何构建用户画像,即用户画像(以下均指 User Profile)中的标签体系,简单来说就是将用户划分到多少个不同的分类之中。
当然,在这种情况下,一个用户是可以归到多个不同的分类上的。用户落入的这些分类都是什么,彼此之间有何联系,就构成了一个标签体系。
一般来讲,有两种常见的思路设计用户画像的标签体系。
一类是结构化的标签体系,这类标签可以直接从人口属性、物品信息等基本信息中直接得到,有明确的层级关系,如性别、省市、视频分类、商品分类等。图 1 是亚马逊的商品标签体系,用户画像的标签体系与此类似,可以结合具体的业务场景来确定。
图 1 亚马逊的商品标签体系简单来说,结构化的标签体系通常较为简单,一般可以直接通过用户的行为映射得到。例如根据用户的购买记录,为用户构建物品对应的结构化标签。
但结构化标签往往粒度较粗,无法充分衡量用户的兴趣,例如用户在新闻类 APP 中阅读了关于某明星的娱乐类新闻,并无法推断出他对所有娱乐类新闻感兴趣,他也不一定只对该明星情有独钟。
另一种是非结构化标签体系,就是各个标签各自反映各自的用户兴趣,彼此之间并无层级关系。
典型的非结构化的标签,如搜索广告系统中的关键词,或者文档主题模型(Topic Model)。例如新闻类 APP 中,我们往往会构建大规模的主题模型(主题数在千万级别),不仅仅涵盖已经构建的结构化的标签体系,如娱乐(明星、搞笑)、体育(篮球、足球)等,还能更细致地表达如星座、食物、体育活动等语义上的分类,而且这些分类之间并没有明显的层级关系。
标签体系的建设本身一要便于使用,二要有明显的区分度。结合具体的产品而言,在不同的场景下对这两点要求的核心是不同的。因为选择哪些标签并没有明确的依据,还是需要充分了解到底是什么因素在驱动用户使用产品。有效的标签体系,要能反映用户决定买什么、不买什么的逻辑与依据。例如电商产品中,以新闻频道的方法,为用户构建“财经”“体育”“旅游”等标签,虽然并不难,但也没多大意义。
更多数据分析干货和案例,可以关注“神策数据”公众号了解~返回搜狐,查看更多
责任编辑: