要要该要该咋能能电脑设计用户画像的标签体系?

该如何尽量的避免**的用户画像?

最近,很频繁碰到各形公司找我联系“用户画像应该怎么办”这个问题。什么是用户画像呢?那就是参照某个人外在表现出去的网络行为,猜他是男是女,挣多挣少,孩子多大,乃至要买什么东西这些背后的特征。

用户画像,是大数据三百六十行居家旅行、装逼俗烂具备的概念,它还有一个个带有的概念叫受众代培生。个人觉着,“用户画像”这个词比较顺耳极其打听一下人口属性、生活状态这些基本上支持静态信息,这有多少稍微有点被误导:我们重点关注的,并不一定是某用户“最近要最好别旅游”、“准备着买多少钱的车”那样的话能驱动就效果的动态信息。从这层意思上说,用“受众定向”十分准。

常言道,指画画虎难画骨,知人知面不知心。为什么不知人心这么大难呢,道理很简单的:猜对了不错,猜错了也好,也是丈二和尚摸不着头脑,根本不会可信度高的正确答案(术语称作“GroundTruth”)。这一点,白居易老先生早有教诲:周公恐惧流言日,王莽谦逊未篡时,向使一年前身便死,一生真伪复哪知?

用户画像,跟这个也稍微有点的的。比方说,你把某人标成“足球爱好者”,对不对他自己都不一定会拿得准。就拿中国足球事业的革命家、教育家高俅同志来说,他究竟有没有算“足球爱好者”么?说不定答案是仁者见仁的。并且,先要给大家解放下思想:除开性别、年龄这些有明确答案的标签,其他大多数兴趣标签,探讨其“准程度”是没有意义的。

从技术层面看,消费者画像的过程比较好枯燥无味。我们今天来继续讨论一个虽然最简单、却最难以把握精髓的环节:怎么啊,设计用户画像的标签体系。

什么是标签体系呢?简单点说那是你把用户分到多少个类里面去。肯定,每个用户是是可以分到多个类上的。这些类全是啥,彼此之间有何联系,就构成了标签体系。标签体系的设计有两个比较普遍要求,一是以便于检索数据库,二是效果显著。在不同的场景下,对这两点的要求重点是有所不同的。笔者以前见过很多做用户画像的产品经理,而不忘情于啊,设计两个崇高、伟大的光荣、对的的标签体系,这而不是**的调调儿。

一般来说,设计一个标签体系有三种思路:

1.结构化标签体系

简单地说,应该是标签组织成比较规整化的树或森林,有内容明确的层级划分和父子关系。结构化标签体系看起来整洁干净,又都很好解释什么,在面向品牌广告主开喷时比较好好用。性别、年龄这类人口属性标签,是最是是的结构化体系。下图那就是Yahoo!受众代培生广告平台区分的结构化标签体系。

但,实践当中况且是再朝品牌广告主,现场售卖非人口属性的受众也修真者的存在很小困难,原因又又回到文章开头说的问题:这些标签从原理上那就是不能数据检测的。

2.半结构化标签体系

在主要用于效果广告时,标签设计什么的灵活性大吓想提高了。标签体系你是不是方整,就不那就有用了,只需有效果就行。在这种思路下,用户标签而不是在行业上呈现出肯定会的相互对应体系,而各行业内的标签设计则以“抓到老鼠就是好猫”为最高指导原则,切决不可拘泥于形式。下图是Bluekai吸聚多家数据无法形成的半结构化标签体系。

不过,标签体系极为混乱的话,投放具体运营过来就也很困难。因此,实践中往往还是需要对肯定会程度的结构化做屈服,就算整个定向投放逻辑是机器决策的(例如个性化选择重定向)。

3.非结构化标签体系

非结构化,应该是各个标签对事不对人,各自不对各自的用户兴趣,彼此之间并无层级关系,也没法组织成不规整的树状结构。非结构化标签的有名例子,是搜索广告里得用关键词。也有Facebook带的用户兴趣词,意思也一般。

半结构化标签操作上巳经很麻烦了,非结构化的关键词为啥在市场上能十分盛行呢?这通常是而且搜索广告的市场地位太最重要了,不断地它的关键词选择和系统优化,已经不能形成了一套能成熟的方**。

面向品牌的结构化标签体系,电脑设计的好坏倒是并不太最重要;而全部非结构化信息的标签,也就没少电脑设计的需求。产品狗们出现的难点,一般说来是如果设计合理的半结构化标签体系以驱程广告的实效。这里面最重要的诀窍,是系统研究某个详细行业的用户决策过程。

站在上帝造万物的视角,以电视台分频道的方法将用户分到“财经、体育、旅游、…”这样的框框里去,其实并不难,也没有太大意义。唯一务实的态度的思维,是千万不能打听一下那就多的行业,把目光聚光在你目前服务的客户类型上。一开始嘛,你接的大都电商客户,关注教育行业用户分类有啥意义呢?

在判断了行业之后,要成立该行业的用户标签体系就有点儿血战了。什么叫系统性研究用户决策过程呢?说白了就是要洞彻在这个行业里,用户判断买什么、不买什么的原因和逻辑。我们举几个最常见的一种的行业那说明此事:

(1)汽车行业

先来看汽车行业,是毕竟这里的用户决策逻辑比较比较模糊。一个打算购买汽车的用户,简单考虑到的因素,一定是价格。有二十万预算,就买不了五十万的车,也很大会判断十万以下的车。下一步要一批的,那就是车型了。如果没有家里有两个孩子,十有**会考虑七座车;如果这样单身贵族,搞不好会弄个跑车玩玩。这两项大都也很理智甚至于加强结构的约束。而在这之后,才是对品牌精挑细选。

并且,汽车行业的标签体系大体估计是:价格—>车型—>品牌,尽量重要程度的排序是没法错的。假如从直觉上先考虑到品牌、调性,那老祖**的思路了。

(2)游戏行业

游戏的用户决策过程总体上令人捉摸不定,这是毕竟它多少有点电影、音乐差不多的艺术性特质。而人们对艺术的喜爱,并不是理性的,也就未必能总结规律。本人不玩游戏,也都搞不清RPG、ACT、SLG、RTS、STG这些类型(不玩你这词儿可够熟的!)。这样的话用这些分类划分用做标签体系行不行啊?这也**的思路:因为上面的分类只不过是为了便于掌握游戏组织和索引,并不是用户的决策逻辑。难道一个“RPG游戏爱好者”,会注意到RPG就非玩决不可,其他的游戏都不屑于顾么?

这样游戏行业就没法做了么?当然不是。要想把游戏的用户标签做到,还得踏入到进一步细分的游戏场景中去深入的研究。比方说,玩slots(老虎机)游戏的用户,而不偶尔会换有所不同素材的新游戏,也就是说,将“slots”另外一个用户标签,与用户决策过程是无差的。而比较喜欢海岛奇兵游戏的用户,是对SuperCell新出的游戏也神往,此时“SuperCell”这个品牌就成了管用的用户标签。

(3)电商行业

从消费者的角度来看,电商行业其实不能被称是一个行业,完全是零售等行业的**。不过是对电商中典型的商品类型,或者服装,用户决策过程不过是相当不寻常的:某个女生看了H&M的某款裙子,不过不能断定出她要买裙子,也不是有是对H&M情有独钟,可能不仅仅是毕竟该款裙子某个特珠的造型。在这类商品中,“H&M”的或“连衣裙”都不肯定会是管用的用户标签。

因此,电商行业的实际中做法大家都看到了,基本不凭着分类,彻底以“单品+推荐算法”的方法形成完整和建议使用标签体系。

那么教育行业怎摸做?旅**业怎摸做?这篇文章不是教材,不能一一尽述。大家能够掌握了上面的思路和方法,肯定能够自己能举一反三。有人会问了,那你是不是我每个行业研究透彻以后,具体一个标准的用户标签体系,就也可以两全其美了么?答案是否定的,这里面有两个原因。

简单的方法,大多数情况下标签体系是开放的,当然不必然两全齐美的列举结果。上面电商行业那就是个非常好的例子:新的商品、新的产品类别不断地再产生,不停地研究和调整也就不可少。

比如,每家公司面向的客户应该有自己独有的特点,再再加拥有的数据源完全不同,只有一据这些灵巧根据情况标签体系,才可能全面的胜利最好的效果。再者教育行业,在整体上研究什么用户决策过程,可以能得到一个通用标签体系;但要是特别关注儿童教育、考研教育、或者英语教育,看样子的要想研究更加精细的决策过程和标签体系。

反正,最好不要以为是用户标签体系的设计跟编纂新华字典一般,在案头潜心研究逻辑就能一劳永逸地做好。虽然,这是一项减弱参与的、黑手黑脚的实战性极强的产品工作。

还有个小问题:前面我们说了,标签没有办法衡量能力准确性,那怎莫确认用户画像结果的质量呢?这里要应用reach/CTR曲线。我们以下图为例来说说。

上图是一条啊是的reach/CTR曲线:它的横坐标即reach,来表示的是某个标签(或者“汽车”)跃过到的用户在整体用户中的占比;它的纵坐标即CTR,来表示的是该标签的用户在对应类型的广告(上例中为汽车广告)上表现出来进去的点击率。

我想知道为什么会是一条曲线呢?只不过我们在做受众代培生时,一般说来会在用户在该标签的得分上设置里一个阈值,确定是否是该类型用户,随着阈值可以设置的不同,reach水平就会变化,或者地CTR也变会变化。这条曲线的最右端,即reach等于100%的点,不对应的CTR是该类型广告的总平均点击率,这个点跟模型完全没有关系,是固定不动的。而伴随着reach的降低,一般来说CTR会对应增加(当然了事实上没有理论上的保证)。一般来说,两条reach/CTR曲线两者相比时,整体在上方的曲线有好点的定向学校性能。

每个产品经理,都要多多理解看看safely/CTR曲线,从思想根源上破除“标签准确性怎么”这样的疑问。

所有进行到用户画像工作中的朋友,在正在写第一行代码,设计第一个产品之前,本文的内容都真心好好一读,而且跪求这些问题的错觉与误解,真是是少了。如果您觉得本文有价值,就得还给更多的朋友去看看吧!

#特别邀请作者#

北冥乘海生,公众号“计算广告”(Comp_Ad),欢迎来知乎和微博关注。

本文原创先发布于人人都是产品经理。未经授权,不准进入转载

题图无论是Pexels,设计和实现CC0协议

扫码免费用

源码支持二开

申请免费使用

在线咨询