在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
进入大数据时代,我们常常在谈论的一个概念就是用户画像。在互联网领域利用用户画像,可以达到精准营销的商业目的,因此这也是为什么构建用户画像在这个流量至上的年代如此重要的原因。任何企业公司的产品要想做好精细化运营,都需要先构建该产品和服务的用户画像。下面我们一起看看用户画像的概念和构建方法。
一、用户画像的概念
我们常常在说用户画像,到底什么是用户画像呢?简单来说,就是用户信息标签化。我们通过大数据技术收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,然后对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。所以用户画像的重要性不言而喻,它可以看作企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。
大数据技术已经发展很久到达一个成熟的阶段了,其应用对于互联网公司来说,已然成为不可或缺的重要组成部分。从基础设施建设到应用层面,主要有数据平台搭建及运维管理、数据仓库开发、上层应用的统计分析、报表生成及可视化、用户画像建模、个性化推荐与精准营销等应用方向。而用户画像的一个重要现实意义就是可以真正帮助大数据技术在营销领域真正落地。
二、用户画像的构建
1、流程模板
首先用户画像的构建要建立在充分了解、明确用户画像大方向的规划上,只有明确了方向后续才能做好项目的排期和人员投入预算。这对于评估每个开发阶段重要指标和关键产出非常重要。然后是根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系。另外,标签相关数据可存储在Hive、MySQL、HBase、Elasticsearch等数据库中,不同存储方式适用于不同的应用场景。大家还要记得用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。接着需要对开发的脚本进行迭代重构、调优。最后,画像的应用场景包括用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用。
2、产品功能
比如,标签视图与查询,主要面向业务人员使用。用户可以层级化地通过点击标签,查看每个标签的详细介绍。还有面向业务人员使用的用户人群功能。在应用标签时,可能不仅仅只查看某一个标签对应的人群情况,更多地可能需要组合多个标签来满足其在业务上对人群的定义。
3、打标签
用户画像的构建其实可以理解为对用户“打标签”。而打标签的方式可以分为统计类标签、规则类标签和机器学习挖掘类标签。
(1) 统计类标签
这类标签是最为基础也最为常见的标签类型,例如,对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费数据中统计得出。该类标签构成了用户画像的基础。
(2)规则类标签
该类标签基于用户行为及确定的规则产生。例如,对平台上“消费活跃”用户这一口径的定义为“近30天交易次数≥2”。在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则由运营人员和数据人员共同协商确定。
(3)机器学习挖掘类标签
该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般地,机器学习标签开发周期较长,开发成本较高,因此其开发所占比例较小。
如何利用大数据技术构建用户画像已经成为这个信息爆炸社会的重要营销手段。因此,大数据技术的应用早已深入我们生活的方方面面。如果大家可以在这个领域进行学习和发展,其前途一定无比广阔。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据面试题 Spark知识点汇总
Spark是一个实现快速通用的集群计算平台,它是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。在大数据库架构中常常需要使用Spark,Spark的知识点一直也是大数据面试题的重点,本文整理了Spark知识点汇总,现在就和大家一起梳理下吧!
7944
2019-07-25 15:33:51
云数据安全之数据加密的要点分析
毫不夸张的说,当下是云计算和大数据的时代,我们的生活和工作都受到了云计算和大数据方方面面的影响,云计算和大数据不仅改变了我们的思维、生产方式,还改变了我们生活和学习方式。然而随之而来的云数据安全问题也是日益凸显,许多用户都遭受了大数据泄露带来的损失。本文就来和大家分析一下云数据安全中数据加密的要点。
6869
2019-10-31 19:21:05
2020年云计算和容器的发展趋势如何?
2020年,混合云将解决企业现存问题,托管服务和供应商锁定的争论也愈演愈烈。越来越多的应用程序将分别部署在两个或更多的公共云中。中小企业将采用经常性收入业务模型。公共云的采用将增加,并使企业更容易利用其他新技术。
6328
2020-02-05 15:08:00
数据仓库是什么?基本概念讲解
对于大数据的学习者来讲,深入理解数据仓库是很重要的。本文将对数据仓库的基本概念进行讲解,大家可以在看完数据仓库的概念、主要特征以及分层架构之后,真正理解数据仓库是什么。
8304
2020-06-04 11:58:15
深度学习工程师必须掌握的神经网络架构
深度学习工程师必须掌握的神经网络架构,神经网络架构分为四大类:标准网络、递归网络、卷积网络、自动编码器。神经网络可以用来可视化的数据包含两部分:每一层神经元的输出,它们对应输入数据在网络中的不同表示每个神经元所学习到的权重,刻画着各个神经元的行为,即如何对输入进行响应的。
6241
2020-07-01 17:34:28