用户画像知识大全 用户画像分群基本属性

用户画像,即用户信息标签化,是大数据精细化运营和精准营销服务的基础 。大数据时代,用户的所有行为都可以被追踪和分析 。用户画像是通过分析用户的基本信息、特征偏好、社交属性等多个维度的数据,描绘出用户信息的全貌,并从中挖掘用户的价值 。可以帮助数据“起死回生”,提供个性化推荐、精准营销、个性化服务 。
一、画像基础 1.1 标签类型 用户画像建模其实就是给用户“贴标签”,一般分为三类:
●统计标签:最基本最常见的标签,由用户注册数据和用户访问数据计算得出 。
●规则标签:基于用户行为和规则生成,通常由更熟悉业务的运营人员和数据人员协商确定 。
●机器学习挖掘类别标签:由机器学习挖掘产生,根据用户的一些行为或熟悉程度进行预测判断 。比如,根据用户购买化妆品和护肤品的次数权重较高,得出用户性别为女性的结论 。
1.2 数据结构 人像系统的基础设施包括Spark、Hive、HBase、Airflow、Redis和Elasticsearch 。下图是用户画像中的数据仓库架构 。
①数据仓库的ETL处理流程是通过ETL过程将日常业务数据、日志数据、埋置数据等数据处理成相应的原始数据层(ODS)、数据仓库(DW)和数据集市层(DM) 。
②用户画像不是数据的来源,而是对ODS层、DW层、DM层的数据和用户相关数据进行二次建模和处理得到的数据 。在ETL过程中,将用户标签写入Hive,根据不同数据库的应用场景,将数据同步到MySQL、HBase、Elasticsearch等数据库 。
Hive:存储用户标签、用户组、用户特征库的计算结果 。
MySQL:存储标签元数据,监控相关数据,将数据导出到业务系统 。
HBase:存储在线实时数据
Elasticsearch:支持海量数据的实时查询分析 。
③用户标签在Hive中处理后,部分标签通过Sqoop同步到MySQL数据库,为BI报表展现提供数据,多为视角分析数据和圈子服务数据;另一部分标签同步到HBase数据库,用于在线个性化推荐产品 。
1.3 用户画像模块 在构建用户画像的总体方案中考虑了以下八个模块 。
用户画像主要覆盖模块
●用户画像基础
理解并明确用户画像中包含的模块,设计数据仓库架构、开发流程、表结构和ETL设计 。主要是明确规划的大方向 。
●数据指示器系统
建立数据指标体系,按照业务条线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系 。
●标签数据存储
设计完数据索引系统后,再考虑不同的应用场景使用哪种存储方式 。
低标签数据开发
关键模块 。标签数据开发包括统计、规则挖掘、流计算和人群计算的开发 。
重点内容:数据调研,与业务方确认数据口径,标签在线开发 。打通人像数据和各种业务系统之间的通路,提供接口服务 。
低开发性能调整
标签开发上线后,为了缩短调度时间,保证数据稳定性,需要对标签脚本和调度脚本进行迭代重构和优化 。梳理与标签开发、调度、警报验证、同步到服务层等相关的现有脚本 。,确定可以优化的区域,并反复优化 。
关键内容:减少ETL调度时间和调度过程中的资源消耗 。
●作业流调度
标签处理、人群计算、同步数据和业务系统、数据监控和预警脚本开发完成后,需要一个调度工具对整个过程进行调度 。
关键内容:满足固定调度、监控预警、故障重试、各调度任务归位的复杂依赖 。
●用户画像产品化
产品化的模块有标签查看、用户标签查询、用户分组、视角分析等 。
重点内容:满足业务方对用户精准营销的需求 。
●用户画像应用
应用场景包括用户特征分析、短信邮件精准推送、站内信和推送消息、针对不同用户的客户语音、高价值用户快速退款等高级服务应用等 。
【用户画像知识大全 用户画像分群基本属性】重点内容:帮助业务方理解和应用用户画像数据,提高用户活跃度和GMV 。
1.4 开发上线流程


    推荐阅读