大数据标签体系建立_Dorothy_AaAa的博客-CSDN博客_大数据标签体系建立


本站和网页 https://blog.csdn.net/Dorothy_AaAa/article/details/78123781 的作者无关,不对其内容负责。快照谨为网络故障时之索引,不代表被搜索网站的即时页面。

大数据标签体系建立_Dorothy_AaAa的博客-CSDN博客_大数据标签体系建立
大数据标签体系建立
Dorothy_AaAa
于 2017-09-28 15:08:15 发布
39307
收藏
32
分类专栏:
大数据
文章标签:
类目标签体系
用户画像
应用场景
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Dorothy_AaAa/article/details/78123781
版权
大数据
专栏收录该内容
2 篇文章
1 订阅
订阅专栏
我们要为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像和应用场景。
类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个大数据平台里面最重要的那个点。举点例子,电商平台的业务核心就是商品,教育平台的核心业务就是教育。电商平台下的类目标签就以商品的分类为基础构建类目树,树的根节点就是商品,往下分可能包括女装/内衣、男装/运动户外、女鞋/男鞋/箱包等子类,等到分到了叶子节点(注意不是越细越好,再往下分对于业务毫无助益了就可以不分了),就可以分析叶子节点的自有属性并且添加到类目树上面去,那么这时一棵类目树就构建好了。怎么确定一个大数据平台的业务核心是什么,这里我提供一种方法:利用头脑风暴把有关涉及该平台的所有事物罗列出来,然后根据物品与平台的关联性大小为基准,将关联性较小的物品一一删除,最后留下来的那个物品就是该平台的业务核心。
但是一直到这里我们建立的并不是类目标签体系,只能称之为类目属性体系。如何从类目标签体系进化到类目属性体系呢?这个时候我们就需要对标签有更加深入的了解了。如果说标签就是一些描述性的词语或者短语的话,那么这些标签从何而来?我们可以从原始的数据源中获取到标签,通过纯粹的语义分析对自然语言处理来获取,这里我们获取到的是原始数据标签。对原始数据进行一定的统计学分析之后我们也可以获取到一部分标签,这里的标签我们称之为统计数据标签。或者我们也可以对原始数据经过算法模型计算后获取一些高级标签,这里的标签我们称之为算法数据标签。总结来说,标签分为三类:原始数据标签、统计数据标签、算法数据标签。类目属性体系中只包括原始数据标签,而我们需要的类目标签体系中需要囊括这三种类型的标签。
至于用户画像,我们可以先浅显地认为这就是人的维度。精确来说,这里的用户画像是在为这个业务系统中所有涉及到的角色做总结性的画像,用户画像本质上也是一套标签体系,只是有着相同的结构而非相同的内容。在用户画像这套标签体系中,分为静态信息和动态信息两部分。静态信息就是用户的自有属性,相当于类目标签体系中叶子节点的自有属性,同样的在静态信息中包含的标签也应该包括三种类型的标签。动态信息就是一个比较抽象的概念了,它主要就是要记录什么人什么时间什么地点做了一件什么事情(这部分详细内容看另外一篇)。如果拿数据库记录来说,静态信息就相当于记录进去一条信息,然后可以对这个信息做修改,或者再增加新的字段;动态信息就是不停地增加新的字段,但是不可以修改之前添加进去的记录。
最后来说应用场景,当我们把业务核心和用户画像理清楚之后,就可以来分析应用场景了,业务核心之间(多个业务核心的状况下)、业务和用户角色之间、用户角色和用户角色之间,一旦产生交互就可以形成应用场景,但是我们仍然需要记住一切以业务范围为首要考量,对于不在业务范围内的应用场景我们需要剔除出去。可以说,应用场景囊括了所有游离的标签。
在把类目标签体系、用户画像和应用场景都建立好了之后,我们就可以以业务场景为基础写模型了(这里我更喜欢称呼它为小故事),就是完整描述下来一套业务流程,这样就能更加清楚地了解到这三者之间是一种怎样相互协作的关系了。
Dorothy_AaAa
关注
关注
点赞
32
收藏
打赏
评论
大数据标签体系建立
我们要为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像和应用场景。类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个大数据平台里面最重要的那个点。举点例子,电商平台的业务核心就是商品,教育平台的核心业务就是教育。电商平台下的类目标签就以商品的分类为基础构建类目树,树的根节点就是商品,往下分可能包括女装/内衣、男装
复制链接
扫一扫
专栏目录
数据治理之数据标签体系建设模板集合(标签属性+框架+流程).pdf
10-07
数据治理之数据标签体系建设模板集合(标签属性+框架+流程)
4000字详解数据标签体系构建方法
云和数据中台企业架构
10-14
303
4000字详解数据标签体系构建方法
评论 1
您还未登录,请先
登录
后发表或查看评论
标签体系构建的核心思想是什么?
大数据技术派
11-19
460
一、前言标签体系的方法论已经很多,我就不再重复了,本篇主要分享下我对标签体系的理解、构建标签体系的思路和标签体系实战模板及文档。二、标签体系的理解标签是对对象某个维度特征的描述与刻画,是某...
用户标签体系的搭建方法
最新发布
Sunny的专栏
10-25
354
以上就是用户标签在实践过程中一些困境以及搭建方法的简述。按照统计方式分类:可以将标签分为事实类(最基础,无需大量业务判断的标签,例如会员等级、年龄、收入等)、规则类(需要一定业务经验和判断的标签,例如最常见的RFM)和预测类(需要使用机器学习的算法预测标签值);按照实效分类:也可以将标签分为静态标签(标签值不会随时间变化,例如出生年月等)和动态标签(标签值会随时间变化)。本文介绍的搭建方式仅供各位读者参考,在实践过程中,可不拘泥于本文所提供的方法,甚至可以将多种方法结合使用。
HTAP数据库系列 | HTAP数据库如何支撑大数据标签体系建设?
qq_39918081的博客
06-02
288
随着当今互联网经济不断深入发展,企业已经从存量阶段逐步进入到精细化运营阶段,这一阶段开始改变了人们传统经营模式,促使企业需要不断提升服务水平来满足客户需求变化,给企业带来了新的挑战,同时也带来新的机遇,它迫使企业传统管理方式做出相应改变,需要进一步细化到“客户触点”,并能及时抓住客户和企业接触的宝贵瞬间,以个性化、精准化的服务,提供快捷、流畅、高效的客户体验,并以此作为企业的重要衡量指标,迫使各企业为精细化运营做出及时响应。
客户画像,是对客户个体形象的全方位描述,它从大量的客户基础数据、触点轨迹数据等客户
全网超详细!用户画像标签体系建设指南!
大数据星球-浪尖
03-12
2680
大家好,最近工作之余看了很多用户画像的文章,要么描述浅显、要么相对片面,对于数据分析人员来说算是窥中豹管。今天我将结合日常工作实践和理解,整理了一份用户画像的文章,内容偏向数据分析方法论,...
大数据 客户标签体系_大数据标签体系建立
weixin_35876299的博客
12-28
1630
我们要不的期是范添事大部会基近说小间进围砖本的为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像支器事的后功发久这含层请间业在屏有随些气和域,实按控幻近持的前时来能过后些的处求也务浏蔽等机站风滚或默现钮制灯近持的前时来能过后些的和应用场景。类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个大数据平台里面最重要的那个点。举点...
推荐系统之标签体系
大数据星球-浪尖
01-11
1326
为什么要先介绍标签体系?一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是...
【标签画像系列】标签体系建设方法论
qq_31008759的博客
05-23
1629
5月11日录制了袋鼠云数栈全新数据中台精讲系列 ——「数智赋能实战六讲」的第一场直播,主要对标签体系的建设进行了抽象,分成几个步骤,方便大家理解。
你能看到
▫ 数字营销是数字化转型排头兵
▫ 标签体系建设方法论
▫ 标签体系在某基金的建设案例
一、数字营销是数字化转型排头兵
《⼗四五数字经济发展规划》中强调,要⼤⼒推进数字化转型,形成数据驱动的智能决策能⼒,提升企业整体运营效率。要做好数字化转型,企业可从产、研、供、销、⽤等多个环节入手,而 “销” 恰好是第一关键要素,企业转型往往从营销场景入
智能汽车-大数据标签系统应用浅谈
IT深耕十余载,大道之简
09-20
624
以上就是大数据标签系统在智能汽车场景的简单应用,本文仅仅简单介绍了数据标签的定义和浅层次的使用,而数据标签系统是大数据、AI、千人千面个性化能力的基础。
浅谈大数据标签平台
北方的大数据之路
12-08
7217
起始
标签平台作为数据平台建设的一部分,尤其是在互联网电商平台中,有着重要的作用。本人在公司接手并且重构了整个标签平台的核心逻辑。对标签平台有一定的了解。写这篇文章的契机是几个数仓的哥们,问到了这方面的问题,正好我也可以总结一下。
本文从技术角度,通过以下几个方面来阐述标签平台的建设历程
什么是特征/标签。
什么是标签平台。
标签平台迭代历程。
标签平台核心功能的解析。
标签平台未来需要解决的问题。
关键字解读
特征:对某个维度特征的描述,特征也是标签,只不过是原子维度的标签。
标签:一组特征的组合。
大数据构建用户标签体系
04-01
大数据构建用户标签体系
健康医疗大数据标签体系构建方法研究.pdf
07-04
健康医疗大数据标签体系构建方法研究.pdf
大数据 客户标签体系_运营商大数据 将现有数据资源进行精准标签化
weixin_42218981的博客
12-21
624
现在任何行业,企业都离不开数据作为业务支撑,而数据是很多行为产生的前提:如数据分析,数据挖掘,企业获客,企业营销等等。无论是什么来源的数据,如“互联网终端的Web,软件”、还是移动终端的“App、H5、和网站等等,都是根据用户的上网行为,通信行为,注册行为等等来获取到大量用户数据资源的。现在可以根据运营商大数据,对于不同行业,企业业务的不同和对获客营销的需求的不同,针对性地去进行分析,可以高效地将...
大数据标签
meiwanlanjun的博客
08-08
191
PHP
Python
flask
list
django
virtualenv
tornado
语音识别
caffe
java
智慧城市
数据结构
算法
贪心算法
朴素贝叶斯分类算法
nlp
数据分析
智慧城市
office
鸿蒙系统
计算智能
人工神经网络
...
《大数据原理与实践》第1次公开课:Overview
嘉数汇
10-20
1051
《大数据原理与实践》通识公开课终于开课了,伴随着本公众号,在接下来的几个月时间中,我们将和大家一起探讨大数据的方方面面,让大家掌握大数据的理念与思维方式、大数据的原理与技术、大数据的方法论等,并实践运用到现实中。
从人类文明诞生的那一刻起,数据就伴随我们而生。正在发生的大数据变革,恐怕是人类技术发展中最重要的话题之一,它冲击着我们的各行各业,同时大数据也正在彻底的改变我们的日常生
数据标签体系与用户画像
weixin_44626528的博客
06-01
1887
1.什么是数据标签体系?用户的数据标签是指通过对用户的社会属性、消费习惯、偏好特征等多个维度的数据进行采集和处理,实现对用户或产品属性特征的刻画,并对这些特征进行分析、统计,挖掘潜在价值,从而抽象出用户的信息全貌。对于用户的数据标签与数据标签体系的关系可以这样理解:用户的数据标签是用户信息标签化,即将用户的各类信息映射为标签符号,这些标签符号最终会形成普通大众对于用户或者产品的认知;数据标签体系是将用户多个维度的标签按照一定规律进行组合,以提高数据分析师的分析效率,更好地辅助运营人员进行决策。2.数据标签体
数据中台-标签体系介绍
GIS摆渡人
04-09
2099
1. 简介
本质:提高数据的产能,让数据能够快速的应用起来,是一套方法论
四化: 业务数据化 ,数据资产化,资产服务化,服务业务化
2. 建设方法论
2.1 定义
对象的度量和描述
资产的一种载体和展现形式
数据的一种使用维度
提供给业务使用的指标特征叫标签
包含客户原始提供的数据字段,包含组成生成最终标签的中间字段
数据和标签不是物理上的区分,而是逻辑上的区分
2.2 场景
用户画像
2.3 标签类型
原始数据标签:客户原始提供的数据表中字段
统计数据标签:客户原始数据通过ETL加工,如求和,评价
算法数
数据结构初识
m0_46755575的博客
08-28
213
数据结构初识
1.数据
说到数据结构是什么,我们得认识什么是数据;
数据:**是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。**数据不仅仅包括整型,实型等数值类型,还包括字符及声音,图像,视频等非数值类型。
也就是说,这里的数据,其实就是符号,而且这些符号必须具有俩个前提:
1.可以输入到计算机中;
2.能被计算机程序处理;
对于整型,实型等数值类型,可以进行数值计算。
2.数据元素
数据元素:是组成数据的,有一定意义的基本单位,在计算机中通常作为整体处理。
数据分析 | 基于智能标签,精准管理数据
【积累】,是一个长期持续的过程。
05-30
1366
千人千面,意思不同用户使用阿里相关的产品感觉是不一样的,例如支付宝首页的推荐内容,和其他相关推荐流信息是完全不同的。社交广告,不同用户的朋友圈或者其他媒体场景下的广告信息是不同的,会基于用户特征推荐。信息价值,根据用户浏览信息,分析用户相关喜好,针对分析结果推荐相关的信息流,越关注某类内容,获取相关的信息越多。如上几种场景的逻辑就是基于不断分析用户的行为,生成用户的特征画像,然后再基于用户标签,定制化的推荐相关内容。...
“相关推荐”对你有帮助么?
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022 CSDN
皮肤主题:编程工作室
设计师:CSDN官方博客
返回首页
Dorothy_AaAa
CSDN认证博客专家
CSDN认证企业博客
码龄8年
暂无认证
原创
43万+
周排名
196万+
总排名
4万+
访问
等级
198
积分
20
粉丝
获赞
评论
38
收藏
私信
关注
热门文章
大数据标签体系建立
39306
用户画像一点心得(待整理)
4639
js数据类型记录
376
[笔记] 浏览器缓存
177
[笔记] 脚手架解析
145
分类专栏
js
4篇
大数据
2篇
浏览器
2篇
css
1篇
最新评论
用户画像一点心得(待整理)
lmw0320:
请教下,如果需要使用神经网络模型来训练用户画像模型的话:
1. 每个用户可能有多个标签,那是一种标签训练一个模型?
2. 标签的类别由人为事先设定的话,其数据标注如何实现?主要是考虑到模型训练的情况下,可能需要大量的标注好的数据集进行训练,而比如必须靠人工进行标注的话,其工作量可能比较大,而且极其耗时,标注的准确率也可能受影响;
3. 产生的标签结果权重,如何体现?如何计算权重?
大数据标签体系建立
Forbes_Zhong:
概括的很好,谢谢。
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
记一点我不知道的css单位
[笔记] 浏览器缓存
[笔记] 脚手架解析
2018年4篇
2017年3篇
目录
目录
分类专栏
js
4篇
大数据
2篇
浏览器
2篇
css
1篇
目录
评论 1
被折叠的 条评论
为什么被折叠?
到【灌水乐园】发言
查看更多评论
打赏作者
Dorothy_AaAa
你的鼓励将是我创作的最大动力
¥2
¥4
¥6
¥10
¥20
输入1-500的整数
余额支付
(余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付
您的余额不足,请更换扫码支付或充值
打赏作者
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值