导语: 如今,大数据的概念已得到全面普及,数据价值的重要性也得到很多行业认可。甚至很多传统行业的企业也开始重视数据,做好数据采集、保存、挖掘、应用的工作。具体到如何利用数据金矿,用数据驱动业务运营和自身发展,还是要回归到基本概念,理解大数据相关概念的本质和核心思想,从而牢牢把握住在DI时代(DI,为Data Intelligence的缩写,“DI时代”即“数据智能时代”)的数据海洋中航行的方向盘。本文围绕大数据诸多概念中最常见和常用的“用户画像”,第一部分就先为大家浅述一下用户画像的基本概念和构建原理。
用户画像初探
用户画像,英文为 User Profile,是根据用户基本属性、社会属性、行为属性、心理属性等真实信息而抽象出的一个标签化的、虚拟的用户模型。“用户画像”的实质是对 “人”的数字化。
用户画像的应用场景有很多,比如个性化推荐、精准营销、金融风控、精细化运营等等。
举个例子来理解用户画像的实际应用价值,我们经常用手机网购,但其实我们每个人的购物APP页面都不一样。所谓“千人千面”,即电商APP的个性化推荐系统会给每个用户“量身定制”专属首页,精准推送符合用户需求和偏好的商品,从而提升转化率和用户体验。
而 用户画像 构建 的核心工作 ,即 是给用户贴“标签”。 标签(tag):也称数据点。我们通过“标签”来对用户的多维度特征进行提炼和标识。以目前在APP开发者和运营者当中使用比较多的个推用户画像产品——个像为例,来看下业内的大数据公司是如何通过“贴标签”来构建自己的用户画像体系的。
以消息推送服务起家的个推,自2010年成立以来,已成功服务了数十万APP,累计覆盖40亿移动终端,有着维度全、覆盖面广的数据基础。依托海量线上用户APP兴趣偏好数据、线下用户基于场景的活动数据沉淀 以及强大的数据分析能力和算法建模能力 ,个推根据自己独创的 “冷数据“、”温数据“、”热数据”的原理 构建出覆盖人群属性、兴趣偏好、用户行为、实时场景等众多细分维度,拥有性别、年龄层次、消费水平、职业、购物偏好等上千多个标签的用户画像体系,并面向A PP 开发者推出用户画像产品——个像 ,旨在帮助APP开发者360度勾勒立体用户画像,深入洞察用户,精准把握受众,为APP在不同时期的精细化运营提供全面、可靠的数据支撑,帮助APP全方位了解用户,助力APP推广和运营。
个推的“冷、温、热”数据原理
冷数据:性别、兴趣、常驻地、职业、收入水平和年龄层次等相对稳定的用户画像数据。
温数据:近期活跃应用、近期活跃场景等具有一定时效性的用户行为数据。
热数据:当前区域、当下打开的应用等场景化明显的实时数据。
用户画像再探
当下,很多企业都积累了一定的数据,也开始或已经构建自己的用户画像体系,很多运营人员也将用户画像作为“用户洞察“、开展“精细化运营“的基础。但是,对于用户画像,我们真的完全理解吗? 本文第二部分,笔者就总结了对用户画像常见的3点误解,我们一起再和用户画像来一次”去伪求真“的亲密接触吧。
误解一:将标签等同于特征。
标签标识多维度的特征。但标签不同于特征。有的单个特征可以当做一个标签来使用,但有的标签是由多个特征聚类组合加工而成的。所以,不能把标签等同于特征。
还以个推旗下的用户画像产品——个像为例,其 “有车一族”这一标签就是由“男性(冷数据)”“手机安装有并经常打开汽车资讯类APP(温数据)” “常出现在4S店(基于LBS技术可以得到的场景化的热数据)”等特征综合提炼得出。
误解二:认为用户画像就是客观事实。
一般来说,企业在构建标签体系时,会标注标签属性,帮助内部理解标签赋值的来源,进而理解指标的含义。一般来说,常见的有5种标签属性:固有属性、推导属性、行为属性、态度属性、测试属性。
固有属性 即指这些指标的赋值体现的是用户生而有之或者客观存在的属性,比如:性别、年龄、是否生育等。推导属性 则是由其他属性推导而来的属性,比如星座,我们可以通过用户的生日推导;而用户的品类偏好,则可以通过日常购买来推导。行为属性 是产品内外实际发生的行为被记录后形成的赋值,比如用户的登陆时间、页面停留时长等。态度属性 则是用户自我表达的态度和意愿。在大数据的需求背景下,以往通过问卷来调研手机用户态度属性的方式显得有些低效;现在更多的则是利用产品中相关的模块做用户态度信息收集,比如微博的“点赞”按钮,用户可以表达自己对某观点的赞同。测试属性 是指来自用户的态度表达,但并不是用户直接表达的内容,而是通过分析用户的表达,结构化处理后,得出的测试结论。现在很多产品都有UGC功能,用户可以表达自己的观点、情感、态度,通过对用户生成的内容进行文本挖掘分析,可以得出用户的价值观、性格等属性。
所以,标签数据未必是客观事实,但也不是完全虚构,而是基于事实数据进行符合逻辑的模型分析得出。所以,用户画像中对某个人或某人群的描述,未必就是客观事实,只是该描述可以通过多维度数据进行推断得出,而这个推断有很高的合理性,能高度接近、刻画现实。这里就是对第二个误解的阐述,即用户画像不是客观事实。
误解三:认为用户画像都是对单个用户的描述
在互联网全面普及、物联网正进入爆发的当下,对特定用户的洞察有海量数据和前沿的数据智能技术作为支撑和依托,特定用户的画像构建当然是可行的。比如, APP/应用可以基于自身积累的用户注册数据和用户行为数据来综合刻画特定用户的画像,基于此,金融风控类应用可以精准识别高风险用户;新闻类应用可以准确筛选出热衷发表一些过激或负面言论跟帖的用户;电商类应用可以判断那些总是在频繁下单、打五星好评、然后取消订单的刷单用户…。
然而,目前行业更多聚焦于对某一人群或行业的洞察上,也会通过数据报告的形式呈现洞察结果。比如,数据智能企业个推通过对移动互联网的用户特征和行业趋势进行深入洞察和剖析,跟进市场发展热点,于前段时间发布的《5G手机首批用户画像报告》《生鲜电商APP数据报告》等。
当然,一个多维度、立体化、能实现360度洞察的用户画像体系才能最大程度上帮助企业和开发者更精准地洞察用户需求,为用户提供更人性化、智能化的服务。行业内也确实有进行用户画像和定制化标签合作的案例,如同“拼积木“一样,通过数据源之间的碰撞,最终”拼凑“出全面、清晰的用户画像。 以移动互联网领域为例,针对普通APP开发者构建用户画像时可能会面临的APP自有的数据体量不够庞大、数据过于垂直,覆盖面不够广、即使有一定的体量,但团队的数据分析能力和建模能力有所欠缺等问题,个像用自己具有行业覆盖广度的数据体量和数据建模算法能力,基于双方各自优势,为APP开发者提供定制化标签服务。
总结
本文上半部分简单讲述了用户画像的基本概念、应用价值,并以当下大数据公司为例,阐述了用户画像构建的实质和核心;下半部分则结合笔者经验,总结了3个对用户画像的常见认知误区;从初探到再探,希望能和大家一起加强对大数据领域一些常见概念的理解。后续,希望能和大家对用户画像在“精细化运营”“个性化推荐”等特定领域的应用实践一起做更多的探索,敬请期待。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
日前,北京佳格天地科技有限公司与农业农村部大数据发展中心签订联合实验室协议。双方将充分利用遥感、AI等技术,以及人才队伍、技术产品等优质资源,开展农业农村领域相关基础模型、作物农情遥感监测产品及农业气象服务等方面的合作研究。
日前,2022世界数字农业大会举行。大会以“种铸强芯,数领未来”为主题,开设多场数字农业云端专题论坛,北京佳格天地科技有限公司受邀出席”农业农村大数据应用论坛“,同与会嘉宾分享了农业大数据的创新应用。
毫无疑问,随着以Kubernetes为代表的云原生技术得到广泛应用和普及,云原生数据量和重要性不断提高,使得企业对云原生数据库服务的需求日渐增长。
近期,由中国工业设计协会、中国技术交易所双重指导,UXPA中国主办的2022年第六届GXA好体验奖评选结果揭晓,元年科技凭借元年数据智能管理平台荣获“最佳企业赋能奖”,该奖项旨在挖掘当代杰出用户体验作品,表彰利用创新思维、坚持以用户体验为中心的企业,填补了国内专业级别用户体验社会化奖项的空白。
近日,秦淮数据集团位于马来西亚柔佛州的秦淮数据马来柔佛超大规模数据中心(以下简称“MY06”)一期盛大开园。从规划、设计到建造,秦淮数据集团中国、新加坡、马来西亚三地团队紧密合作,共同完成马来西亚最大的国际超大规模数据中心交付
把脉中国数据智能化
2023年,几乎可以被定义为中国互联网公司的“大模型元年”。ChatGPT的全球爆红,彻底点燃国内的大模型赛道,曾经的“创业英雄”、如今的商业领袖们亲自下场,接连发布生成式人工智能产品与大模型布局。大模型火了,沉寂许久的互联网行业又有了新的“战事”。同时,大模型的快速发展也改变了云市场的现状,企业对
近日,数字化市场研究咨询机构爱分析发布了《2022爱分析·数据智能厂商全景报告》,爱分析从技术研发能力、服务客户数量、收入规模等维度对厂商进行了全面专业的评估
2022年11月18日,首个国家级大数据产业创新赛事——2022第一届中国大数据大赛圆满落幕。工业和信息化部信息技术发展司数字经济推进处处长张建伦,中国电子技术标准化研究院副院长孙文龙出席颁奖典礼并致辞
2022年11月17日,在厦门市工业和信息化局的指导下,以“数据确权”为主题的2022数据资产(厦门)论坛在厦门成功举办。本次论坛以“数据确权”为主题,由厦门市互联网域名应用服务产业协会和构信网(公信.中国)联合主办
近日,国内知名数字化市场研究咨询机构爱分析正式发布《2022爱分析·信创厂商全景报告》(以下简称“报告”)。报告综合考虑企业关注度、行业落地进展等因素,遴选出在信创市场中具备成熟解决方案和落地能力的厂商。
10月31日下午,由数博会执委会主办、数据观(北京)传媒科技有限公司承办、贵阳大数据交易所协办的第四期数博思享会“实践先行观公共数据价值与应用”活动成功举办。
近日,由中国国际数字经济博览会组委会主办,中国电子技术标准化研究院、河北省工业和信息化厅承办的“第一届中国大数据大赛”(简称大数据大赛)正式启动。
广州光点信息科技有限公司自主研发的数据中台产品GI大数据中台V2.0产品是国内率先推出符合新创标准的中台产品,基于“大数据+AI”等技术全新打造,集数据采集、融合、治理、服务、管理为一体的旗舰平台。
广州光点信息科技有限公司自主研发的数据中台产品GI大数据中台V2.0产品是国内率先推出符合新创标准的中台产品,基于“大数据+AI”等技术全新打造,集数据采集、融合、治理、服务、管理为一体的旗舰平台