不懂数理和编程如何运用免费的大数据工具获得

发布时间: 2020-06-19 15:16 文章来源:香港新澳门app

  

  当我们想要创业却对市场行情不甚了解,该如何迅速了解市场行情,以便我们能更好的切入市场?本文作者介绍了一种零成本用大数据获悉市场行情的方法,对你想要了解市场行情非常有帮助。

  最近一个朋友想创业,做母婴方面的项目,之前没做过该类项目,有了几个备选项目,分别是产后恢复、婴儿游泳、月子餐和月子会所,这些他都觉得不错,所以就有点选择恐惧症,想知道做哪个case有搞头。因此,让我帮忙分析分析一下哪个方向比较好。

  这几个问题,归结到2点,就是市场行情和用户画像。如今是互联网时代,凡事都讲求“大数据”,强调“用数据说话“,观察相关数据的变化情况并进行分析和逻辑推理,能大体判断出创业的趋势是否已经到来,或者创业时机是否已过去。

  说到这里,其实可以用到一个工具某度旗下的某度指数(最近它太坑了,引起了公愤,不想给它做免费广告,但又要用它,请谅解我这种矛盾的心情。。。)

  言归正传,接下来,我会用朋友提到的四个关键词作为case,对百度指数这个大数据工具的应用进行一个较为详细的讲解。首先,先稍微科普下百度指数方面的相关知识:

  为什么是百度指数,而不是搜狗指数、360指数或谷歌指数呢?原因在于,前两者的搜索引擎使用的人太少了,谷歌指数,更确切是说是谷歌趋势,由于众所周知的原因用不了,而且翻墙后还是英文。。。百度作为国人使用频率最高的搜索引擎,它的指数还是能很大程度上反映网名的搜索情况和需求。

  百度指数基本反映了关键词被搜索的频繁度,但应该是经过加权过滤算法处理的,所以不是直接的搜索次数;

  百度指数可以作假,不止一次出现过刷百度指数的情况,如果有这方面的怀疑,可以结合其他数据验证;

  人群属性的分布误差更大,比如家长和小孩共用一台电脑的情况,但仍然是那句话:相对值是可信的。

  学会用 “数据”、特别是 “数据变化率” 来判断行业/细分市场趋势的创业者,而不是凭借感觉,或人云亦云者,比那些不懂得用数据及数据的变化率提前解码 “趋势” 的竞争者要高出几十倍的创业成功概率!

  打开百度指数页面,分别输入“产后恢复”、“婴儿游泳”、“月子餐”、“月子会所”,这几个关键词,并用逗号隔开,键入之后的结果如图1、图2所示。

  从图1可以了解到几个重要的指标,这些关键词在近7天和近30天的搜索指数概况(整体搜索指数和移动搜索指数),整体的环比情况(是本期统计数据与上期比较,例如2014年7月份与2014年6月份相比较)和同比情况(与历史同时期比较,例如2014年7月份与2013年7月份相比),以及移动搜索方面的环比和同比,后者对于移动互联网时代来说,具有很强的参考性。

  图2中反映了近五年(2011~至今)的各个关键词的搜索指数的历史变化情况,以曲线的形式呈现,间接反映了这几个关键词所代表的细分领域近5年大体上的市场需求及热度变化趋势。在VUCA时代(宝洁公司首席运营官Robert McDonald借用一个军事术语来描述这一新的商业世界格局,即volatility,易变性;uncertainty,不确定性;complexity,复杂性;ambiguity,模糊性),五年的时间足以在宏观上反映一个行业或细分市场的生命周期。其中,呈现的曲线个方面进行分析,即整体趋势和局部的波动,整体趋势反映了关键词所代表的细分领域的行业发展趋势,而波动就比较复杂了,既有突发的,也有规律性的因素存在,这个紧接着我会讲到。

  结合图1和图2来看,这几个关键词所代表的母婴行业细分领域都呈现上升的势头,表明它们所从属的整个母婴市场的前景良好,宝爸宝妈们对于哺育婴童,调理身心方面的市场需求一直存在且不断扩大。“月子餐”无疑是这几个关键词中整体和移动搜索指数最高的一个,这间接反映出“月子餐”这个母婴细分市场的目标人群搜索次数较多,间接反映出这个方向的市场需求较旺盛,而且它的整体同比上升97%,也就是时隔一年,市场需求增长了近一倍!而且它的移动搜索指数较去年同期增长近一倍,表明它的移动互联网属性较强(在了解或寻找该类产品时,用户更倾向于移动端)。

  分析了这四个关键词所代表细分市场在“年”这个跨度上所反映的整体趋势, 这是宏观上的分析。然而,在移动互联网时代的创业,是基于数据变化研究的知识技术密集性创业,需要我们进行更细致、更微观一些的分析,不仅要从以 “月”、以 “季度” 为单位观察数据变化,更要学会以 “周” 为时段单位观察数据变化并积极探究其中的规律或问题,为创业行动前积累大量精确有益的知识。

  导出2011/1/1至2016/6/16期间的百度指数源数据,见图3的原始数据。将该原始数据处理下,在“日期”和指数之间再添加一列,输入函数“=WEEKNUM(A2,1)”( 括弧里第二个数字1,说明一周开始于星期日,如果数字为2,则说明一周开始于星期一),形成“周数”这一列,且将“日期”一列的格式改成只显示“年”,如图4所示:

  因数据量太大,仅以“婴儿游泳”这个关键词举例,再对上表数据进行整理,得到如图5所示的周搜索指数的热力图表格,其中每周的周搜索指数是当周7天搜索指数的算术平均值,表格根据数值的从大到小的变化,对应的颜色也由暖色到冷色,可以很直观的从纵向(每年的周搜索指数变化情况)和横向分析(不同年份各周的同比搜索指数变化情况)近5年周搜索指数的情况。

  从上图明显可以看出,每年的第18周到第40周,即4月末到10月初,下半年,是婴儿游泳的旺季,这时候宝爸宝妈想让孩子体验游泳的意愿更强烈(虽然科学上讲,夏季游泳对于宝宝的抵抗力提高不了多少,并不是最适宜的季节,气温温差变化大,在此时多游泳能锻炼宝宝对温度的适应力,从而增加抵抗力,是最优的选择,但是顾客是上帝,他们要来我们只得奉陪到底咯),商家可以在临近这个时期前做好承载的准备。在此之前和在此之后则是淡季,生意会相对冷清一些。

  包括季节,周末及节假日。比如百度指数搜索“4399”,就呈明显的按星期的周期波动(周末及节假日高,工作日低),这是用户分布和使用习惯的体现;再举受个季节性因素影响的例子(见图7),“羽绒服”在百度指数上的变化情况,很明显是秋冬季处于上扬态势,夏季处于低谷状态。

  此外,还有优酷的例子,优酷的百度指数,基本是每周六拉出一个高峰,因为周六是互联网人群看视频的聚集时间,但是这个规律在春节期间被彻底打破。

  地铁/公交广告、户外广告以及流媒体上的广告,对于百度指数的影响非常大,能够在短时间内迅速带动其关注度的大幅提升。 比如,《太极侠》这部电影,虽然是基努.里维斯主演的,号称具有浓厚中国风的“大片”,靠广告效应吸引了公众的大量关注,搜索指数上映前一段时间猛涨,但根据后续的观影反应,以及百度指数的“华山式”骤降,它毫无疑问是一部烂片。.

  网络时代,爆红的现象越来越频繁,每年至少有个几遭:有凤姐、叶良辰这样的草根英雄,也有各种正规军的IP内容,如琅琊榜、欢乐颂,友谊的小船说翻就翻等。

  在百度指数人群画像里,可以看到3个描述目标用户人口统计学特征的指标,地域分布、年龄分布和性别分布。

  百度指数的地域分布由大到小分为3个层级,即区域、省份和城市,图8是“产后恢复”所反映细分领域的目标用户地域分布情况,由此可以看出,华东总体的搜索该关键词的人数较多,间接反映该区域的用户对“产后恢复”这方面的需求较旺盛,但从省份来看,广东在这方面的需求量最大,其次是江苏和浙江;从城市层面来讲,北京又居于首位,广、沪居次席。

  图9反映出目标用户的年龄主要集中在20~39岁这个区间,对应的是青年和中年女性群体,且以30-39岁的大龄人群居多,结合上图目标人群的分布情况(主要分布于一线沿海城市),再联想到晚婚晚育人群多出现在高学历高收入的白领精英阶层。但性别分布不太符合常理,绝大部分是男性群体。不过,我们可以这样理解,存在宝爸和宝妈共用一台电脑的情况,或产后阶段宝妈接触电子设备的时间不多,宝爸会按宝妈的需求进行搜索,所以性别属性的分布误差会大一些,但这点不影响我们对目标群体的判断。

  当然,为了保险起见,可以结合参考价值小一些的360指数作一定补充(见图10、图11).在360指数中,关于人群定位,也就是描述目标用户人群生活习惯、喜好的部分,我们可以看到搜索“产后恢复”的人群里大都是喜爱看影视剧的粉丝、爱好体育健身者,以及购物达人。

  通过上面信息间的相互补充和印证,加上我们日常的认知,可以得到目标用户的人群画像,见图12,这些信息对于后期编撰营销软文和投放广告渠道很有帮助。

  通过这些关键词的日期&搜索指数源数据,可以分析一下它们之间的关联度,看其中某个业务是否可以在后期进行延伸,或是和其他商家进行资源整合/置换。在excel中,运用CORREL函数求出这四个关键词的相关系数,可以得出它们两两之间的相关密切程度,进行相关性分析(见图13)。可以看出,婴儿游泳与其他几项的关联性不强,产后恢复、月子餐和月子会所两两之间的关联性较强,它们之间可以采取客源共享、优惠联盟的合作方式。

  需求图谱提供了中心词搜索的需求分布信息,通过它可以了解到网民对信息的聚焦点和产品服务的痛点。比如“产后恢复”的热门需求词包括“产后同房”、“产后如何保持好身材”、“瑜伽”、“身材”、“减肥”等,这说明目标用户在搜索“产后恢复”前后的相关关注主要体现在这些方面(见图14)。值得注意的是,通过滑动底部的月份控件,我们可以看到不同月份关于“产后恢复”的相关词搜索情况,这里选取的是四月份和六月份的情况。

  接着我们进行横向分析和纵向分析:横向分析,越接近中心深蓝色的“产后恢复”说明搜索词出现的次数越多,可见目标用户对于“产后同房”、“产后如何保持好身材”、“瑜伽”、“身材”、“减肥”这些话题很感兴趣,可见搜索这些关键词的人对于产后恢复方面的常识了解甚少,这是经营该方向需要注意的地方。越远背景色越浅,说明需求者对于这些词需求越弱;纵向分析,黄色圈全部都是近期被搜索次数逐渐增长的搜索词,反之,绿色的词搜索的人越来越少,图14中的“瑜伽”在四月份搜索的人较多,但在六月搜索急剧减少;“减肥”这一关键词则相反。

  图17显示的是“产后恢复”的新闻监测部分,我们需要去伪存真,去除掉明显跟行业无关的信息,如A(广告)、CFGHJ(娱乐新闻),广告、娱乐新闻和歧义信息都需要排除掉,它们对于挖掘“产后恢复”这一细分市场的需求价值不高。

  图14到图18部分需要结合起来看,相互补充和相互印证,需求图谱中反映的与中心词“产后恢复”有关的相关词,我们只看这些词还无法得到详细、准确的信息,比如“(产后)同房”,通过百度知道的问题部分,我们了解到目标用户想搜索的其实是“产后恢复较慢,到42天恶露才排干净,多久可过XX生活呢?”和“妻子作了剖宫产后恢复顺利的情况下多少天后可以行XX?”

  综合上述分析,搜索“产后恢复”这一关键词的人群对产后身材方面的知识(如产后能否XX、如何恢复身材、产后饮食禁忌等)较匮乏,需要经营者能够对其给予有益的指导,在产后恢复方面拥有较强的专业度。同时,这些搜索相关词也可以作为网名优化数字营销活动方案的风向标。

  为什么要看百度指数?因为在某一特定时间内,的确能看得出来用户对某一个关键词的关注程度,来看看这个关键词、产品、网站是不是有一定的(传播)效果。

  在使用百度指数的同时,也要结合其他数据分享平台,如360指数、阿里指数、百度搜索风云榜和谷歌趋势(Google Trends)来进行补充和印证,综合参考,从而得到更全面、更准确的市场信息。

  百度指数的用途不限于我上面讲到的,它还可以用来进行两个同行/竞品的百度指数比较;(如同程和携程),以及同一品牌在活动推广之前和活动推广之后的指数差异。

  用好百度指数的关键在于能了解足够多的关于关键词的行业相关背景知识,探究数据起伏波动的原因,以及对数据足够敏感,见微知著,一叶知秋。

  苏格兰折耳喵,微信公众号:运营喵是怎样炼成的,人人都是产品经理专栏作家,数据分析爱好者,擅长数据分析和可视化表达,喜欢研究各种跟数据相关的东东。

  非常棒~最近接触到百度指数,不清楚各个数据反映出什么,怎么看,今天看到这篇文章,真是醍醐灌顶,非常感谢作者

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立9年举办在线+期,线+场,产品经理大会、运营大会20+场,覆盖北上广深杭成都等15个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。



版权所有:四川香港新澳门app工程起重机有限责任公司       

网站地图