想做大数据?不妨先看看这篇文章

36大数据2018-12-05 15:03:29


一个公司如果开始要做大数据,成本是需要考虑的:


1、机器。会比传统的业务更消耗服务器,单机配置一般也比较高。


2、人员。BI,分析师,应用研发,架构,算法,每种类型的人价格都不便宜


3、数据为导向(或者慢慢转换为以数据为导向)会对原有的产品产生额外的负担。比如大量的日志输出,上报等等


在实际的发展过程中,有很多老总敏锐的感觉到,手头有这么多有价值的数据,一定要利用起来,但是有几个问题确实是很多人不清楚的。很多都是边做边感受。有时候做到后面,心里也会犯嘀咕,花了这么多钱,这么多人手,做这件事情真的值得么?


我觉得真要做,至少要考虑下面几点:


1、需要多少成本?


2、需要多少时间?


3、产出是什么?


4、数据最后呈现的产品形态是什么?


而最重要的是3,4两点: 大数据到底可以给公司带来什么?


首先我们看看大数据包含了哪些,然后我们再来阐述构建好平台后,大数据以什么样的产品形态产出。


1、数据本身

2、流水线(支撑数据分析的数据处理平台)

3、挖掘加工(分析数据内部特征关联性规律,也就是机器学习)

4、产品


目前产品呈现形态,我所知的有:


推荐

  • 电商应用最广泛。有效增加用户体验,同时提升点击转化购买率

  • 有内容产出的站点。比如CSDN

  • 做内容聚合的,比如今日头条。据说今日头条的算法随着用户使用的积累,效果越来越好了。


广告(精准营销)

  • 专业的广告公司,比如广告联盟.

  • 特定产品本身承载的广告投放。比如微信那个高大上的朋友圈广告

  • 公司内部的EDM,电话,短信等营销


搜索(排序因子)

  • 机器学习产生的很多中间结果可以有效的提升搜索的排序


用户分析(这个算是)

  • 了解你的客户是根本

  • 金融行业非常依赖于此。比如信征,反作弊,反欺诈等。未来放贷的变革估计也靠此了。

  • 这个可以作为一个直接的产品,也可以作为一个中间服务,直接支撑推荐,广告,搜索等产品

  • 基于此还可可以有非常多的产品,就等待人们去挖掘了。


实时计算(流量计费,反欺诈/作弊等等都需要依赖于此)


BI报表

  • 基础流量,你网站的pv,uv等等

  • 质量监控,监控分析你的服务是否顺畅,比如视频播放卡顿比可以反馈出视频网站的服务质量。

  • 运营监控,譬如通过情感分析可以得到用户的直观反馈。典型如京东评论的情感分析。

  • 特定指标计算,这个是根据运营以及决策人员根据实际经验想看到的一些数据,我们把它量化,指标化,从而呈现出报表形态,方便运营以及决策人员做出相应的调整。


运维支持

  • 也可以划归到BI报表中的质量监控中去

  • 单独划归出来其实想说,大数据其实是可以对整个产品线的各个环节做support的。并不一定是我上面的列举。


上面说了七点,其实总结下,无非做了如下两件事情:


了解:

  1. 了解自己的产品

  2. 了解自己的用户


提升:

  • 提升各种转化率

  • 提升决策的准确率


当然,还有专门做数据的公司,只要他们能够为其他公司提供【了解】【提升】这两件事情,也就算达到自己的使命了。


End.

————————————————————————

你可以:


回复1,查看文章《数据挖掘算法与现实生活中的应用案例》

回复2,查看文章《 大数据领域的创业思考》

回复3,查看文章《【实战PPT】看工商银行如何利用大数据洞察客户心声?》

回复4,查看文章《PPT:基于微信大数据的股票预测研究》

回复5,查看文章《PPT讲解:数据可视化,到底该用什么软件来展示数据?》

回复6,查看文章《PPT:如何成为真正的数据架构师?(附下载)》

回复7,查看文章《阿里巴巴PPT:大数据基础建议及产品应用之道》

回复8,查看文章《马云和小贝选谁做老公?写给非数据人的数据世界入门指南》



Copyright © 古田计算器虚拟社区@2017