大数据之六——终结篇

王荣昌2019-03-14 14:13:30

大数据也是数据。数据是一座冰山,看得见只是数据含义的一小部分。在数字化时代,数据也被当成是数字,数据支持交易的作用被掩盖。在大数据时代,数据的价值从它最基本的用途转变为多项未来的潜在用途。当然,数据的基本用途为信息收集和处理提供了依据。不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。系统为了某个特定目的而生成的数据,可能重新用于另一个目的。最终,数据的价值是其所有可能用途的总和,数据的潜在价值可能是无穷的。这可以认为是大数据之大的表现之一。

我们把大数据的运用称为数据的创新。数据的创新可以表现在以下几个方面:一是数据的再利用,比如亚马逊利用AOL的后台数据;二是重组数据,数据的总和比部分更有价值,当我们将多个数据集的总和重组在一起时,重组总和本身的价值也比单个总和更大。比如房地产网站Zillow.com将房地产信息和价格添加在美国的社区地图上,同时还聚合了大量的其他信息,以此来预测每套住宅的价格。

三是可扩展数据,比如谷歌街景与GPS采集不仅优化了其地图服务,而且对谷歌的自动驾驶汽车的运作也是功不可没。四是数据的折旧值是我们需要考虑的因素,但即使数据用于基本用途的价值减少,但其潜在价值却依然强大。五是数据废气,它是用户在线交互的副产品,比如用户在上网时产生的数据包括浏览了哪些页面、停留了多久、鼠标光标停留的位置,输入了什么信息等,这些数据可以有巨大的商业价值。六是开放数据,面对怀疑,公开优先。

Facebook公司上市时,其公布的账面资产仅为66亿美元,但是其第一天上市的市值就达到1000亿美元以上,以后更是在短短的几年中,市值涨了四、五倍,是什么支撑着Facebook公司这么高的市值呢?答案是数据。根据测算,每一个Facebook用户的价值约为100美元,因为他们是Facebook所收集信息的提供者。收集信息固然至关重要,但还远远不够,因为大部分的数据价值在于它的使用,而不是占有本身。

在大数据时代,出现了三类大数据公司:一是基于数据本身的公司,如Twitter;二是基于技能的公司,称为大数据的分析公司;三是基于思维的公司,是指那些挖掘数据的新价值的公司。所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。谷歌和亚马逊其实是在上述三个方面都有过人之处的公司,这也是为什么这两家公司的市值如此高的原因。大数据公司的多样性表明了数据价值的转移。随着数据价值转移到数据拥有者手上,传统的商业模式被颠覆了。

大数据处理的背后是数据分析专家的出现。行业专家和技术专家的光芒会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。规模仍然很重要,但是如今重要的是数据的规模,也就是说要掌握大量的数据而且要有能力轻松地获得更多的数据。大数据让处于行业两端的公司受益良多,而中等规模的公司要么向两端转换,要么破产。传统行业最终都会转变为大数据行业,无论是金融服务业、医药行业还是制造业。所有的公司都能通过巧妙地挖掘数据价值来获得利益,数据能够优化生产和服务,甚至能催生新的行业。

当然,大数据也不仅仅带来美妙的前景,大数据还会带来更多的威胁,我们可能冒险把罪犯的定罪权放在了数据手中。阿汤哥《少数派报告》电影中的描述正是对于大数据用于预测的担心。

在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。如今很多用户都觉得自己的隐私已经受到了威胁,当大数据变得更为普遍的时候,情况将更加不堪设想。

当然,大数据的不利影响并不是大数据本身的缺陷,而是我们滥用大数据预测所导致的结果。大数据预测是建立在相关性基础上的。让人们为还未实施的未来行为买单是带来不利影响的主要原因,因为我们把个人罪责判定建立在大数据预测的基础上是不合理的。只要得到合理的利用,而不单纯只是为了数据而数据,大数据才会变成强大的武器。换句话说,只有深入数据背后的真正本质,才能更好地理解与应用数据。

我们要掌控数据,要实行责任与自由并举的信息管理。大数据带来的管理变革也是无处不在:

一是个人隐私保护,从个人许可到让数据使用者承担责任。为了实现平衡,监管机制可以决定不同种类的个人数据必须删除的时间。再利用的时间框架则取决于数据内在风险和社会价值观的不同。公司可以利用数据的时间更长,但相应地必须为其行为承担责任以及有特定时间之后删除个人数据的义务。

二个人动因VS预测分析。大数据时代,关于公正的概念需要重新定义以维护个人动因的想法:人们选择自我行为的自由意志。

三是击碎黑盒子,大数据算法师的崛起。大数据的运作是在一个超出我们正常理解的范围之上的。类似于审计,我们的世界将出现大量的外部算法师和内部算法师。

四是反数据垄断大亨。反垄断法遏制了权力的滥用。为了确保给大数据提供一个与早期技术领域情况相当的活跃的市场环境,我们应该实现数据交易。大数据的产权问题也很重要,那些拥有大数据真正产权的公司将主导未来。

大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。

大数据标志着“信息社会”终于名副其实。可以肯定的是,数据量将继续增长,处理这一切的能力也是如此。我们可以利用更多的数据,当然这也需要我们采取非传统的方法,特别是要改变我们理想中构成有用信息的因素。我们“做新、做多、做好、做快”的能力能释放出无限价值,产生新的赢家和输家。对于大多数数据来说,尽可能多地收集、等待信息增值并且让其他更适合挖掘其价值的人来分析它才是明智之举。

大数据能帮助我们更好地进行已有的工作,并处理全新的事务,但是它显然也不是万能的。大数据不能造婴儿,虽然它确实可以救助早产儿。凡是过去,皆为序曲。大数据通过运算将这句话铭刻,无论结果好坏。

大数据是一种资源,也是一种工具,它告知信息但不解释信息。它指导人们去理解,但有时也会引起误解,这取决于是否被正确使用。

大数据的运用我们已经耕耘了一段时间,也已经创造出了巨大的价值,但是大数据的潜力还很大,大数据的未来光辉灿烂。


Copyright © 古田计算器虚拟社区@2017