大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
互联网IDC圈8月31日报道,数据从何而来,这个问题看似简单,却是数据应用最基础的一步,正因为信息爆炸时代产生的海量数据前提,我们才进入了真正的大数据时代,《大数据时代》这本书是国外大数据研究的先河之作,本书的作者舍恩伯格被誉为大数据应用第一人,在多个互联网重镇任教的经理,早在2012年就在经济学人发布了14页的大数据研究。8月29日-30日七牛D-Future数据时代峰会上维克托•迈尔•舍恩伯格让我们再一次感受数据全新的洗礼。
创新互联2013年至今,先为乌鲁木齐等服务建站,乌鲁木齐等地企业,进行企业商务咨询服务。为乌鲁木齐企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。维克托•迈尔•舍恩伯格
以下是舍恩伯格演讲内容(根据速记整理):
舍恩伯格:非常荣幸能出席今天的盛会,今天上午我们听到了很多技术的演讲,技术实际上给我们带来了变革,这些变革也给我们带来了一些前所未有的成功,比如在商业界,还有各个公司,大公司小公司,给他们带来了成功,在接下来的30分钟,我想要让大家思考一下,数据实际上给我们带来了工具,这些工具给我们带来了成功。但是我们真正取得成功,还是要取决于我们利用这个工具的能力。这就需要我们要好好的了解什么是数据,还有未来的数据到底是怎么样的。首先我给大家讲一个故事吧。这个故事实际上是我的同事凯尔(音)所发现的一个非常有意思的故事。
大数据时代要改变传统思维
好象出了一点技术问题,好象有一点变化,但是我还是我。我的朋友凯尔(音)跟我讲了接下来的这样一个小故事。在美国的超市,很多年前他们销售这些蛋糕,这些蛋糕有不同的口味,巧克力蛋糕、香蕉蛋糕、桃子味的蛋糕,这个蛋糕的尺寸大概是30厘米那么大,就像一个馅饼一样。如果你问一下这些美国的超市,他们销售的这些蛋糕当中,最受欢迎的销量最好的,大家觉得在美国最受欢迎的是什么馅饼呢?苹果馅饼,是的。但是如果你要真正去问一下,他们是不是真的喜欢苹果馅饼,实际上可能很多人并不是真的喜欢苹果馅饼,他们为什么不是最喜欢苹果馅饼,却买它呢?为什么呢?因为想一想,它有30厘米那么大,那全家人呢?买一个苹果派就够了。那家里的所有人可以达成一致,他们起码比较喜欢的就是苹果派,比如像巧克力派、香蕉派、桃派,就是苹果派不是他们最喜欢吃的,但是他们可以吃,这个可以达成共识。因此很多年以来,世界上的这些超市,卖的派可能未必是人们最喜欢的口味,之后他们发现了问题所在,就是尺寸问题。如果你让它尺寸变小的话,也就是说,每一个家庭可以不止买一个派,每一个家庭成员都可以买一个自己喜欢吃的口味。如果你把尺寸变一下,他们可能就不是买苹果派,可能他们根据自己的口味买香蕉派、梨派、桃派,这个问题就很简单了。
因为在之前,很多年以来,这些超市的策略是不对的。实际上是尺寸的问题,而不是口味的问题,他们的尺寸太大了,之后他们进行了调查,问用户到底喜欢吃什么口味的,他们肯定喜欢说,我想要吃苹果派,因为只有那个尺寸的苹果派。大家可能说等一下,我们一直做研究数据,我们一直看周围的环境是什么样的情况,是的,是这样的。但是几百年前几千年前,我们看当时的世界,观察它,了解这个世界。那么在过去我们一直以来,都是这样做的,我们一直也在搜集数据。搜集数据,分析数据,是需要花费很多的时间,有时候也是非常困难的,需要做大量的工作,有时候也是非常昂贵的。我们有了几千年的历史,也在不停的搜集数据,代价是非常昂贵的。但是我们可能用到的数据只有一小部分,有是有限的,我们花了那么多钱,搜集这个数据,但是我们处理的量是很小的。因此我们之前拥有的数据规模是非常小的。每天我们所处理的数据,实际上规模、数据是非常小的。大家可以想一下,我们现在的数据分析,或者是一些小的样本。它们都是一些小的数据。我们是把数据缩小到一定的规模,然后从这些小的规模数据上找到一些理论。当然了,那是小数据时代,也是我所成长的一个时代。
但是现在一切都变了。我们现在搜集数据分析数据的能力越来越强了。而且现在搜集数据的成本也下降了。现在数据价格成本已经不贵了。便宜了。因此我们周围一切都变化了。那这时候我们就需要改变自己的思维,因为我们所处的是大数据时代。如果我们找到新的方法,就可以有新的理念。
随时随地的搜集数据,在未来,可能它就起作用
在过去我们希望可以利用数据,来回答问题,首先可能是先是假设,这就是一个问题,然后搜集数据,最后进行分析,这就是一个流程。首先我们从问题切入。最后这个问题可能会给我们带来这个答案。那么这个问题,比如说大家最喜欢的口味的派是什么,是苹果还是桃味的?最后我们拿到了问题的答案,可能就是苹果派,最后我们就觉得苹果派是最受欢迎的,但是反而我们得到了这个问题的答案是错误的。那么现在我们其实可以做一些改变,改变一下我们的方式,我们不是从问题开始着手,因为有可能我们的问题本身就是错误的。我们先从数据着手,然后从数据开始搜集数据,进行分析。然后通过分析,我们可以提出一些非常棒的问题。比如说这个派的尺寸,最合适的尺寸是什么,这是正确的问题。根据这个分析,我们可以获得这样的一个假设。最后我们可以得到问题的答案,就是我们需要一个尺寸合适大小合适的派。我给大家拍张照片,后面的两位请微笑。好了,非常棒。现在我就要做一个决定,我拍了这个照片,什么是重要的,比如说如果你是非常重要的,我们就聚焦在你身上,后面的人就变成模糊的影像,我可能决定你是我的焦点,我不能让你成为一个模糊的影像。或者是我的焦点放在你这个人,那么你后面的人可能会变成模糊的影像,这意味着什么呢?我现在在照一个照片,我首先要清楚,我感兴趣的事物是什么,人是什么。我的焦点在哪里,我需要知道这个问题,知道了这个问题之后,我才能知道答案。但是如果我现在不知道焦点聚集在谁身上,那怎么办呢?实际上这个聚焦也是属于小数据,如果现在你现在已经决定了你聚焦在谁身上,这个就是小数据,如果现在还没有决定那怎么办呢?大家可以看这张照片,有一个牙刷,后面是我四岁的儿子,可以看到这里牙刷是我聚焦的位置,我儿子就变得模糊了。但是现在我想改变焦点,让我儿子成为焦点,那怎么办呢?那我们这张照片实际上是用大数据的摄象头来设想的,它实际上可以捕捉到各种各样的数据,现在我们想要让我的儿子变成焦点,我用这个大数据摄像机拍完了之后,就可以调节这个焦点,在牙刷和我儿子之间切换焦点,因为这个摄像机搜集到了所有的数据,不是小的数据,而是大的数据,因此我可以改变聚焦的位置。所以我们搜集所有的数据,不需要先定义问题,可以先把数据搜集起来,再聚焦问题是什么。也就是说如果你可以搜集到全面的数据的话,可以发现创新性的问题。而且你可能完全不需要回答这些问题,大家可能听说过这个品牌,多林国(音),实际上这是一个学习的应用,你可以用Iphone或是安卓系统来学习外国的语言。非常有意思,而且很酷。如果有兴趣的话,我也鼓励大家使用这个应用,全世界范围内有很多的人,每天都在使用多林国这个应用。我们使用数码设备,来使用这个应用,这个应用实际上可以捕捉我们的数据,捕捉我们的信息,可以捕捉我们学习语言的习惯,而且进行分析。多林国(音)这个公司,西班牙语的这些人,他们学习英语的方法是错误的,他们学习顺序是错误的,如果你可以改变一下这个顺序的话,西班牙人学习英语的速度就会越来越快。实际上他们一开始不是为了回答这个问题而搜集数据,他们先是搜集数据之后,然后分析数据,这个问题就出现了。他们通过分析,他们就调节了一下西班牙人学习英文的数据,帮助他们更好的学习英文,因此取得了成功。大学为什么不用这种方法呢?为什么我的教授同事们没有想到这一点呢?因为他们没有数据,而多林国(音)公司搜集到了这些数据。多林国(音)一开始并不知道怎么使用这些数据,但是他们逐渐逐渐的发现了可以如何应用这些数据,提升了用户的体验,也就是说,他们实际上可以实现很大的价值。他们不仅可以为客户提供更好的价值,而且可以带来利润。在过去,在以前,我们首先是提出问题,然后开始搜集数据,然后进行分析,最后拿到答案,最后把数据给扔了,因为数据已经完成了任务了,所以就把它扔到了。你要存储数据的话也是非常贵的,但是现在储存数据是不贵的。现在你可以应用数据实现更多的价值。你可以反复利用它,实现其他的目的。实际上我们看到的数据只是冰山一角而已。我们看到的是海洋之上的数据,大部分的数据是隐藏在海洋之下的。如果你重复使用这些数据,就可以发现潜在的价值。