南极极夜

南极极夜(idobzooki.com) 编辑:jh-qb2P 时间:2017-08-21 21:55:24

  沈艳:可靠的大数据分析具备什么样的特征。第一个是目标要明确。我举一些例子,首先我觉得从我们刚才的比方来看,一个有效的分析它一定是分析目标比较明确,你的目标明确在于什么呢,是不是这个目标只用大数据分析才能实现,还是高质量的小数据就够了,又或者是需要大数据和小数据相结合。有的问题高质量的小数据足够了,类似于刚刚我说的,我要记录孩子成长就够了,或者我们要了解一个地区的经济发展的基本状况,回溯它历史发展的年革,一个产业在一个地区的形成、基本的结构和格局,那这些信息,我们其实高质量的小数据就够了,专门部门为我们收集的资料就够了。

北京大学国家发展研究院教授、北京大学数字金融研究中心副主任沈艳教授

  

南极极夜

  另外还要避免“垃圾进,垃圾出”,这就需要有很多的高质量人才,参与到数据质量的评估和数据质量的分析当中。从“人机结合”这个角度你可以往前看能够看到需要跨界的人才。比如说我要做音乐领域的大数据的产品,那我不仅需要懂算法的人,我也需要懂乐理、懂音乐、甚至懂人文心理的一些人,需要懂得用户心理,要怎么呈现给他们,他们才更愿意接受。

雷军在朋友圈里是这样说的,在瑞士滑雪,吃了这辈子最贵的饺子!一个68块,两盘1360元。他还直呼,这是他吃了这辈子最贵的饺子,三亚各种海鲜都不算贵。

  记者:也就是说在实际操作过程中要将大数据和小数据互相融合?

  大小结合我们已经说了,你拿到大数据,那么这个数据本身质量怎么样,往往需要用很多小数据去验证。


  导读:近年来,大数据在中国经济中扮演了举足轻重的角色,2014年-2017年,“大数据”连续四年成为政府工作报告中的“座上客”。2014年政府工作报告指出,“赶超先进、引领未来”-头脑风暴;2015年提出要推动大数据与制造业相结合;2016年指出要深入推进;2017年指出要加快大数据、云计算、物联网的运用,智能制造为主攻。近日,北京大学国家发展研究院教授、北京大学数字金融研究中心副主任沈艳教授就此接受了海外网的采访。

  大小数据运用应根据研究目的选取

  


  

南极极夜

由于笔者夫人曾在瑞士留学工作5年,我们今天便在知道这个事情之后随便讨论了一下。结果一讨论才发现!笔者夫人的朋友圈里刚好认识当天给雷军包饺子的这位中国大厨!

对此,有网友开玩笑的评论道,“就许你耍猴,人家不能耍你?”。更有网友调侃说,“雷总肯定是碰上黄牛餐馆了,下次记得到官网抢购。”


雷军除夕夜瑞士吃到68一个的饺子!厨子:春节比平时贵4倍!南极极夜

  获取精彩报告内容

  

您可能也感兴趣:
    苹果的一线曙光:iPhone用户愿意为更多功能买单
    最全数据:除夕当天收发142亿个微信红包 8.88元最受欢迎


大年初一先给各位网友拜个年!今儿个来说说雷军在瑞士过年吃饺子被宰的事儿。雷军当时在朋友圈里是这样说的,在瑞士滑雪,吃了这辈子最贵的饺子!一个68块,两盘1360元。按照人民币对瑞郎1:6.8的汇率来算,雷布斯这次在瑞士一定吃到了10瑞一个的饺子了...

南极极夜

  文章来源:海外网

  沈艳:大数据通常说有三个‘V’,volum,velocity和variety,主要就是数据量大,实时,种类多等等。大数据的生成过程和小数据不同之处在于大多数的大数据本身并不是为了一个特定目的搜集的,比如说我们在网络上搜索,我们只是为了满足我的需要,但是搜索背后的公司把这个信息利用起来,把它变成了一个大数据。所以,它记录的颗粒比较细,包含很多冗余的信息,它对于分析和处理要求比较高。所以,这里我打了个比方,好像在同一天有两个孩子出生,A家庭是传统家庭,做法是每年到生日的时候,就带孩子到照相馆照照片,所以十年我有十张照片记录了孩子的成长。B家庭是未来式的家庭,他家里安装摄像头,只要孩子到的地方就会录到这个孩子。这样,这个孩子从0岁到10岁,在这个家里面都有了录像。在这里,A家庭做法类似于小数据,收集的目标很清晰,就是要记录孩子的成长。虽然有可能时间和金钱成本相对比较高,但是输出的结果也是很清晰。第二种类似于大数据的处理方法。因为技术的进步,允许我们用颗粒更细的方法来记录信息,记录信息的成本大幅降低,我们全部都储存在网上或者移动硬盘就可以记录很多很多信息。但是,这个数据收集的目标是不清楚的,家庭为什么收集这个信息,万一将来有用呢,也说不清楚什么用处,因此它在使用和分析的时候成本就比较高。我从这个例子想说明,大数据并不一定比小数据更好,其实它取决于你的目的,假如我记录孩子成长,单纯为这一个目的的话,那么我前面说的小数据的例子,我把照片这样放下来,可能是很感人的,很好的过程。另外一方面,如果这个家里出了一个突发事件,孩子受伤了,想知道孩子是怎么受伤的,这个时候你调用颗粒度很细的那个录像,就能够帮助到了。所以当我们说到大数据和小数据的区别的时候,虽然它们在表象上,大数据能够记录更多的信息,但是它的颗粒度更细,它有更多的多余的信息,但是它对于分析的要求是更高的,不见得大数据一定更好,它取决于你要研究的问题,你的目的是什么。


中餐馆在欧洲也算是稀缺资源,特别是国内逢年必吃逢节必吃的饺子,在日本、韩国、以及欧洲很多国家都是“论个来卖”。即使2块5人民币一个饺子在国内也算是很贵很贵了,但相比瑞士4瑞郎一袋的奶粉在国内卖到几十甚至上百人民币,那都算小巫见大巫了。

南极极夜

  

  

  那么这个人机结合,它不仅指人类教给机器人类的思维方式,因为这个Alpha Go的原理在于深度学习,近似于人类的学习的步骤。另外一个视角,是未来一个发展趋势,一方面是教给机器人怎么思考,另外一方面你也可以给人装备机器具有的一些能力。其实,这个我们已经有体会了,比如说我要去某一个方面,我拿着手机GPS搜索一下就可以了,我们原来可能没有办法那么简单就到某个地方,这就是人借住机器的步骤。比如《必然》那本书里头讲到现在的国际象棋冠军Magnus Carlsen,他就特别善于利用人机的结合,利用人工智能来下棋,所以这是挺经典的实际应用的例子。所以,我认为大小结合不仅指的数据分析的时候你需要小数据,另外在评估一个大数据的质量好坏的时候,我也会需要使用小数据,比如谷歌流感趋势刚开始出来的时候特别火,说它可以提早两个礼拜去预测流感,但是在后期它的预测不那么准了,不那么准的标准就是美国疾控中心的预测可以比它做的更好。大小数据的结合,一个可靠的分析,大数据如果不能做的比小数据好,我们可能就需要考量一下。

(来源:如对本网转载内容、版权有异议,请联系我们)

Copyright © 版权所有 Powered by 南极极夜  sitemap