[新闻] 何宝宏:大数据流通尚处于男耕女织的时代| 数博会官网

何宝宏:大数据流通尚处于男耕女织的时代

作者: 王婕    来源: 数据观   编辑: 张薇  时间:2019-05-28 11:14:01  

  5月26日,2019数博会“大数据·新居住”专业论坛举办。在论坛的演讲环节,中国信息通信研究院云计算与大数据研究所所长何宝宏围绕当前大数据的发展态势做了主题演讲。

  在演讲一开始,何宝宏就向在座的嘉宾抛出一个问题:未来十年,最奢的奢侈品会是什么?“毋庸置疑,未来最难拿到的将是隐私。”何宝宏讲到,当前大数据的兴起已然颠覆了我们对隐私的保护:“机器记住了你不应该记住和不想记住的东西。十年以后,在大数据时代,在新居住时代,如果我向你打招呼你不记得我,那就太幸福了,未来一定是这样子的,被人忘记是一种幸福。”

何宝宏1.jpg

  的确,从要“努力记住”到“想忘记很难”的过程,也是数据越来越多、种类越来越复杂的过程。何宝宏表示,当前我们面临的场景非常复杂,目前对于数据的分布式的分析和处理正在不断融合,一些传统数据库也在向数据管理越来越模块化、标准化的方向发展,其中还包括软硬一体结合、数据管理开源的进展以及越来越多数据管理技术的诞生,如区块链、时序数据库等,而伴随着这一态势,在未来,一定还会有更多不同的数据管理技术诞生并得到发展。

  同时,何宝宏还谈到了他对大数据相关算法发展的担忧。“在这个数据爆炸的时代,大数据让我们相信数据,但数据也能说谎。”何宝宏提到,算法是用机器书写的数字世界的游戏规则,但算法更多注重的是效率,而不是道德和公平性问题。由于工程师会判断优先级,也存在盲点和偏见,这样必然会把工程师对社会的认知带到算法中,所以算法会出现问题,如自去年以来就被广泛热议的“大数据杀熟”问题。正是因为这样的背景,可以想象未来的一两年,我们要特别关注算法的开放问题及可解释性的问题,要进行算法治理,尤其是涉及到个人隐私的时候。

  数据资产化则是大数据发展面临的另一个重要问题。何宝宏介绍,在技术方面,目前的一个典型应用是多方安全计算,旨在创造一个真正的面向数据的市场环境,这个市场环境不同于我们今天的商场、超市,也不同于石油、期货,是一个全新的场景。而在数据资产化从理论到实践的道路上,除了技术问题,还包括数据流通的问题。何宝宏认为,大数据流通是数字经济学的富矿,但大数据流通尚处于男耕女织的时代。这主要是当前数据还没有实现商品化造成的。“50%的数据是你自己家的,或者是你邻居家的,又或者是你客户家的,另外50%还需要自我生产。在商业层面,99%以上的数据产品都是别人生产的,你自己家里生产不了,所以数据变成商品,变成资产还有很长的路要走。”除了这一方面的原因,何宝宏还表示,数据资产化在理论以及经济学的概念上也有待发展。“我们一直在讲,今天经济学的很多原理都不太适合数据这个资产,所以我把以前的经济学叫做工业经济学,并坚信谁能在数字经济学坚持,就一定能获得诺贝尔奖。”何宝宏笑谈道。

何宝宏2.jpg

  演讲中,何宝宏还提到了目前大数据发展除了算法及流通方面以外的一系列问题,如到底该如何采集?怎么处理?我们用过的数据都去了哪里?他提到当前对于数据利用存在的一个普遍的问题,那就是“很多数据被使用以后就进入‘冷宫’,不知去向。”还有很多数据则是“生得偶然,死得随机”,例如监控物联网采集数据,却“根本不知道要拿来干什么。”

  在这个一切皆数据,人类和数据互相塑造的时代,“我们一边在保存数据,一边在丢弃数据,几年后还能找到十年前的数据吗?有没有办法溯回?一千年后,后人会如何考古?我们的数据保存在哪儿?这些都是我们值得深思的问题。”何宝宏在最后说道。(记者 王婕)