中关村大数据产业联盟何鸿凌:阳光下的数据流通
互联网IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。
创新互联公司于2013年成立,是专业互联网技术服务公司,拥有项目网站建设、成都网站制作网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元坪山做网站,已为上家服务,为坪山各地企业和个人服务,联系电话:1898082057528日下午“大数据征信与数据流通”分论坛,中关村大数据产业联盟 大数据交换标准委员会主任 何鸿凌做了主题演讲
中关村大数据产业联盟 大数据交换标准委员会主任 何鸿凌
以下是何鸿凌演讲实录:
何鸿凌:数据流动这个领域是比较小众的,我想代表联盟介绍一下在数据流动领域我们做的事情和我们的理想目标是什么,讲大数据,数据为王,得数据者得天下,他是新时代的石油,没有它就没有任何东西。我在中国移动做了15年了。移动是一个数据的富矿,但是移动也非常渴求有外部数据做交叉,让他本身数据能够增值。比如我们在做分析的时候我可能知道这个电话号码打出去了或者知道这个用户点了网站,背后代表什么含义,这些东西都是需要有外部数据做交叉。现在我们正在做这样一件事。
我们为什么要做这件事,这个论坛的名字叫数据流动,数据流动是非常重要的,对于大数据的生态体系,我们可以从共享经济谈起,共享经济是为了让整个社会效率得到提高非常重要的手段,我们可以看到AMBMB把床共享,Uber把车共享了,还有农业设备的共享人的共享,大数据领域在有没有这种社会效率的提升,首先的一点我的数据能不能共享。结合大数据的共享数据的共享和实物的共享有更大的威力,数据可以无损复制,可以很简单的被其他公司使用,而且这个成本非常低。如果我们让数据有效流动起来,他整个效益会趋向一个无穷大。大家知道一天24小时,出租车一天使用的时间也就24个小时,我的数据可以非常容易的拷贝很多份,他们的增长曲线完全不一样。我们是这样看待这件事的,互联网为什么成功,因为他激发了网络效应,数据的流动也可以达到这一点,我们现在怎么理解它的价值,一份数据如果只为自己使用,即使100%的发挥价值,它也只是一百,如果这个数据给别人用,每个人都可以用到,即使这个数据只能发挥50%,但是这100份加起来,是10的平方,这代表我们讲的网络定律。这是我们通常讲网络效应的,为了讲互联网效应的梅特卡福定律,这是非常重要的。是为什么我们要倡导推动做这件事的原因。
今天是一个征信的论坛,我举一个征信的例子,在这个里面有很多数据流通需要,如果是一个年轻学生需要借款,他有很多记录是不可能存在央行的征信系统,但是他有很多足迹已经记录在各个环节,比如他的成绩,每次考试的出勤,之前在食堂的消费记录公交的消费记录,如果他不能把这些东西提供出来证明他是信用良好的学生他就没有办法达成这笔交易,借款人和出卖商品人的利益会受到损失,整个社会损失了这一笔交易,商业不能达成,我们所倾向于做的事情,我们认为我们需要把这种数据利用的成本降低,这样更多商业模式可以达到,更多社会效益可以发挥出来。我们怎么把这个摩擦力降低,在数据流通领域,有非常多的灰色领域,都有哪些问题,在数据流通里,一共有四种摩擦力,前面两种是非常显性后面两种非常隐性,第一你得找到这个数据,你会面临一个比较大的数据寻找成本,这决定了这笔交易能不能达成第一个原因,第二你需要达成这个交易,我们做数据分析这么多年,我们数据需要有格式,需要到你这里而且需要入库,他有非常高的实施成本,这是通常大家要面临的。整个数据流通有两个隐含的社会成本,第一是信任,数据流通双方是否信任非常重要。大数据非常有魅力的一点是数据具备外部性效应,两个人之间的数据流动会损害或者增加第三方收益。我们需要把第三方的效益考虑进来。
一共有这四方面的成本,从最初到现在看数据流通领域经过了什么变革,我们认为整个数据流通领域有五个参与方,首先必须有一个监管结构,另外数据提供方和需求方天然存在,同时要达成一个有效的市场和流动,一个非常高效的市场是不可缺少的。他需要一个中介,我们今天见到的很多东西都是中介。数据本身权益人的利益需要考虑进来,所以数据流通一共有五方,最开始的是一买一卖,这里面因为没有有效的市场和中介机构,他们找到数据的成本挺高的,我们也重复做一些事情,同时去实施这个数据流动的时候也很高,因为每谈一次数据流动都得对接一次协议,得签一个合同。这个模式好处在于信任成本很低,只需要信任需求方不把我的数据拿出去就可以了。这是私下的数据交换模式,无法确保第三方的利益,我们可以看到很多灰色的交易都是通过这个模式形成的。通过市场的发展性了数据中介机构,降低了数据的寻找成本,你在这里可以非常简单的对接到很多数据,同时实施成本也低了,因为中介机构有很多经验,我们去买卖作一个房地产的合同,我自己要跑手续很肯定,但是中介非常熟,他可以非常快的跑起来,所以实施成本低了。遗憾的是,他是一个非常高的信用成本,数据可以无损的复制,你是否信任这个中介机构,他可以把这个无损复制了同时进行外部的问题。
一个完整的四方数据交易合同,刚刚讲的事情还是存在,我引入第四方把刚刚讲的外部成本的事情降低了,因为每个事情都要进群益人做一个确定,这是阳光下数据流动的完整的行业,流动的过程在阳光先也指我跟数据权益人整个过程在阳光下个。刚刚讲了四个模式是概念性的商业模式,我们有没有非常好的技术协议,有没有非常好的平台把完美的实现,我们希望实现以上四点非常低,首先我可以简单的找到各种供需的信息,大家知道奥巴马政府开放了提到机器可读,我的程序可以自动化适配他的原数据,把他的代码科隆下来,数据是不是也可以这样用。第三,我们希望有一些创新机制让中间这个信任成本降低,我们希望在交易成本降低的情况在信任成本也降低,有没有这个方式我们希望外部权益受到良好保障,所有使用的数据有一个非常好的用户的授权,能不能做到这一点,现在中关村大数据产业联盟数据交换标准联盟在做这样的事情,我们已经做了半年的时间,我们所谓的阳光下的数据流通,我们做了去中心化的数据流动,因为我们讲互联网,KK,他就是提的去中心化,因特网就是因为去中心化使他更健壮。社交网站之所以能打败门户网站就是因为去中心化。
数据流通领域能不能去中心化,这就是我们的回答,我们现在做的一种模式,我们经常在计算机和架构里讲到数据和控制分离的模式,这体现在非常多的地方,比如大家下载BT电影的时候,大家在上网的时候DNS的协议,大家在打电话的时候的协议,都是跟承载分离,我们通过控制承载分离,蓝色的线条代表数据在各个参与方之间P2P的流动,这种流动是通过数据平衡平台解决,他是预设好的协议,通过去中心化的方式解决信任问题,这就是我们现在做的P2P的数据交换的协议。具体而言,他还有三个延伸环节,我们经常遇到的不是简单的数据从一点交换到另外一点,很多时候数据不可能做原始交换,大家都有需求,比如4S店跟运营商之间有一个需求,4S店有第一方数据,运营商手里的数据在广告业里是第三方数据,第一方数据和第三方数据怎么胶合起来,运营商不把数据给到4S店,4S店也不给运营商,怎么办?我们现在做了一种模式,他是一种可用不可建带一个数据交换平台,双方有两个钥匙,这两个钥匙做一个数据加密放在平台上做碰撞,碰撞好了的结果可以带走。如果大家理解密码学,这里面一定有一个环节,这个平台一定是非常公正的平台,否则他可能跟某一方串联,这样吧全部数据碰撞出来。这个平台一定是受信任的机构,我们有政府背书的中介平台可以做这样的事情。
第二,怎么实现数据产权保护,数据是可以无损流动的,你把数据流动到另外一方怎么证明是你的,一个是通过数据保护方式还有通过区块链的方式我们不用用区块链保护数据本身还是保护数据的所有权,他的流通记录是通过区块链的方式做。最后一个环节怎么把第三方利益吸引进来,我接触这个行业很多年了征信里有很多花招可以玩儿,运营商要求征信机构提供信息的时候,征信条例里有两条要双授权,用户要授权征信机构获取这个数据,同时用户要授权数据提供方获取数据。
这里有很多问题,用户的授权并不是那么直观有时候仅仅提供一个授权号,但是这个真实与否没有人验证,我们经常通过微博微信的帐号登陆授权某件事情做,实际上我们在做一个协议,这个协议完美的实现这一点,这个协议非常好的一点,对于他授权的力度,我使用什么数据和时间有明显的要求,这样不会造成我让隐私权利过大导致收益受到影响,现在很多征信机构要求一个用户提供一个征信的依据是什么,要把你接受银行卡,信用卡每个月帐单邮箱密码给我要么把电话服务密码给我,这样我可以模拟你到那个地方把这个东西爬上来,这会造成授权过大,我们通过这个方式实现一个合适的授权。
在今年年初跟中关村产业联盟一起,还有一些小伙伴们一起成立数据交换联盟,叫数据专委会,我们是希望能够促进数据资源在阳光下的流动。因为我们在这个委员会里,有很多企业,有一些希望做大数据应用的企业,有一些是提供大数据资源的企业,都要保护自己和第三方的权益,怎么做到这点,有一个非常好的技术协议做到这一点。这是联盟自己运营的数据超市Data Hub,大家可以在网上看到我们的合作企业数据源。他实现了一件什么事情,他实现一个流通平台标准协议,我们希望通过这个数据构建一个数据互联网倡导数据在阳光下有序的流动,我们提供了工具包括通过客户端SDK的方式降低,协议是开源的协议,而且整个客户端都是开源的,在这中间没有任何隐藏的东西在里面,这是开源的例子和API,现在马上可以用,我们可以提供更多更便利的SDK,更好服务体验和更多数据源,我们希望他变成数据的互联网。现在已经有一些可以流动的数据,这是整个合作伙伴,他们有的是数据需求方,有的是提供方有的能提供专业化数据的资源。我的介绍就到这里。
网站题目:中关村大数据产业联盟何鸿凌:阳光下的数据流通
链接分享:http://ybzwz.com/article/sooghi.html