“绿色图表示每个网民人均每个月下载流量,1998年每个网民一个月只需要一兆流量,2003年就需要一百兆,2008年就是1g。右边的图是讲全世界互联网流量累计达到1eb所需要的时间,2001年需要一年,2004年需要一个月,而今年只需要几天。”
“大数据有网络数据、企事业单位数据、政府数据,网络数据自媒体数据,比如社交网络、博客、微博等。有日志数据,比如搜索引擎,大家上网等等都会留下很多足迹。还有富媒体数据,视频、音频等等,每天的数据量很大。大数据无所不在。图中是美国的一家医院,一年能收500tb数据,伦敦有200个交通摄像头,每天是8tb数据,伦敦才200个,北京有几十万个摄像头,数据量要比伦敦大得多了。”
“google把5000万美国人频繁的搜索跟美国疾控中心流感数据进行比较,一个地方发生流感肯定有很多人在网上搜索这些词汇,因此根据这些词汇出现频率可以判断这个地方出现流感,google在2009年的甲型h1n1流感出现时,它比美国疾控中心提前几个月发布公告。google前雇员创办了climate公司,从美国气象局获得几十年的天气数据,并与各地的农业状况、土壤状况关联起来,尚有需求的农场主说“谁问我明天种什么能赚钱,我告诉你,如果我说错了,我的赔偿要比保险公司还要更高。”到现在为止,据说他们从来还没赔过,不像我们国家的农民只是根据简单的判断,今年猪肉贵了,明年大量养猪,明年猪肉就便宜了,然后年猪肉又贵了。”
谷歌研发云计算和大数据的时间跟江燕公司差不多,他们的技术水平也很高。
如果不是后来杭雨跟国家合作,创建了耕耘科技,而耕耘科技又跟中兴华为北大南大等企业和高校合作,极大的提升了技术基础,说不定江燕已经被谷歌超过了。
“说国外的例子,大家感受可能没那么深,那么我们就说说国内的例子。相信大家都知道,我国率先开发云计算和大数据的企业是江燕公司,而且它们的战绩赫赫。零八年的救灾预测灾难事件,相信没有人不知道吧,那件事情令我非常震惊,且记忆深刻。”吴院长说话时,目光投向杭雨。
杭雨感受到不少目光转移到自己身上,微微一笑,表现出宠辱不惊的神态。
“说到这里,其实我很想问一下当事人,也就是杭先生,请问你们当时是如何进行灾难预测的,为什么之后你们放弃了这项应用。”吴院长说道。
马上有人递话筒给杭雨,更多人看向他。
杭雨没想到这么快轮到自己发言,心里颇为紧张,伸手接过话筒,笑着站起来道:“当时我们一方面跟气象局合作,得到他们搜集的自然数据,另一方面号召广大的微博用户,让他们关注身边的自然动态,也就是灾难前常发生的一些现象。”
“地震前就有很多预兆,比如井水翻花冒泡,忽升忽降,无雨水变浑,变色变味又难闻。牛马骡羊不进圈,猪不吃食狗乱咬,鸭不下水岸上闹,鸡飞上树高声叫,冰天雪地蛇出洞,老鼠痴呆搬家逃,兔子竖耳蹦又撞,鱼儿惊慌水面跳,蜜蜂群迁闹轰轰,鸽子惊飞不回巢”
“在广大热心用户的积极协助下,我们每天都能得到很多类似的关键信息。把这些信息的发出地址进行匹配,对比,我们就能大概判断出该地是否会发生灾难。我们的工作人员做了专门的匹配率机制,匹配率超过60%,我们就会联系气象局,让他们着重对该地进行调查。”
“零八年预测成功,其实有着很大的侥幸。”杭雨说道。