行业垂直门户网站

设为首页 | 加入收藏

您当前的位置:华体会备用网在线 > 正文

李永辉:大数据与分析新产品发布及实践路线图

华体会备用网在线  来源:赛迪网    2013/5/28 16:32:31  我要投稿  

华体会备用网在线讯:大数据,主要的使用场景在几个方面,一方面针对我们的客户,怎么样可以更优化地了解客户的使用场景,分析使用状况。另一方面,针对我们内部的运营,最后是风险的降低。针对大数据的挖掘,数据从何而来呢?当大家讲步入大数据时代,实际上我们处理的数据主要来自三方面,第一方面,传统结构化的数据。随着今天技术的提升,随着信息来源的增加,容量大大提升,怎么样可以有效地帮助客户处理有关的结构化信息是一个新难点,我们有新的技术。今天硬件发展的速度很快,CPU速度很快,但是I/O是不是跟得上,现在有一些新的技术,像闪存的技术,IBM也收购了一家TMS的技术,我们也增加了自主的技术,可以增加数据处理的速度。

另一方面,非结构化数据。因为移动互联网的产生,会有越来越多的,像微博、电邮、网页越来越多的信息,也有一定的价值,这些数据产生的量非常庞大,我们怎么样在大数据里有效地利用这些数据,来帮助我们挖掘一些有用的信息。

第三,流数据。我们现在有很多传感器,不管你喜欢不喜欢手机的信息,监控的信息,通讯的信息等等,这些流媒体产生的数据也非常庞大,但是也有一定的价值,我怎么样有效地抓取。这在大数据来讲是第一个使用场景,要挖掘新的数据来源。

在这个图里我们很好地把整个架构列举出来,从下往上看,下面我们看到大数据的信息来源就像刚才所讲的,除了传统那些数据以外,每一个企业也会有各种不同的企业的资源管理系统、人事系统、财务系统、客户系统等等。同时现在移动互联网的诞生等等,我们都会有更多更新的数据流,刚才讲到结构化的传统数据,新一代的非结构化的数据,还有流数据等等的产生。从下提升到上一个层次,我们怎么样可以利用IBM软件解决方案,提供一个非常好的大数据分析的平台。从大数据里面抓取一些有用的信息,这是非常重要的。信息不抓取的话反正也在你身边,如何抓取有用的信息呢?我们提供了几种方式。

从左往右看,Streams,IBM Streams软件提供了可以帮助各位抓取流数据、分析流数据,它的分析速度非常快。有时候流数据不需要非常精准的分析,大概找到它的模式就可以了。我们有一个Streams数据可以帮忙分析。

接下来Insight,现在我们讲大数据里面,很多时候大家会联想到Hadoop,但是Hadoop是一个开源的软件,IBM提供了企业版的Hadoop架构,叫做BigInsights,BigInsights可以帮你实行Hadoop应用,提供更高可用、性能更好的优化平台。非结构化数据来讲,我们可以把数据,不管是流数据产生放在Insight里面,然后做进一步的非结构化的分析,也可以提供很好的解决方案。

分享到:
北极星投稿热线:陈女士 13693626116 邮箱:chenchen#bjxmail.com(请将#换成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

热点关注
国网826号文解读

国网826号文解读

昨天国网公司下发了《关于进一步严格控制电网投资的通知》(国家电网办【2019】826号文)。文中提出了“三严禁、二不得、二不再”的投资建设思路。个人认为,这不仅仅是一个文件,而是国网公司整体发展战略转型的一个标志。作为世界上最大的电网企业,国网公司每年因投资建设所需的采购数额巨大,对电

--更多
最新新闻
新闻排行榜

今日

本周

本月

深度报道
相关专题

关闭

重播

关闭

重播

Baidu
map