华体会备用网在线讯:大数据,主要的使用场景在几个方面,一方面针对我们的客户,怎么样可以更优化地了解客户的使用场景,分析使用状况。另一方面,针对我们内部的运营,最后是风险的降低。针对大数据的挖掘,数据从何而来呢?当大家讲步入大数据时代,实际上我们处理的数据主要来自三方面,第一方面,传统结构化的数据。随着今天技术的提升,随着信息来源的增加,容量大大提升,怎么样可以有效地帮助客户处理有关的结构化信息是一个新难点,我们有新的技术。今天硬件发展的速度很快,CPU速度很快,但是I/O是不是跟得上,现在有一些新的技术,像闪存的技术,IBM也收购了一家TMS的技术,我们也增加了自主的技术,可以增加数据处理的速度。
另一方面,非结构化数据。因为移动互联网的产生,会有越来越多的,像微博、电邮、网页越来越多的信息,也有一定的价值,这些数据产生的量非常庞大,我们怎么样在大数据里有效地利用这些数据,来帮助我们挖掘一些有用的信息。
第三,流数据。我们现在有很多传感器,不管你喜欢不喜欢手机的信息,监控的信息,通讯的信息等等,这些流媒体产生的数据也非常庞大,但是也有一定的价值,我怎么样有效地抓取。这在大数据来讲是第一个使用场景,要挖掘新的数据来源。
在这个图里我们很好地把整个架构列举出来,从下往上看,下面我们看到大数据的信息来源就像刚才所讲的,除了传统那些数据以外,每一个企业也会有各种不同的企业的资源管理系统、人事系统、财务系统、客户系统等等。同时现在移动互联网的诞生等等,我们都会有更多更新的数据流,刚才讲到结构化的传统数据,新一代的非结构化的数据,还有流数据等等的产生。从下提升到上一个层次,我们怎么样可以利用IBM软件解决方案,提供一个非常好的大数据分析的平台。从大数据里面抓取一些有用的信息,这是非常重要的。信息不抓取的话反正也在你身边,如何抓取有用的信息呢?我们提供了几种方式。
从左往右看,Streams,IBM Streams软件提供了可以帮助各位抓取流数据、分析流数据,它的分析速度非常快。有时候流数据不需要非常精准的分析,大概找到它的模式就可以了。我们有一个Streams数据可以帮忙分析。
接下来Insight,现在我们讲大数据里面,很多时候大家会联想到Hadoop,但是Hadoop是一个开源的软件,IBM提供了企业版的Hadoop架构,叫做BigInsights,BigInsights可以帮你实行Hadoop应用,提供更高可用、性能更好的优化平台。非结构化数据来讲,我们可以把数据,不管是流数据产生放在Insight里面,然后做进一步的非结构化的分析,也可以提供很好的解决方案。