BI大数据的特点

网友投稿 705 2022-11-30

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

BI大数据的特点

规模性(Volume)

大数据的特征首先就是数据规模大。

从前MP3时代,一个小小的MB级别的MP3就可以满足很多人的需求,然而随着时间的推移,存储单位从过去的GB到TB,乃至现在的PB、EB级别。随着信息技术的高速发展,数据开始爆发性增长。社交网络(微博、推特、脸书)、移动网络、各种智能工具,服务工具等,都成为数据的来源。

淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的日志数据超过300TB。迫切需要智能的算法、强大的数据处理平台和新的数据处理技术,来统计、分析、预测和实时处理如此大规模的数据。

多样性(Variety)

广泛的数据来源,决定了大数据形式的多样性。大数据可以分为三类:

一是结构化数据,指的是可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。如财务系统数据、信息管理系统数据、医疗系统数据等;

二是非结构化的数据,指的是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。如视频、图片、音频等;

三是半结构化数据,是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。如HTML文档、JSON数据、邮件、网页等。

有统计显示,目前结构化数据占据整个互联网数据量的75%以上,而产生价值的大数据,往往是这些非结构化数据。

高速性(Velocity)

数据的增长速度和处理速度是大数据高速性的重要体现。与以往的报纸、书信等传统数据载体生产传播方式不同,在大数据时代,大数据的交换和传播主要是通过互联网和云计算等方式实现的,其生产和传播数据的速度是非常迅速的。

另外,海量数据的背后带来的是更大的挑战,即如何快速计算分析大数据已经成为当下热门的话题。举个常见的例子,我们经常使用百度搜索去找自己想要的商品,那么百度是在成千上万的结果中毫秒级的找到符合你关键词的选项呢,这就需要大数据的高速处理能力。

价值性(Value)

大数据的核心特征是价值,其实价值密度的高低和数据总量的大小是成反比的,即数据价值密度越高数据总量越小,数据价值密度越低数据总量越大。

任何有价值的信息的提取依托的就是海量的基础数据。当然,目前大数据背景下有个未解决的问题,如何通过强大的机器算法更迅速地在海量数据中完成数据的价值提纯。

真实性(Veracity)

上一篇:智能化运维管理前置系统(设备智能运维)
下一篇:先天基因智能化运维管理(先天基因智能化运维管理系统)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~