作者:纪晓风(高考志愿填报专家) 发布时间:2024-12-14 00:32:10 阅读94次
大数据,听起来很高大上,但到底是什么意思呢?其实,大数据就是指那些传统数据处理应用软件难以处理的大量、复杂的数据集合。这些数据包括结构化的数据库表格,也包括非结构化的文本、图片、视频等。它们的特点就是4个V:Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Veracity(真实性要求高)。特征 | 说明 | 示例 |
---|---|---|
数据量大(Volume) | 数据的大小决定所考虑的数据的价值和潜在的信息。 | 社交媒体上的每天产生的数十亿条消息。 |
数据类型多样(Variety) | 数据类型的多样性,包括结构化、半结构化和非结构化数据。 | 文本、图片、视频、音频等。 |
处理速度快(Velocity) | 指获得数据的速度,也包括数据处理的速度。 | 实时分析股票交易数据以进行投资决策。 |
真实性(Veracity) | 数据的质量,包括准确性和可信度。 | 通过多个数据源验证数据的真实性。 |
价值密度低(Value) | 在海量数据中,有价值的信息可能很少。 | 在大量的监控视频中,只有少数片段包含有用信息。 |