大数据(Big Data)是指在传统数据处理软件难以处理的庞大数据集。它涉及到从不同来源、不同格式、不同结构的数据中提取有价值信息的过程。大数据的概念包含了三个关键要素:
1.数据量:大数据指的是海量的数据,通常是以太阳光记录的所有信息量(1TB = 10^12 bytes)或数百万个页面的大纲(每页包含数百万个字)。
2.多样性:这些数据可能来自不同的来源、格式和结构,包括文本、图像、音频、视频和结构化数据等。
3.价值:大数据的价值在于其中包含有用的信息,这些信息对业务或行业有着重要的影响。
与传统数据相比,大数据具有以下特点:
1.类型多样性:不仅包括结构化数据,还包括非结构化文本和图像等。
2.格式多样:不仅包括文本和图像文件,还包括音频和视频等多媒体文件。
3.年龄分布广泛:不仅包括当下的用户,还包括历史用户的数据。
4.处理速度要求高:因为涉及大量的数据和非结构化数据的多样性,所以需要高效的处理速度来满足需求。