大数据(Big Data)是指规模巨大、类型繁多、价值密度低的数据集合。这些数据通常来自各种来源,如社交网络、物联网设备、传感器、交易记录等,它们具有以下四个特点,通常被称为“4V”:
1. Volume(体量):数据量巨大,通常是PB(皮字节)或EB(艾字节)级别的数据量。
2. Velocity(速度):数据产生和流动的速度非常快,需要实时或近实时处理。
3. Variety(多样性):数据类型多样,包括结构化数据(如数据库记录)、半结构化数据(如XML、JSON)和非结构化数据(如文本、图片、视频等)。
4. Value(价值):数据的价值密度低,意味着在大量数据中,有价值的信息所占的比例很小。
大数据分析旨在从这些海量、复杂的数据中提取有价值的信息和知识,为决策提供支持。大数据技术在商业、科研、医疗、政府管理等多个领域都有广泛的应用。