首页 > 焦点 > 

大数据的四个典型特征 kag一是庞大的数据量

2025-05-14 14:54:13  来源:星轨工坊
摘要:大数据(Big Data)是大数指“无法用现有的软件工具提取、存储、个典搜索、型特共享、大数分析和处理的个典海量的、复杂的型特数据集合。”业界通常用4个V(即Volume、大数Variety、个典Value、型特Velocity)来概括...

大数据是大数指“无法用现有软件工具提取、存储、个典搜索、型特共享、大数分析和处理的个典海量复杂数据集。”业界通常用四个V(即成交量、型特品种、价值、速度)来概括大数据的特征。kag

一是庞大的数据量。到目前为止,人类生产的所有印刷材料的数据量为200PB(1PB=210TB),而人类在历史上所说的所有文字的数据量约为5EB(1EB=210PB)。目前典型的个人电脑硬盘容量为TB,而一些大企业的数据量接近EB。kag

第二,数据类型很多。这种多样性还允许将数据分为结构化数据和非结构化数据。与过去易于存储的结构化数据相比,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等。这些各种类型的数据对数据处理能力提出了更高的要求。kag

第三,价值密度低。该值与数据总量成反比。以视频为例。对于一个小时的视频,在连续监控中,有用的数据可能只有一两秒钟。如何通过强大的机器算法更快地完成数据的价值净化,成为大数据背景下亟待解决的问题。kag

第四,处理速度快。这是大数据区别于传统数据挖掘的最显著特征。根据IDC《数字宇宙》报告,预计2020年全球数据使用量将达到35.2ZB。面对如此海量的数据,数据处理的效率是一个企业的生命。kag

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    知识

    中国著名足球运动员逝世

    据北京市足协消息,中国著名足球运动员、教练员,北京市足球运动协会终身成就奖获得者张坤岳于2025年5月2日因心脏病突发,在北京不幸逝世,享年88岁。张坤岳1937年出生于北京市,自幼热爱足球,天赋出众

    热点

    AI性能提升1.9倍 英特尔至强6公布MLPerf基准测试结果

    英特尔至强6性能核处理器在MLPerf推理v5.0基准测试的六个关键项目中,性能表现卓越。相较于第五代至强处理器,AI性能实现了高达1.9倍的显著提升。2025年4月3日,MLCommons公布了最新