1、虽然术语“大数据”相对较新,但收集和存储大量信息以进行最终分析的行为已经很久了。
2、这个概念在 21 世纪初获得了动力,当时行业分析师 Doug Laney 将现在主流的大数据定义表达为三个 V:1.卷,组织从各种来源收集数据,包括业务交易,社交媒体和来自传感器或机器到机器数据的信息。
3、在过去,存储它将是一个问题 – 但新技术(如 Hadoop)减轻了负担。
【资料图】
4、2.速度,数据以前所未有的速度流入,必须及时处理。
5、RFID 标签,传感器和智能电表正在推动近乎实时处理数据的需求。
6、3.品种,数据有各种格式 – 从传统数据库中的结构化数字数据到非结构化文本文档,电子邮件,视频,音频,股票报价数据和金融交易。
7、在 SAS,我们在大数据方面考虑两个额外的维度:1.变化性,除了速度和数据种类的增加之外,数据流还可能与周期性峰值高度不一致。
8、社交媒体中有什么趋势吗?每日,季节性和事件触发的峰值数据负载可能难以管理。
9、非结构化数据更是如此。
10、2.复杂,今天的数据来自多个来源,这使得难以跨系统链接,匹配,清理和转换数据。
11、但是,有必要连接和关联关系,层次结构和多个数据链接,否则您的数据可能会迅速失控。
本文到此分享完毕,希望对大家有所帮助。
Copyright 2015-2022 南极评测网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com