大数据概念的简明阐述

发表时间: 2021-12-07 14:47

知识MORE分享——科技篇


Big Data 大数据——大量的、种类繁多的数据阵列,使用特殊的计算机技术进行分析。

大数据来源——物联网、社交网络、博客、大众媒体、设备和传感器的读数(例如来自气象站的数据)、统计数据、档案、数据库。它们存储在云存储器中的数据库 - “数据湖”中。

大数据分析已经在许多领域得到应用——用于确保安全、诊断和预防疾病、预测事故和灾害。在业务和营销方面,基于大数据,预测客户行为,优化成本和生产流程,评估偿付能力,预测员工解雇。

“秘密”的使用示例

“当你去看心理医生时,他是根据自己的主观意见给你诊断的,而不是大数据分析。这必须改变。顺便说一下,教育领域也让我感到惊讶。我们正在努力让每个人都以同样的方式学习。在我看来,大数据可以提高教育效率:例如,如果一个孩子有某种特殊的学习能力,我们可以为他优化和个性化学习。”

细微差别

大数据的描述基于三个主要特征:

  • 量——据估计,大数据包括每天超过 150 GB 的信息量;
  • 速度 - 处理速度必须很高并在必要时增加,否则信息将变得无关紧要;
  • 多样性(variety)——不同性质的数据的集合:文本、音频和视频文件,结构化和非结构化。

大数据的来源

“大数据”一词出现在 1990 年代被广泛使用。然而,信息量不断增长的问题很早就开始提出。因此,作为 1880 年前美国人口普查的结果,获得的数据量如此之大,需要 8 年的时间进行分析。然后工程师 Herman Hollerith 创建了一个制表器,可以自动处理数字和字母信息,并在纸带上生成结果。


大数据分析

大数据分析,主要涉及到的事实,它的分析使用无法进行评估和验证算法,不透明-目前还不清楚是采取什么样的数据考虑,为什么和如何的结论作出。此外,大量不同信息的收集、存储和处理为泄露和泄露机密创造了许多机会。