大数据的历史演变

发表时间: 2024-01-10 10:37

在谷歌上搜索一下,你很快就会意识到,没有人能真正认同“大数据”这个词的真正起源。一些人认为,自1990年初以来,它就已经存在了,并将其普及归功于被认为是“大数据之父”的美国计算机科学家John R Mashey。

其他人则认为这是Roger Mougalas和奥莱利媒体集团在2005年创造的一个术语。有些人甚至会说,“大数据”的概念直到2010年代才真正兴起。但无论你支持这个术语的哪个起源,我们都认可的一件事是,大数据实际上已经存在了很多年。大数据并不是一个全新的事物,也不是过去二十年才出现的东西。不过,可以说,在过去十年中,它确实变成了一个时髦词。

几个世纪以来,人们一直在尝试使用数据分析和分析技术来支持他们的决策过程。


大数据的古老历史

人类储存和分析数据的最早例子是计数棒,它可以追溯到公元前18000年!Ishango Bone于1960年在现在的乌干达被发现,被认为是史前数据存储的最早证据之一。

旧石器时代的部落人们会在木棍或骨头上刻上记号,以记录贸易活动。他们会比较树枝和凹槽来进行基本的计算,使他们能够预测他们的食物供应可以持续多久。

然后,在公元前2400年,算盘出现了。第一个专门用于计算的专用设备。第一个库也是在这个时候出现的,它代表了我们对海量数据存储的第一次尝试。

公元前300年左右的古埃及人已经试图获取亚历山大图书馆中所有现存的“数据”。此外,罗马帝国过去常常仔细分析其军队的统计数据,以确定其军队的最佳分布。

但是,在近代,它已经彻底改变了现代商业环境。


20世纪的大数据

第一个大型数据项目创建于1937年,在《社会保障法》成为法律后,由Franklin D. Roosevelt政府下令进行。政府必须跟踪2600万美国人和300多万雇主的缴费情况。IBM获得了为这个庞大的簿记项目开发穿孔读卡机的合同。

第一台数据处理机出现在1943年,由英国人开发,用于在第二次世界大战期间破译纳粹代码。这种名为Colossus的设备能够以每秒5000个字符的速度搜索截获的信息中的模式,将完成任务所需的时间从几周缩短到几小时。

然后,在1965年,美国政府决定建立有史以来第一个数据中心,以存储超过7.42亿份纳税申报单和1.75亿组指纹。他们决定通过将这些记录转移到必须存储在单一位置的磁性计算机磁带上来实现这一目标。该项目后来被放弃,但被普遍认为是电子数据存储时代的开端。


互联网时代和大数据的曙光

1989年至1990年间,Tim Berners-Lee 和 Robert Cailliau 在为欧洲核子研究中心工作期间创建了万维网,并开发了HTML、URL和HTTP。广泛和容易获取数据的互联网时代已经开始,到1996年,数字数据存储已比在纸上存储信息更具成本效益。

域名google.com在一年后的1997年注册,并将于次年的1998年启动,为搜索引擎向数据主导地位的攀升以及许多其他技术创新的发展打响了第一枪,包括机器学习、大数据和分析领域。

1998年,Carlo Strozzi开发了NoSQL,这是一个开源关系数据库,它提供了一种存储和检索数据的方式,这种方式与关系数据库中传统的表格方法不同。然后,在1999年,Hal R. Varian和Peter Lyman的第一版《有多少信息》试图量化当时世界上可用的数字信息的数量。


信息时代

自21世纪初以来,互联网和网络提供了独特的数据收集和数据分析机会。随着网络流量和在线商店的扩张,雅虎、亚马逊和eBay等公司开始通过查看点击率、IP特定位置数据和搜索日志来分析客户行为。这开启了一个充满可能性的新世界。

2005年,Roger Mougalas将Big Data称为“大数据”,他指的是当时几乎不可能使用传统商业智能工具来管理和处理的大量数据。同年,能够处理大数据的Hadoop诞生了。Hadoop基于一个名为Nutch的开源软件框架,后来与谷歌的MapReduce合并。

大数据彻底改变了整个行业,改变了人类的文化和行为。它是信息时代的产物,正在改变人们锻炼、创作音乐和工作的方式。

例如,在医疗保健领域,大数据正被用于绘制疾病爆发地图和测试替代疗法。NASA利用大数据探索宇宙。音乐产业用大数据研究取代了直觉。公用事业公司利用大数据研究客户行为。Nike使用健康监测可穿戴设备来跟踪客户,并就他们的健康状况提供反馈。网络安全正在使用大数据来阻止犯罪。


大数据的未来

自从大数据首次出现以来,它的定义、用例、技术和利用其价值的策略在不同的行业发生了重大变化。云计算、量子计算、物联网(IoT)、人工智能等方面的创新将使大数据进一步发展,因为我们将找到利用其潜力的新方法。


本文转载自 大数据简史- 雪兽软件

更多精彩推荐请访问 雪兽软件