探索人工智能与大数据的交汇点
发表时间: 2024-02-23 06:38
走进人工智能四大数据。
数据不是一个新概念,每个计算机应用程序都有与之相关的数据。有人发现今天获取的数据如此之多,多到令人害怕,并且几乎涉及多数人生活的方方面面,有时人们甚至没有意识到这一点。此外硬件的进步和算法的改进使得数据成为当今AI的通用资源,数据的收集方法正在逐渐从全手工变为全自动。
·从技术的角度来说,大数据指的是大量的、复杂的计算机数据,庞大和复杂到应用程序不能通过使用额外存储或提高计算机性能来处理的大数据。大数据意味着数据存储和操作的革命,它影响能从数据中能获取什么。
·从人类的角度来看,计算机使用不同的格式来存储大数据,但对计算机来说数据只是0和1组成的数据流。根据如何产生和使用数据,可以将数据视为结构化数据和非结构化数据两种。
→有的数据结构清晰,比如清楚的知道它包含什么以及哪里能找到需要的数据片段。
→而有的数据是非结构化的,比如知道它包含什么,但却不知道它是如何组织的。
数据结构通常是经过设计的,有选择地收集数据并将它记录在正确的位置。例如可能想在特定数据库的特定表的特定列中存放购买某个产品的人数,就像图书馆一样,如果知道自己需要什么数据就可以立即找到它。
非结构化数据包括图像、视频和声音等记录,可以使用非结构化的形式存储文本,以便能标记它的大小、日期和内容类型等特征。