AI 是计算机科学的一门学科,它研究能够使用类似于某些人类认知过程所涉及的功能来承担和解决各种复杂任务的系统开发:学习、推理、进行推理和预测、优化、任务自动化等。大多数 AI 系统旨在获得这些“智能”技能中的一项或一小部分,以执行特定任务。这与通用人工智能 (AGI) 的概念形成鲜明对比,后者旨在从更广泛的意义上复制人类水平的智能,以便单个系统能够解决广泛的活动。许多专家声称尚未达到真正的 AIG,尽管最先进的 LLMs 和自动驾驶汽车是可能介于“狭义”AI 和 AGI 之间的系统示例。
AI 已经发展得如此之快,以至于它不再被描绘为计算机科学的一个子领域,而是作为一门独立的学科。因此,它有几个密切相关的子领域,在下面的一些概念中探讨其中的一些子领域。
2. AI 算法和模型
AI 算法和 AI 模型是一样的吗?有一点不同。算法是一组解决问题的指令,在 AI 算法中,这些指令旨在让计算机能够自行学习如何解决问题。同时,AI 模型就像一个预构建的盒子,它通过暴露于数据来包含学习(或训练)过程的结果:将 AI 模型视为一种现成的解决方案,可以根据新数据进行预测或执行任务。
AI 中最大的子领域无疑是机器学习 (ML),它侧重于从数据中学习以执行图像分类、估算销售额和检测可疑银行交易等任务的系统。ML 通常与 AI 互换使用,但如上图所示,ML 仍然只是 AI 的一部分,还有其他子领域。尽管如此,当今最先进和最先进的 ML 系统形式旨在与其他 AI 领域强烈重叠。
ML 和 AI(更具体地说,ML)模型的构建中的一个中心概念是训练数据。这些数据用于教模型如何识别模式和进行预测。例如,通过处理由不同鸟类图像组成的大量训练数据,逐渐建模会学习识别数据中有助于区分一个物种与另一个物种的模式,并最终完成其设计的特定任务,例如图像分类。
训练数据就像 ML 模型用来学习和“构建自身”的燃料
深度学习是 ML 的一个高级分支,专门处理更具挑战性的问题和复杂的数据,使用模拟人类和动物大脑运作方式的人工神经网络架构。深度学习模型的主要应用之一是计算机视觉任务,其中包括使机器能够理解视觉信息,例如识别图像或视频中的对象。
NLP 是另一个面向应用的 AI 领域,与计算机视觉一样,它与当今的深度学习架构紧密耦合:它专注于与处理、理解和生成人类语言(文本和语音)相关的任务,从而帮助实现人机通信。示例 NLP 任务包括分析和分类文本、摘要、翻译和问答。
生成式 AI 是指经过训练以创建新内容(例如文本、图像或音乐)的 AI 系统,这些系统是根据现有数据学习模式的结果。AI 的这一领域主要建立在先进的深度学习架构之上,我们今天目睹的可用应用程序和工具爆炸式增长,使 AI 功能更接近公众,尤其是与创造力相关的 AI 功能。
大型语言模型 (LLMs) 是规模巨大的 AI 系统:它们在庞大的文本数据集(多达数十亿个文档)上进行训练,以前所未有的水平理解和生成类似人类的语言。ChatGPT 和 Claude 等工具是在现实世界中部署的 LLMs。
负责任的 AI 是一个研究主题,专注于为 AI 系统的道德开发和部署开发框架,以确保公平、透明和问责制。最新的 AI 系统(如 LLMs、高级计算机视觉系统等)的功能越高,就越应该与负责任的 AI 实践相关,以确保以正确的方式使用这些强大的工具。
用于对工作申请进行分类的有偏见的 AI 系统示例:训练数据因性别而存在偏见
负责任的 AI 的核心概念,具体来说是在公平和道德的镜头下。当 AI 系统产生不公平的结果或决策时,就会出现 AI 偏差,这通常是由于其训练数据中存在偏差。例如,如果一个经过训练的接受或拒绝银行贷款申请的系统已经接受了大多数低收入客户被拒绝贷款的数据的训练,那么该系统可能会在对未来客户进行分类时无意中产生偏差。好消息是,有一些技术可以帮助减轻这些偏见。