体验Intel AIGC：酷睿轻薄本如何驾驭大语言模型？

发表时间: 2023-08-31 20:35

一、前言：AI领域不应忘记Intel的存在

今年最为火爆的产业无疑就是AIGC，也就是以AI为主导的生成式内容，包括ChatGPT、AI画图、AI作诗等功能。可以说，只能玩游戏而不支持AIGC的显卡已经不符合时代的需求。

如今NVIDIA 在AI时代一飞冲天，可能会让很多同学误认为只有NVIDIA显卡才支持Stable Diffusion这类的AI应用。

但事实上，还有一家厂商对于AI的投入力度并不逊于NVIDIA，而且在多年前就开始布局AI，它就是芯片巨头Intel公司。

在即将上市的14代酷睿Meteor Lake处理器中，就设计了VPU（Visual Processing Unit）AI单元，这将是Intel首次在CPU中放入独立的AI硬件单元。集成在CPU内部的好处就是能够拥有极低的延迟，在处理一些低负载AI时要优于GPU。

更令人想象不到的是，VPU还能对Stable Diffusion提供硬件加速，无需昂贵的独立显卡。这也就意味即将上市的14代酷睿轻薄本将会以更加完整的姿态的拥抱AI。

为了让更多的Intel用户也能体验到AI，Intel还推出了AI 应用 Demo “英特尔大语言模型”，它可以帮助处理一些日常生活以及工作中的一些任务。

这个Demo特别对混合架构的第12/13代酷睿处理器进行了优化，也就是市面上主流的Intel处理器轻薄本就能直接运行，并且会有相当棒的体验。

不止CPU，在GPU领域Intel也做了非常多的努力。年初，Intel推出了基于OpenVINO，AI绘图开源模型Stable?Diffusion可以使用开源图片编辑软件GIMP，让Intel Arc GPU能通过输入关键词实现创意绘图。

不久之后，Intel又推出了基于OpenVINO PyTorch后端的方案，能让Arc A770/A750 GPU直接支持Stable Diffusion WebUI，并且在加速能力方面远强于同价位的NVIDIA GPU。

下文中我们将会进行对比测试，让大家能更为直观的了解Intel Arc GPU的AI性能。

二、英特尔大语言模型体验：13代酷睿轻薄本轻松搞定

这里我们选择了一台通过Intel Evo认证的轻薄本-- ThinkPad X1 Yoga来进行测试，它搭载的是Intel 酷睿i5-1340P处理器。

英特尔大语言模型应用拥有“聊天助手”、“情感分析”、“中文翻译”、“故事创作”、“生成大纲”、“信息提取”、“美食指南”、“旅游规划”等八大模块，并且还有写代码的能力。

在“聊天助手”中，我们尝试让AI写一首关于安史之乱的七言律诗，虽然结果并不算好，但仍有部分诗句让人眼前一亮，可作为创作借鉴。

“生成大纲”功能，你只需要说出自己想写怎样的作品，AI就会给你一个故事大纲。

“中文翻译”可以翻译一段中文，而且你的提问，AI也是用英文回答。

其他功能模块，有兴趣的同学可以自行摸索体验。

三、Stable Diffusion出图测试：Arc A770 16GB大幅领先RTX 4060

目前Windows端的Stable Diffusion WebUI大多是采用“绘世”启动器，不过可惜的是这款启动器目前只支持NVIDIA GPU，AMD GPU根本无法识别，Intel Arc GPU可以被识别，但却无法启用硬件加速。

因此想要使用Intel显卡来加速Stable Diffusion，需要运行在Linux环境下才能实现。

当然，也并不是说必须得安装一个Linux系统，更简单的途径是使用Docker（容器）。

本次我们的测试即是基于Docker版Stable Diffusion WebUI，参与测试的显卡包括A/I/N三家的4款2000元价位甜点显卡。

可以看到，Arc A770 16GB的确可以支持硬件加速，GPU利用率99%，显存占用超过了8GB，功耗也跑满了190W TGP。

为了将显存占用控制在8GB之下，以便让其他显卡也能顺利测试，我们将出图分辨率设置为640*480。

测试结果多少还是让人有一些意外。

如果从游戏性能表现来看，RTX 4060比2张Arc GPU都要强不少，但是Stable Diffusion出图更依赖显存，这方面RTX 4060由于被阉割的比较厉害，特别是显存位宽只有128Bit，容量也只有8GB，因为并不是特别适合用来加速Stable Diffusion。

AMD这边，虽然RX 6700 XT拥有12GB大容量显存、192Bit位宽，但由于AMD目前对AI支持力度不够，导致旗下GPU在这方面的表现不尽如人意。

两张Intel GPU的表现有些超越预期，就算是定位更低的Arc A750成绩也与 RTX 4060接近。Arc A770的表现更是大幅超越了对手，领先幅度高达20%。

另外，我们这是限制了出图分辨率。如果使用更高分辨率，或者安装一些其他插件进行AI画面修复，8GB显存是远远不够的，Arc A770 16GB的优势也会更大。

四、总结：AI画图不妨考虑2000元的Intel Arc A770 16GB

此前，当有同学让我推荐能跑AI的显卡时，我会根据预算推荐对应的N卡，但如今的话，我也会考虑I卡。

众所周知，Stable Diffusion对于显存容量和速度有非常苛刻的需求，8GB及以下容量显存会有非常多的限制，比如使用高分辨率出图。

因此，想要认真玩AI画图，16GB或者24GB显存会带来更多的玩法和更好的体验，这也导致了二手RTX 3090 24GB显卡的热销。

当然，即便是2手RTX 3090，其价格也不是普通消费者能够承受的。

纵观当前的GPU市场，Intel Arc A770 16GB可以说是专为AI而生的显卡。这款显卡以低于RTX 4060的售价，提供了后者2倍的显存容量和显存位宽，可以一定程度上治疗好AI玩家的Stable Diffusion显存焦虑症。

虽然Arc A770 16GB游戏性能与RTX 3060处于同一水准，但其AI出图的加速性能却比RTX 4060还要强20%以上。

相比之下，NVIDIA拥有16GB显存的显卡型号相对较少而且售价高昂，比如RTX 4080高达9000元的售价让不少AI玩家望洋兴叹。即便是不久前推出的RTX 4060 16GB，其售价也在4000元左右，几乎2倍于Arc A770 16GB。

因此，对于预算不足的AI玩家来说，Intel Arc A770 16GB在性价比方面的确胜多大多数显卡。

至于AMD，其AI之路还很漫长！

另一方面，AI应用往往都需要强大的算力，而性能并非轻薄本的优势，所以很少有人会把轻薄本和AI联系起来。

Intel则让我们看到了不一样的一面，配备13代酷睿P系列的Evo认证轻薄本上，英特尔大语言模型可以运行得非常流畅，无论写诗、翻译，还是写代码，抑或生产力辅助，都能快速给出相当有帮助的结果，可以大大提升工作效率。

无论是日常办公，还是外出差旅，随手拿出便携的Evo轻薄本，都可以完成一些轻负载的AI推理工作，这在以往可是不敢想象的。