一觉醒来,每秒能输出500个tokens的大模型Groq刷屏全网。
堪称是“世界上速度最快的LLM”!
相比之下,ChatGPT-3.5每秒生成速度仅为40个tokens(token,中文名称为令牌,是一种特殊的计算机术语,常用于网络通讯的数据的管理和校验。简单地说,token就是一种代表数据元素的标识符,它可以代表某个特定的数据类型,如数字、字符串、数组等等)。
有网友将其与GPT-4、Gemini对标,看看它们完成一个简单代码调试问题所需的时间。
没想到,Groq完全碾压两者,在输出速度上比Gemini快10倍,比GPT-4快18倍。
最关键的是,任何人可以免费用!
有人评价说:“Groq的问世是AI领域的一大突破,它不仅提高了处理速度,也为AI应用的实际部署和广泛应用开辟了新的可能性……也许未来算力就像水电一样便宜,人工智能也会无处不在。”
01
Groq模型究竟有多快?
周星驰电影《功夫》中有句经典台词:“天下武功,无坚不摧,唯快不破!”
可见,一个“快”字,往往就能决定一件事物的好坏。
那么,刚刚诞生的超级王炸人工智能新产品Groq模型究竟有多快?
每秒500 tokens!
什么概念?
下面这张图进行了专业解释:
仔细看红框内的图示部分,Groq模型的响应速度可谓“一枝独秀”。
网友表示:这速度简直就是飞机vs走路。
有人说,Groq的回复速度比眨眼睛还要快!直接碾压英伟达GPU!
也有人说,Groq LPU搭配Meta Llama 2 70B能在7分钟内就能生成与莎士比亚《哈姆雷特》相同数量的单词,比普通人的打字速度快75倍!
需要注意的是,Groq并没有创造出全新的AI模型,而是像是在为现有的模型装上了一双“翅膀”,让它们飞得更快!
通过使用自家开发的LPU芯片,Groq让AI的响应速度达到了前所未有的高度。
就像比赛中的赛车,远远抛弃了其他竞争对手。
这种速度的提升,让等待AI回复的过程,从煎熬变成了享受。
02
AI开启“百家争鸣”时代
2024年正月还未过完,科技界就已经发生了4件大事:
第一件事:英伟达在一周前宣布推出Chat With RTX,这是一款智能聊天机器人应用项目,类似OpenAI的ChatGPT和百度的文心一言,用户可在本地构建人工智能聊天应用。
第二件事:OpenAI在三天前推出了王炸级文生视频大模型Sora,它能够仅仅根据提示词,生成60s的连贯视频,“碾压”了行业目前大概只有平均“4s”的视频生成长度,引发“行业大地震”!
第三件事:谷歌AI推出Gemni1.5版本,可处理超过100万个tokens的输入窗口,直接碾压GPT-4,最牛之处还在于,它能一眼识破Sora视频是否由AI生成!
第四件事:就是今天我们正在谈论的事,最快大模型Groq凭借其响应速度和可能无需GPU的新技术,将开启新的“神话”!
一年之前,也是在中国新年期间,ChatGPT进入大众视野,显示出在自然语言交互领域的重大突破。一年之后,Sora则在AI视频领域一举登上行业巅峰,Groq则以响应速度最快领跑全行业。
其实,不管是ChatGPT、GPT-4还是最近爆火的Sora和Groq,可以预见的是,人工智能已经进入到了名副其实的“百家争鸣”时代。
03
普通人如何搭乘“AI疾驰的列车”?
AI究竟有哪些“本领”?为何它每一次迭代升级都能引发全球热议?
AI聊天、AI绘画、AI音乐……生活中,AI的影子无处不在;
AI智能导航、机器人看孩子照顾老人、机器人“上天入地”;
生成式AI可将输入内容,变成小说、电影、艺术作品;
生物医疗、无人驾驶、气象预报……AI技术市场规模巨大;
……
“AI革命”逐步来临,对人类社会将产生颠覆式影响。
“很快我们将不再讨论人工智能,因为人工智能已经融入到生活中,无处不在。”
近一两年来,人工智能的成果此起彼伏,在AI带来飞速变革的时代,无论是国家,还是个人,必须握紧AI的缰绳,稍不留神,就会被甩下!
在全面进入人工智能时代的进程中,迅猛发展的科技狂潮并不可怕,可怕的是你沉浸在过去的安乐世界里而不自知,还拒绝改变和学习!
如果你不想被AI这辆“高速疾驰的列车”甩下,请现在就立刻开始学习!
科技变革的潮流不可怕,可怕的是看到这种变革,一边故意“把脖子缩在衣领里”,成为一个“装在套子里的人”,一边还说着自己实在无能为力!
想改变,就趁现在!