桌面助手:从卖萌到生产力的进化之旅

发表时间: 2024-07-25 10:10




小狮子和大眼夹


一位男子回家的时候听到了屋里传来男人的鼾声,他没有推开门,而是离开了居住的城市。30年后,遇到曾经的妻子。妻子问他当年为何不告而别。男子说出了理由后,妻子哭道:那是瑞星的小狮子



这是是一个来自二十年前的冷笑话,如果各位能看懂,那么恭喜你,你已经是个互联网老登了。


不过在那个上网还需要拨号,下载按KB计算费用的时代,这个卖萌的小狮子不知道慰藉了多少打工人的心灵,和它一样的,还有打开Word 97版一定会跳出来的那个曲别针——大眼夹


和小狮子相比,大眼夹不仅能卖萌,它还可以提供一些小建议。比如它会告诉你如何写一封信,如何使用Word上的排版工具,来调整字体大小。



只不过这一切,它都是预编程好的,很快用户就发现,只要以"亲爱的"开头,它就跳出来指导你写信。所以大多时候,它所提供的帮助都和用户想要的南辕北辙。



时不时的调皮动画,也让大眼夹成为了注意力分散的罪魁祸首。就这样,这个微软搞出来的小东西,在WindowXP出来以后,就逐渐淡出了历史舞台。





谁是大眼夹AI时代的继承者?


不过通过大眼夹可以发现,当时微软想为刚接触Word的人准备一个AI助手,不仅能提供各类小Tips,还可以在生产力上提供一定的帮助。但很可惜限于当时的技术,最终做出了一个只给人留下"卖萌"印象的曲别针。


当时微软内部也知道这个情况,甚至把大眼夹的内部开发代号取名了"Fxxking Clown"(该死的小丑),只不过当时的比尔盖茨的夫人——梅琳达·盖茨在背后力挺这个项目,所以才造成了大眼夹生不逢时的结局。


比尔盖茨和梅琳达盖茨


自此,生产力助手也就销声匿迹了,剩下的就只有卖萌为主的桌面宠物。而这两年的AI大爆发,似乎让我们看到了真·生产力助手的可能。


那么市面上有没有一款AI驱动的助手呢?我们寻摸了一番,发现字节最近推出的豆包桌面版声音很大,于是我们下载下来,仔细地体验了一波。


和上个世纪的小助手们一样,它也可以固定在桌面,只不过ta是以聊天框的形式出现,透过这个聊天框,就可以完成提问,生成等一系列操作。



先看看接入了AI的助手生成的图片咋样?


豆包桌面版在生成图片的时候,提供各种模板,也可以直接选择生成图片的风格,这里我们直接来上一手难度,选择3D格式,输入提示词:


图片风格为「3D」毛毡艺术,羊毛毡娃娃,善良的爷爷,蓝色米黄色的衣服,超高清画质



从生成结果来看,这个老爷爷不仅非常符合提示词,在光影表现部分也不错。



让我惊讶的是,豆包除了能生成,还可以进行局部重绘,比如我选择手部,然后添加提示词:


一支玫瑰花


除了重绘,还有局部消除,选定一个部分,豆包就会根据消除的部分,自动补全周边的部分,生成一张合理的照片。


用了一圈下来,有了豆包,基本上不用在网上找什么图片素材了,想要什么风格,只要输入提示词,都能搞定,要觉得不好,ta还能改!


在豆包桌面版中,还能浏览网页,在B站或者油管的时候,它就会自动总结视频内容,并且生成视频内容的思维导图,甚至是吃播的UP主,豆包都能安排的明明白白的。


在最右侧,它还会总结的内容,生成带有时间戳的章节预览,视频的进度也会实时体现在这里。因此,想要快速了解一个视频的时候,只要看下豆包的总结,通过时间戳定位到自己想看的部分就行。相比以前快进或者整部看完的学习方式,要快上很多倍。


对于一些科研小伙伴,看文献都是常事,我们找选题的时候,也经常会看一些外网的资讯,但用Chrome自带的翻译,就给你整个页面直接替换成中文,想要看原文的时候,又需要切回去,在豆包这里,则是保留了原文和译文,方便对照着看,非常方便,当然传统手艺——提炼总结,也都保留下来。



对于科研党来说,另外一个非常好的地方是,豆包提供了PDF伴读功能,把PDF丢进去,对照翻译,选词解释,针对PDF进行提问,学习工作的效率直接拉满。



除了总结,豆包对于划词也有"特殊优化",在浏览任何内容的时候,只要选中的部分,还可以让豆包帮助进行进行扩展,转换成小红书文案等一系列操作,只能说这一波,还是豆包的产品经理是懂用户,懂生产力,懂摸鱼的。



如果觉得功能不够多,你甚至还可以去设置里面添加更多的技能!



当然,如果你不想改变上网的习惯环境,豆包目前也有浏览器插件,功能和桌面版没差。


在生产力场景上,豆包有一个非常强大的功能,就是“深度搜索”——根据全网几十个网页,全方面,细致地去了解一个事情,现在普通的搜索引擎已经被我扔到回收站了,基本上有什么问题,都是通过深度搜索来解决,省去了之前通过不同网页之间交叉验证的过程,这可帮我省了不少时间!

另外生成文字内容方面就不多说了,现在大模型基本上都很好用,不过豆包有个特点,那就是模板多,且可以分阶段去生成文章,像从创意,大纲,到初稿,每个阶段都可以由作者充分把控。



比如我想写一篇关于AI无人机的公众号文章,ta先会调用模板,问我生成文章的类型,然后在根据全网的深度搜索找到的15个参考来源,在生成一个大纲,如果这个大纲不合适,我还可以增删,或者修改



如果没问题,豆包就会基于这个大纲来生成一篇符合相应平台的的文章。



对于摸鱼,豆包也有自己"独到的见解",在多个智能体中,有一个叫做"爱聊天的的小宁",每天和她聊天,都能让我这个单身狗体验一把赛博女友的美好!




AI时代

我们应该多一些这样的助手


经过几天的使用,我可以说,豆包桌面版的确是一款真·AI驱动的助手!无聊的时候,可以逗它,甚至还能谈一场赛博恋爱。在生产力方面,它不仅能从深度搜索几十个网页,还能汇总它们,根据它们的内容来提问。在浏览网页,或者看PDF的时候,ta都能以一个助手的身份出现。


在生成内容方面,ta生成图片不仅能以假乱真,风格各异,还能局部删除和修改,文字内容生成方面,也可以逐步生成和修改文字内容。


根据不同需求,进行扩写,这些当时曲别针想具有的内容,现在已经可以很好的实现了。我现在唯一的需求就是,如果豆包不只是固定在屏幕一端,而是出现一个同小狮子,曲别针一样的Icon浮在桌面上,那就更好了。



在大模型爆发约两年后的今天,大模型想要有更大的突破已经变得更加困难,算力,电力,训练数据都已经成为这条路上的巨大障碍。


但好消息是大模型的能力已经足够大家日常使用,而大家日常对AI觉察度不高,可能就是缺少好的产品出现。


希望豆包这样不再局限于聊天机器人的AI产品越来越多吧。