6款必试的开源AI工具推荐

发表时间: 2024-05-11 09:51

AI工具,我已经分享了很多,如类似ChatGPT的对话工具,以及基于GPT开发的在线创作工具,绘图、写作、总结等等。因为之前有讨论过开源和闭源哪一种方式的AI工具发展的会更好,就想着整理一些开源的AI工具吧,本期给大家分享几款好用的开源AI项目!


01

clone-voice

一款AI视频翻译配音、带web界面的声音克隆工具,支持字幕编辑、添加配音,可以使用你的音色或任意声音来录制音频,免费开源、简单好用!



CV声音克隆工具,你可以通过它使用任何人类的音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。



使用非常简单,下载预编译版本后,双击“app.exe”即可打开一个web界面,鼠标点点就能用。



它支持 中、英、日、韩、法、德、意等16种语言,可在线从麦克风录制声音。想要得到好的合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。它的英文效果很棒,中文效果也OK。



注:该项目所用模型均源于“github.com/coqui-ai/TTS”,模型协议为CPML只可用于学习研究,不可商用!





02

screenshot-to-code

一款简单的应用程序,支持将屏幕截图转换为代码(HTML/Tailwind CSS,或React/Bootstrap/Vue)。



只需给AI看一眼截屏,便能直接生成代码。该项目可借助 GPT-4 Vision 的能力,直接给你将屏幕截图转换为 HTML/Tailwind CSS,并利用 DALL-E 3 的图像生成能力,生成外观相似的图像。



只需要放入屏幕截图,就可以将其转换为干净的代码。你甚至可以输入URL来克隆实时网站!



注:该应用程序有一个React/Vite前端和一个FastAPI后端。使用它,你需要拥有自己的OpenAI密钥,且你的密钥必须可以访问GPT-4 Vision。



03

Animated Drawings

一款很有趣的AI工具,它可以借助人工智能技术,让绘画作品动起来。我已经在网络上刷到很多成品了,有兴趣的小伙伴可以玩玩儿!



你只需上传完绘画作品,就可以在线编辑作品人物的身体节点,调整不同动作,将其生成动图,让画作中的人物“活”起来!



它的使用方法很简单,上传-编辑-提取-标记-生成。具体操作如下↓


①点击首页的“Get Started”按钮上传图片。

注:你可以随便找一张想用于创作的手绘草稿图,说是自己画一个。画的时候要注意:确保白纸没有褶皱,没有阻挡;光线充足,拍照时可清晰捕捉到整个画面;在画作上不要添加任何暴力信息。

你也可以直接用平台提供的4张Demo图片。

挑选好自己的画作之后,点击右侧的图片上传按钮“Upload Photo”,把绘画作品上传上去。



②编辑图片:上传作品后,你需要调整线框,使画中人物在线框中能完整呈现出来,



调整完成后,点击“Next”进入下一步。



③提取图像细节:对图片进行细节提取,用画笔与橡皮擦,使人物与黑色背景分离,便于后续处理。



(如果你上传的图片边界分明,或是直接用的平台Demo图片,这一步可以直接跳过)。



④标记画作人物:鼠标拖拽,用点线将画中人物的头部与躯体标明出来。



完成以上四个步骤后,就可以让画作中的人物动起来了。



该项目提供32种动作可供选取,包含跳舞、玩耍、跳跃、行走等不同肢体动作。


PS:我玩意儿有点不好控制!


04

VideoCrafter

一款开源的AI工具,可直接基于文本,快速生成与编辑视频。可用于高质量视频生成的开放式扩散模型。



VideoCrafter 是一个开源视频生成和编辑工具箱,用于制作视频内容。它可以帮助你快速生成高质量的视频,你可以在 Discord/Floor33 上制作你自己的视频。它目前包括 Text2Video 和 Image2Video 模型。


05

Alog

一款支持iPhone、Apple Watch 的语音日记应用,在 GitHub 15 开源,带有AI功能,可以实现录音之后的语音转文字,以及AI总结两个功能,让你每日不停的碎碎念之后,还能有一篇完整的文字日记。



不想写日记,还想记录怎么办?Alog是一款AI语音日记,界面简洁,只需要在想说话的时候,用它录音就行了。它会自动帮你把语音转化为文字,然后保存在手机里。



你可以通过不同的提示词,让ALog帮你写出一篇很标准的日记,额,它会帮你写很多内容!


06

AI Anything

人人都可以快速创建ChatGPT小工具。大部分ChatGPT相关的工具本质上就是调整prompt,AI Anything 基于MIT协议开源,让你也能成为技术人员。



它可以帮你几秒创建一个GPT小工具,提供10万多个图标,允许配置AI的角色;你可以创建无数个输入框;支持模板插值,prompt更加灵活;



拥有干净的UI,流畅的动画,支持夜间模式;支持 Nuxt3 驱动;支持多语言;支持创意工坊,分享并发布;可关联上下文,进行聊天模式交互;无需登录即可本地使用所有功能!



这是一个免费的项目,不提供apiKey,代码开源。

好了,今天的分享就到这里啦,个别软件可能无法直接使用,安装配置比较麻烦,有时间小伙伴们可以自行研究研究!