数据结构与算法

6款必试的开源AI工具推荐

发表时间: 2024-05-11 09:51

AI工具，我已经分享了很多，如类似ChatGPT的对话工具，以及基于GPT开发的在线创作工具，绘图、写作、总结等等。因为之前有讨论过开源和闭源哪一种方式的AI工具发展的会更好，就想着整理一些开源的AI工具吧，本期给大家分享几款好用的开源AI项目！

01

clone-voice

一款AI视频翻译配音、带web界面的声音克隆工具，支持字幕编辑、添加配音，可以使用你的音色或任意声音来录制音频，免费开源、简单好用！

CV声音克隆工具，你可以通过它使用任何人类的音色，将一段文字合成为使用该音色说话的声音，或者将一个声音使用该音色转换为另一个声音。

使用非常简单，下载预编译版本后，双击“app.exe”即可打开一个web界面，鼠标点点就能用。

它支持中、英、日、韩、法、德、意等16种语言，可在线从麦克风录制声音。想要得到好的合成效果，建议录制时长5秒到20秒，发音清晰准确，不要存在背景噪声。它的英文效果很棒，中文效果也OK。

注：该项目所用模型均源于“github.com/coqui-ai/TTS”，模型协议为CPML只可用于学习研究，不可商用！

02

screenshot-to-code

一款简单的应用程序，支持将屏幕截图转换为代码（HTML/Tailwind CSS，或React/Bootstrap/Vue）。

只需给AI看一眼截屏，便能直接生成代码。该项目可借助 GPT-4 Vision 的能力，直接给你将屏幕截图转换为 HTML/Tailwind CSS，并利用 DALL-E 3 的图像生成能力，生成外观相似的图像。

只需要放入屏幕截图，就可以将其转换为干净的代码。你甚至可以输入URL来克隆实时网站！

注：该应用程序有一个React/Vite前端和一个FastAPI后端。使用它，你需要拥有自己的OpenAI密钥，且你的密钥必须可以访问GPT-4 Vision。

03

Animated Drawings

一款很有趣的AI工具，它可以借助人工智能技术，让绘画作品动起来。我已经在网络上刷到很多成品了，有兴趣的小伙伴可以玩玩儿！

你只需上传完绘画作品，就可以在线编辑作品人物的身体节点，调整不同动作，将其生成动图，让画作中的人物“活”起来！

它的使用方法很简单，上传-编辑-提取-标记-生成。具体操作如下↓

①点击首页的“Get Started”按钮上传图片。

注：你可以随便找一张想用于创作的手绘草稿图，说是自己画一个。画的时候要注意：确保白纸没有褶皱，没有阻挡；光线充足，拍照时可清晰捕捉到整个画面；在画作上不要添加任何暴力信息。

你也可以直接用平台提供的4张Demo图片。

挑选好自己的画作之后，点击右侧的图片上传按钮“Upload Photo”，把绘画作品上传上去。

②编辑图片：上传作品后，你需要调整线框，使画中人物在线框中能完整呈现出来，

调整完成后，点击“Next”进入下一步。

③提取图像细节：对图片进行细节提取，用画笔与橡皮擦，使人物与黑色背景分离，便于后续处理。

（如果你上传的图片边界分明，或是直接用的平台Demo图片，这一步可以直接跳过）。

④标记画作人物：鼠标拖拽，用点线将画中人物的头部与躯体标明出来。

完成以上四个步骤后，就可以让画作中的人物动起来了。

该项目提供32种动作可供选取，包含跳舞、玩耍、跳跃、行走等不同肢体动作。

PS：我玩意儿有点不好控制！

04

VideoCrafter

一款开源的AI工具，可直接基于文本，快速生成与编辑视频。可用于高质量视频生成的开放式扩散模型。

VideoCrafter 是一个开源视频生成和编辑工具箱，用于制作视频内容。它可以帮助你快速生成高质量的视频，你可以在 Discord/Floor33 上制作你自己的视频。它目前包括 Text2Video 和 Image2Video 模型。

05

Alog

一款支持iPhone、Apple Watch 的语音日记应用，在 GitHub 15 开源，带有AI功能，可以实现录音之后的语音转文字，以及AI总结两个功能，让你每日不停的碎碎念之后，还能有一篇完整的文字日记。

不想写日记，还想记录怎么办？Alog是一款AI语音日记，界面简洁，只需要在想说话的时候，用它录音就行了。它会自动帮你把语音转化为文字，然后保存在手机里。

你可以通过不同的提示词，让ALog帮你写出一篇很标准的日记，额，它会帮你写很多内容！

06

AI Anything

让人人都可以快速创建ChatGPT小工具。大部分ChatGPT相关的工具本质上就是调整prompt，AI Anything 基于MIT协议开源，让你也能成为技术人员。

它可以帮你几秒创建一个GPT小工具，提供10万多个图标，允许配置AI的角色；你可以创建无数个输入框；支持模板插值，prompt更加灵活；

拥有干净的UI，流畅的动画，支持夜间模式；支持 Nuxt3 驱动；支持多语言；支持创意工坊，分享并发布；可关联上下文，进行聊天模式交互；无需登录即可本地使用所有功能！

这是一个免费的项目，不提供apiKey，代码开源。

好了，今天的分享就到这里啦，个别软件可能无法直接使用，安装配置比较麻烦，有时间小伙伴们可以自行研究研究！

热门阅读

推荐阅读