探索一周万星的文本转语音开源项目:科技新趋势

发表时间: 2024-06-04 08:35

上周的热门开源项目让我想起了「图灵测试」,测试者在不知道对面是机器还是人类的前提下随意提问,最后根据对方回复的内容,判断与他们交谈的是人还是计算机。如果无法分辨出回答者是机器还是人类,则说明机器已通过测试,具有人类的智力水平。

虽然现在大模型的回答还充满 AI “味”,可以“一眼识破”,但 GitHub 上有个开源项目:ChatTTS,它根据文本生成的语音,已经可以做到“以假乱真”,不单单是我这么觉得,一周飙升了 1w+ Star,已经足以说明大家对它的认可。

作者为了限制 ChatTTS 生成的语音,在 4 万小时模型的训练过程中添加了少量额外的高频噪音,并尽可能压缩了音质,让其更好分辨出来,从而防止不法分子用它进行诈骗等违法行为,看来生成效果已经好到作者自己都“害怕”的地步了

还有位开发者(lihaoyun6)因为看不惯 macOS 的录屏软件收费,就自己动手做了一个轻巧的 macOS 屏幕录制工具:QuickRecorder,它不仅功能齐全还免费开源。如果你觉得自己桌面有点单调,这有个小工具(RunCat_for_windows)可以在任务栏上显示一只奔跑的小猫,它会陪着你一起加班和写代码。文生图的效果很看提示词的质量,Omost 让你仅需一条极简的描述就能生成一张细节满满的图片,比如“一个有趣的卡通蝙蝠侠与小丑战斗”。

最后,推荐一个用当下最新的前端技术栈构建的管理后台模版:soybean-admin 和一个非常漂亮的终端文件管理器:superfile

1. 开源新闻

1.1 强大的对话式文本转语音模型:ChatTTS

该项目是专门为对话场景设计的文本转语音模型,支持中、英双语。它不仅能够生成自然、流畅的语音,还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效果很好,几乎听不出 AI “味”。

import ChatTTSfrom IPython.display import Audiochat = ChatTTS.Chat()chat.load_models(compile=False) # 设置为True以获得更快速度texts = ["在这里输入你的文本",]wavs = chat.infer(texts, use_decoder=True)torchaudio.save("output1.wav", torch.from_numpy(wavs[0]), 24000)

GitHub 地址→github.com/2noise/ChatTTS

2. 开源热搜项目

2.1 直接使用 ChatTTS 的 WebUI:ChatTTS-ui

主语言:PythonStar:2.1k周增长:2k

该项目为 ChatTTS 提供了开箱即用的本地网页界面,可以直接在本地浏览器中使用 ChatTTS,支持文字合成语音、中英文、数字混杂等功能,并提供了 API 接口。

GitHub 地址→github.com/jianchang512/ChatTTS-ui

2.2 轻巧的 macOS 屏幕录制工具:QuickRecorder

主语言:SwiftStar:2.6k周增长:500

这是一个用 SWiftUI 编写、仅 10MB 的 macOS 屏幕录制工具,它只为做好录屏这一件事,不仅免费且功能丰富,支持窗口录制、应用录制、录制移动设备、窗口声音内录、鼠标高亮、隐藏桌面文件等功能。

GitHub 地址→github.com/lihaoyun6/QuickRecorder

2.3 开源的在线办公套件:Univer

主语言:TypeScriptStar:5.1k周增长:1k

这是一个功能丰富、易于集成的在线办公套件,它提供了类似 Google 文档、幻灯片(开发中)和表格的功能,支持富文本、表格公式、数据验证、国际化等功能。

GitHub 地址→github.com/dream-num/univer

2.4 清新优雅的管理后台模板:soybean-admin

主语言:TypeScriptStar:8.3k周增长:300

该项目是采用 Vu3、Vite5、Pinia 和 UnoCSS 等技术栈构建的管理后台模板,它不仅拥有漂亮的界面,还有清晰的项目结构、严格的类型检查、统一的代码规范,内置丰富的主题配置、国际化方案、页面组件,并且支持移动端。

GitHub 地址→github.com/soybeanjs/soybean-admin

2.5 极简提示词的文生图工具:Omost

主语言:PythonStar:2.6k周增长:2k

该项目基于 LLM 的编程能力帮用户自动完善文生图的提示词,可以根据用户输入的简短提示词生成高质量的图片,还支持图片局部修改等功能,比如将图片中的龙变成恐龙,极大地降低了编写文生图的门槛,无需复杂的提示词即可生成满意的图片。

GitHub 地址→github.com/lllyasviel/Omost

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 在 Windows 任务栏飞奔的“小猫”:RunCat_for_windows

主语言:C#

这是一个用 C# 写的小工具,它会在 Windows 任务栏显示一只奔跑的小猫动画,CPU 使用率越高它跑得越快。

项目详情→hellogithub.com/repository/7c37c2e3bf3142e7bf5891f5070e3606

3.2 非常漂亮的终端文件管理器:superfile

主语言:Go

这是一个现代终端文件管理器,为命令行文件操作提供了一个直观且漂亮的界面。它默认采用 Vim 风格的快捷键操作,还支持插件和主题自定义。

项目详情→hellogithub.com/repository/d791057ece4f4662be25202c21405a27

4. 结尾

以上就是本期「GitHub 热点速览」的全部内容,希望你能够在这里找到自己感兴趣的开源项目,如果你有其他好玩、有趣的 GitHub 开源项目想要分享,欢迎来 HelloGitHub 与我们交流和讨论。

往期回顾

- END -