声稿师-AI语音识别与润色，辅助法师讲稿转录听打神器！

工具介绍6个月前更新管理员

1,665 0 0

今有佛弟子为辅助法师讲法转录，借用先进的AI语音识别模型，封装了一个音频转录与润色的神器，并在Github开源，欢迎大家使用！

https://github.com/jusway/Voicer

声稿师 Voicer – 长音视频语音识别系统

一个基于阿里云通义千问3 ASR Flash模型的长音视频语音识别系统，支持超过3分钟音频的智能分段识别和上下文管理，并提供GUI界面。

✨ 特性

由于Qwen3-ASR-Flash模型API的限制(文件小于10MB，时长小于3分钟)，本项目基于Silero进行语音活动检测(VAD)和分割，将长音频分割为多个小于3分钟的片段，然后调用Qwen3-ASR-Flash识别，前面的音频识别结果作为后面识别的上下文，如此保证识别长音视频的连贯性。
支持常见音视频格式的输入，包括但不限于MP3、WAV、M4A、FLAC、MP4、AVI、MOV等。

🚀 快速开始

环境要求

Python 3.11+
FFmpeg（用于音频转换）
阿里云DashScope API Key

GUI 界面（wxPython）

项目提供 wxPython 图形界面：

# 启动 GUI（推荐用 uv）
uv run python run_gui.py

# 或使用模块方式
uv run python -m src.gui_wx.app

安装

克隆项目

git clone <repository-url>

安装依赖

# 使用uv（推荐）
uv sync

依赖自动下载

首次启动时会自动下载 Silero VAD 模型到 external/silero_vad/
ffmpeg 优先使用系统 PATH；若未安装，可设置环境变量 FFMPEG_ZIP_URL 为“包含 ffmpeg.exe 和 ffprobe.exe 的 ZIP 包”的直链，脚本会自动下载并解压到 external/ffmpeg/

设置方式（临时生效，推荐在命令行中使用）：

Windows PowerShell

$env:FFMPEG_ZIP_URL="https://example.com/ffmpeg.zip"; uv run python -m scripts.download_external

Windows CMD

set FFMPEG_ZIP_URL=https://example.com/ffmpeg.zip && uv run python -m scripts.download_external

macOS/Linux Bash

export FFMPEG_ZIP_URL=https://example.com/ffmpeg.zip && uv run python -m scripts.download_external

或者直接执行（若已安装 ffmpeg 并在 PATH 中，无需设置该变量）：

uv run python -m scripts.download_external

🛠️ 故障排除

常见问题

FFmpeg未找到

# Windows (使用Chocolatey)
choco install ffmpeg

# macOS (使用Homebrew)
brew install ffmpeg

# Linux (Ubuntu/Debian)
sudo apt install ffmpeg

📄 许可证

本项目采用 MIT 许可证 – 详见 LICENSE 文件

🤝 贡献

欢迎提交Issue和Pull Request！

📞 支持

如果您遇到问题或有建议，请：

提交 Issue

🙏 致谢

阿里云通义千问 – 提供ASR API服务
Silero VAD – 语音活动检测模型
FFmpeg – 音频处理工具

注意：使用本系统需要阿里云DashScope API Key，请确保遵守相关服务条款和使用限制。

工具介绍

文章版权归作者所有，未经允许请勿转载。

输入法用佛教名词词库

学佛软件工具介绍

10个月前

07560

实现word文档较精确繁简转换方案

工具介绍

10个月前

06690

香光尼眾佛學院圖書館：佛教字辭典

工具介绍

10个月前

06810

佛教英语词典及工具网站

外语佛教工具介绍

10个月前

09750

暂无评论

暂无评论...

声稿师-AI语音识别与润色，辅助法师讲稿转录听打神器！

https://github.com/jusway/Voicer

声稿师 Voicer – 长音视频语音识别系统

✨ 特性

🚀 快速开始

环境要求

GUI 界面（wxPython）

安装

🛠️ 故障排除

常见问题

📄 许可证

🤝 贡献

📞 支持

🙏 致谢

香光尼眾佛學院圖書館：佛教字辭典

没有更多了...

相关文章

输入法用佛教名词词库

实现word文档较精确繁简转换方案

香光尼眾佛學院圖書館：佛教字辭典

佛教英语词典及工具网站

暂无评论