在日常工作和生活中,语音转文字的需求越来越普遍。无论是写文章、做笔记,还是录制会议纪要,将语音快速转化为文字都能极大提升效率。然而,市面上大多数语音转文字工具都需要联网,将你的音频数据上传到云端处理——这意味着你的隐私数据会被第三方平台获取。
今天推荐的开源项目 Handy(https://github.com/cjpais/Handy)完美解决了这个问题:它是一款完全免费、开源、可离线运行的语音转文字桌面应用,数据永远不会离开你的电脑。
项目介绍
Handy 是一款跨平台(Windows、macOS、Linux)的桌面应用程序,基于 Tauri + React + Rust 构建,核心语音识别引擎使用了 OpenAI 的 Whisper 模型和 Parakeet V3 模型。整个转录过程在你的本地电脑上完成,无需任何网络连接,从根本上保护了用户隐私。项目星数超过 19,000,采用 MIT 开源协议,完全免费使用。
核心特色功能
- 完全离线运行:所有音频处理和语音识别都在本地完成,无需上传到任何服务器
- 多模型支持:支持 Whisper Small/Medium/Turbo/Large 等多种模型,可根据硬件配置自由选择
- GPU 加速:支持 NVIDIA GPU 加速,转录速度更快
- CPU 优化:Parakeet V3 模型专为 CPU 设计,普通电脑也能流畅运行
- Silence 过滤:使用 Silero VAD(语音活动检测)自动过滤静音片段
- 快捷键操作:全局快捷键一键开始/停止录音,录音结束后文字自动粘贴到当前输入框
- Raycast 集成:支持 Raycast 扩展,可管理录音历史、切换语言和模型
- 跨平台支持:Windows、macOS、Linux 均可安装使用
安装步骤
macOS 安装
推荐使用 Homebrew 一键安装:
brew install --cask handy
Windows 安装
使用 winget 安装:
winget install cjpais.Handy
或者直接从 GitHub Releases 页面下载对应系统的安装包:https://github.com/cjpais/Handy/releases
Linux 安装
从 GitHub Releases 下载 AppImage 或 deb 包进行安装。
使用方法
- 启动 Handy 应用程序
- 首次使用需要授予麦克风和辅助功能权限
- 在设置中配置你喜欢的全局快捷键
- 打开任意需要输入文字的应用(如微信、Word、浏览器搜索框)
- 按下快捷键开始录音,说出你想转录的内容
- 再次按下快捷键停止录音,Handy 会自动将语音转换为文字并粘贴到你的光标位置
Handy 还支持命令行参数控制已运行的实例:
handy --toggle-transcription # 开始/停止录音
handy --start-hidden # 启动时隐藏主窗口
handy --debug # 开启调试模式
适用场景
- 写作者:口述想法,直接转为文字输入
- 会议记录:会议中实时录音,会后快速转为文字
- 隐私敏感用户:不希望语音数据上传到云端的用户
- 残障人士:需要语音输入辅助的用户
- 开发者:需要快速将技术思路口述转为笔记
开源协议
Handy 采用 MIT 开源协议,代码完全开放,可自由 Fork 和二次开发。项目地址:https://github.com/cjpais/Handy
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END









暂无评论内容