软件里内置了 5 个可选模型,大家可以根据自己的需求选:
- tiny:体积最小,运行速度最快,识别精度相对一般,适合追求效率、对精度要求不高的场景(比如快速转写会议录音要点);
- base:速度和精度的平衡款,日常使用最常用,大部分场景下都能满足需求;
- small:精度比 base 更高,运行速度会稍慢一点,追求更好识别效果又不想等太久的话选它准没错;
- medium:识别精度进一步提升,但对设备计算资源要求更高;
- large:精度最高,但硬件门槛也最高,运行速度也偏慢。
![图片[1]-Windows 音视频转文字工具 v1.0-松子软件](https://www.61ku.com/wp-content/uploads/2026/01/PixPin_2026-01-20_18-24-56.webp)
![图片[2]-Windows 音视频转文字工具 v1.0-松子软件](https://www.61ku.com/wp-content/uploads/2026/01/PixPin_2026-01-20_18-48-26.webp)
这里重点推荐大家选「small 模型」!识别精度足够高,日常转写视频台词、音频笔记都够用~ 至于 medium 和 large 模型,因为它们需要显卡支持,还要额外装显卡驱动,操作麻烦不说,打包后的安装包也会变大,所以我只保留了 CPU 版本,不用折腾显卡,普通电脑就能流畅运行。
第一次使用先下载模型!!
下载地址
© 版权声明
THE END




暂无评论内容