当前位置: 首页 > news >正文

没有cpolar:会议记录手忙脚乱;有了cpolar:CapsWriter语音转文字轻松搞定

文章目录

      • 前言:
    • 1. 软件与模型下载
    • 2. 本地使用测试
    • 3. 异地远程使用
      • 3.1 内网穿透工具下载安装
      • 3.2 配置公网地址
      • 3.3 修改 config 文件
      • 3.4 异地远程访问服务端
    • 4. 配置固定公网地址
      • 4.1 修改 config 文件
    • 5. 固定 tcp 公网地址远程访问服务端

前言:

在多设备办公场景中,语音转文字工具的跨设备协作一直是用户痛点。CapsWriter-Offline 作为一款优秀的离线语音输入工具,能够在无网络环境下实现高效语音转文字,但很多用户在使用时都会遇到一个问题:如何实现手机、电脑等多设备之间的无缝协作,尤其是在没有公网 IP 的情况下?

传统的解决方法通常需要依赖第三方云同步服务,这不仅可能导致数据泄露,还会受到网络状况的影响。某自由撰稿人就曾抱怨:“我想用手机语音输入内容到电脑文档,尝试了各种同步工具,不是延迟严重就是需要联网,完全达不到理想效果。”

cpolar 内网穿透服务的出现,为这个问题提供了完美解决方案。它就像是在你的各种设备之间架起了一座 “离线数据桥梁”,让 CapsWriter-Offline 的语音转文字功能突破设备限制,实现跨设备实时协作。

cpolar 的工作原理其实很容易理解。你的主设备就像一个 “语音处理中心”,CapsWriter-Offline 是中心的 “离线识别引擎”。没有 cpolar 的时候,这个中心只能处理本机输入。cpolar 相当于给中心装了 “多设备接收天线”,让其他设备可以通过局域网或互联网发送语音指令,由中心统一处理并返回结果。

接下来,我们将用最简单的语言,一步步教你如何安装和配置 CapsWriter-Offline,如何实现多设备配对,以及如何通过 cpolar 实现跨设备协作。即使你没有专业的网络知识,也能轻松上手,让语音转文字变得更加自由高效。

1. 软件与模型下载

本例演示环境为 Windows11,另外需要准备一个麦克风。

首先,我们需要下载 CapsWriter-Offline 的 64 位版本,可以使用服务端、客户端。然后需要下载 models.zip 模型文件。

下载地址:Releases · HaujetZhao/CapsWriter-Offline (github.com)

image-20240910164525004

将软件和模型下载好后进行解压,然后将解压好的模型文件夹 models 复制到解压好的 CapsWriter-Offline 的文件夹中并替换原有的同名文件夹。

image-20240910164649325

2. 本地使用测试

现在我们首先双击打开服务端(start_server),会弹出窗口对模型进行加载,加载完成后会提示开始服务:

image-20240910164924307

这时我们在双击打开客户端(start_client),会弹出窗口连接服务端并检测音频输入设备:

image-20240910165106716

显示连接成功即可开始使用了。

软件在 Windows 系统中默认使用大小写切换键caps lock进行语音输入(可以在配置文件中进行修改),一直按住说话,松手即可识别语音并在聊天软件对话窗口等界面进行输出:

image-20240910165630286

可以看到对语音的识别非常准确,连标点符号也是。

除了支持无限时长语音的转写,作者在更新后,软件现在还支持文件转录字幕。即在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可。大家感兴趣的话,可以自行尝试。

3. 异地远程使用

此时,我们已经可以在本地的 Windows 系统电脑中使用 CapsWriter-Offline 进行语音转文字了,但也仅能在本地局域网中的设备上使用,如果想在异地也能远程使用在本地部署的工具应该怎么办呢?

很简单,只要在本地电脑上安装一个 cpolar 内网穿透工具就能轻松实现公网环境远程访问内网部署的服务了,无需公网 IP,也不用设置路由器那么麻烦,接下来就介绍一下如何安装 cpolar 内网穿透!

3.1 内网穿透工具下载安装

安装 cpolar 步骤:

Cpolar 官网地址: https://www.cpolar.com

点击进入 cpolar 官网,点击免费使用注册一个账号,并下载最新版本的 Cpolar

img

登录成功后,点击下载 Cpolar 到本地并安装(一路默认安装即可)本教程选择下载 Windows 版本。

image-20240319175308664

Cpolar 安装成功后,在浏览器上访问 http://localhost:9200,使用 cpolar 账号登录,登录后即可看到 Cpolar web 配置界面,结下来在 web 管理界面配置即可。

img

3.2 配置公网地址

接下来配置一下修改 CapsWriter-Offline 客户端文件需要用到的公网地址,

登录后,点击左侧仪表盘的隧道管理——创建隧道,

创建一个 CapsWriter-Offline 的公网 TCP 地址隧道

  • 隧道名称:可自定义命名,本例中使用123
  • 协议:选择 tcp
  • 本地地址:6016
  • 端口类型:选择随机临时 TCP 端口
  • 地区:选择 China VIP

点击创建

image-20240910170829126

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,可以看到生成了 tcp 公网地址,复制即可。

image-20240910172519802

3.3 修改 config 文件

现在我们可以在异地使用另一台 Windows 系统电脑,下载好 CapsWriter-Offline 软件(无需下载模型文件)。

进入 CapsWriter-Offline 文件夹,使用 vscode 打开 config 文件对客户端配置进行修改:

image-20240910171815011

我们需要对客户端配置中的地址和端口进行修改,使用刚才 cpolar 生成的公网地址 7.tcp.vip.cpolar.cn 替换 127.0.0.1,使用公网地址后的端口 10906 替换 6016,保存文件即可。

image-20240910172026442

1725960417305

3.4 异地远程访问服务端

在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),可以看到通过使用 cpolar 生成的公网地址异地也能远程访问本地服务端,使用它进行语音转文字啦!

image-20240910173355703

小结

如果我们需要经常异地远程访问本地配置的服务,由于刚才创建的是随机的公网地址,24 小时会发生变化。可以把地址设置成固定的 TCP 地址,不仅能够享受更多功能和更快的带宽,而且不用每次都重新创建隧道来访问,下面演示一下如何创建一个固定的 tcp 公网地址来解决这个问题。

4. 配置固定公网地址

我们接下来为 CapsWriter-Offline 配置固定的 TCP 公网地址,该地址不会变化,方便查看且无需每天重复修改访问地址。

配置固定 TCP 地址需要将 cpolar 升级到专业版套餐或以上。

登录 cpolar 官网,点击左侧的预留,选择保留的 TCP 地址,地区选择 China VIP,填写一个备注(自己能记住就行)点击保留

image-20240910173831545

保留成功后复制这个 tcp 地址:

image-20240910173928682

返回登录 Cpolar web UI 管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道:123,点击右侧的编辑:

image-20240910174033107

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 端口类型:选择固定 TCP 端口
  • 预留的 TCP 地址:填写刚才保留成功的 tcp 地址:3.tcp.vip.cpolar.cn:12635

点击更新(注意,点击一次更新即可,不需要重复提交)

image-20240910174221000

4.1 修改 config 文件

然后我们需要再次对客户端配置中的地址和端口进行修改,使用刚才配置的固定 tcp 公网地址 3.tcp.vip.cpolar.cn 替换 7.tcp.vip.cpolar.cn,使用固定公网地址后的端口 12635 替换 10906,保存文件即可。

image-20240910174459160

5. 固定 tcp 公网地址远程访问服务端

同样在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),现在就可以通过使用 cpolar 配置的固定 tcp 公网地址远程访问本地服务端使用它进行语音转文字啦!不用每天修改公网地址,也能获得更快的访问速度。

891e7db64b7693d85f1ae5d0e056ef7

通过 cpolar,CapsWriter 跨设备语音协作变得简单高效。只需三步:在主设备安装 CapsWriter-Offline 并配置识别参数,运行 cpolar 创建跨设备通信隧道,在其他设备通过链接发送语音指令。建议使用时设置设备权限,重要场景启用离线模式。cpolar 让本地语音工具突破设备限制,为多设备办公提供了无缝协作体验。

本篇文章知识点来源[cpolar 官网][https://www.cpolar.com]

  1. cpolar 博客:配置二级子域名: https://www.cpolar.com/blog/configure-the-secondary-subdomain-name
  2. cpolar 博客:配置自定义域名: https://www.cpolar.com/blog/configure-your-own-domain-name
  3. cpolar 博客:配置固定 TCP 端口地址: https://www.cpolar.com/blog/configure-fixed-tcp-port-address
  4. cpolar 博客:配置固定 FTP 地址: https://www.cpolar.com/blog/configure-fixed-ftp-address
http://www.dtcms.com/a/351116.html

相关文章:

  • 如何在GitHub找到10k+个stars的仓库
  • USB摄像头驱动完整分析 (从插入到出画)
  • 飞算JavaAI:Java开发新时代的破晓之光
  • 基于印染数据的可视化系统设计与实现
  • 【笔记】大模型业务场景流程综述
  • (论文速读)MBQ:大型视觉语言模型的模态平衡量化
  • 深度学习在金融订单簿分析与短期市场预测中的应用
  • 力扣hot100:搜索旋转排序数组和寻找旋转排序数组中的最小值(33,153)
  • 大语言模型(LLM)基本原理浅析:从“冰箱做菜“到多模型对比实战
  • 理解SSH服务
  • onnx入门教程(七)——如何添加 TensorRT 自定义算子
  • 深度剖析初始化vue项目文件结构!!【前端】
  • 【分布式技术】Kafka 数据积压全面解析:原因、诊断与解决方案
  • 前沿技术借鉴研讨-2025.8.26(多任务分类/预测)
  • 极简 useState:手写 20 行,支持多次 setState 合并
  • 常用Nginx正则匹配规则
  • HTML的form表单
  • 状态模式与几个经典的C++例子
  • 《分布式任务调度中“任务重复执行”的隐性诱因与根治方案》
  • 记一次clickhouse查询优化之惰性物化
  • 手机移动代理IP:使用、配置、维护的10问10答
  • 通义灵码插件——AI 重构表单开发!半小时搭建可视化拖拽系统,效率碾压传统模式
  • 如何了解云手机的兼容性?
  • TikTok广告投放革命:指纹云手机如何实现智能群控与降本增效
  • 云手机和模拟器之间的区别
  • Windows下的异步IO通知模型
  • Tomcat下载历史版本
  • 深入浅出理解支持向量机(SVM):从原理到实践
  • 支持向量机(SVM)核心笔记
  • 人类记忆如何启发AI?LLM记忆机制综述解读