语音控制 Whisper 无障碍 教程

抛弃 Siri:使用 OpenClaw 和 Whisper 设置私有语音控制

彻底改变您与计算机的关系。了解如何使用 OpenClaw 在本地运行 OpenAI 的 Whisper 模型,设置超快、私密的语音控制。

阅读需 7 分钟

Quick Answer

通过将本地 Whisper 服务器与 OpenClaw 集成,您可以在音频从未离开设备的情况下实现近乎即时的语音转录和命令执行。它支持复杂的语音宏,如'总结我的上一封电子邮件'或'打开我的编码工作区'。

云端语音助手的问题

“嘿 Siri,开灯。” …正在处理… …还在处理… “对不起,我现在做不到。”

我们都经历过。云端语音助手深受延迟、隐私问题和能力有限的困扰。

OpenClaw + Whisper 改变了这一切。

为什么要用本地 Whisper?

OpenAI 的 Whisper 模型创造了最先进的转录效果。whisper.cpp 项目使其能够在消费级硬件上以惊人的速度运行。

  • 速度:瞬间转录。
  • 隐私:音频在设备上处理。
  • 准确性:比大多数云助手更了解口音和技术术语。

第一步:安装本地 Whisper

首先,我们需要一个本地转录引擎。我们推荐 whisper.cpp

# 克隆并构建 whisper.cpp
git clone https://github.com/ggerganov/whisper.cpp
cd whisper.cpp
make
./models/download-ggml-model.sh base.en

第二步:配置 OpenClaw 语音技能

OpenClaw 内置了语音输入技能。

{
  "skills": {
    "voice": {
      "enabled": true,
      "engine": "whisper-local",
      "modelPath": "./models/ggml-base.en.bin",
      "trigger": "push-to-talk"
    }
  }
}

第三步:创建语音宏

见证奇迹的时刻。您可以将语音命令映射到复杂的 OpenClaw 动作。

“编码模式”

您说:“开始写代码。” OpenClaw

  1. 启动 VS Code。
  2. 打开 GitHub Desktop。
  3. 关闭 Twitter/Reddit 标签页。
  4. 将系统设置为”勿扰模式”。

结论

标准的语音助手是玩具。OpenClaw + Whisper 是生产力工具。试一试吧。

Need help?

Join the OpenClaw community on Discord for support, tips, and shared skills.

Join Discord →