Live Caption Translator在浏览器中使用的扩展工具,这款工具支持将实时字幕和翻译添加到任何网页等,欢迎下载使用。
介绍
实时字幕翻译器将实时字幕和翻译添加到任何网页。非常适合视频、会议或现场演讲。
特点
• 选项卡音频 — 当前浏览器选项卡中播放的字幕音频/视频(YouTube、播客等)
• 麦克风 — 实时为您自己的声音添加字幕(会议、通话、演示)
• 翻译 — 查看您喜欢的语言的字幕
• OpenAI Live Translate — 直接使用 gpt-realtime-translate 流式传输翻译的转录文本增量
• Gemini Live Translate — 使用gemini-3.5-live-translate-preview 通过WebSocket 流式传输源代码和翻译后的字幕;广泛的目标语言支持
• 可选翻译音频 - 启用后在 OpenAI 和 Gemini Live Translate 中播放翻译音频输出
• 自动检测——OpenAI 和 Gemini Live Translate 自动检测源语言; Groq 模式可让您手动选择源语言
• 选择您的提供商 — OpenAI Realtime、Gemini Live Translate 或 Groq Whisper
• 可定制的叠加 — 调整文本颜色、背景、不透明度和字体大小
• 可拖动和调整大小 - 将标题面板移动到页面上的任意位置
它是如何运作的
1. 打开“凭据”选项卡并选择您的提供商(OpenAI、Gemini 或 Groq)
2. 输入所选提供商的 API 密钥(本地存储在 Chrome 中供您使用;除非与所选 API 提供商共享,否则不会共享)
3. 选择“音频”或“麦克风”选项卡,然后设置源语言和目标语言
4. 打开常规网页(不是 chrome:// 或新选项卡),然后单击开始字幕
5. 字幕显示在浮动叠加层中,您可以拖动并调整其大小
要求
• 您自己的 API 密钥 — OpenAI (platform.openai.com)、Google Gemini (aistudio.google.com/apikey) 或 Groq (console.groq.com)
• 必须打开常规网页 - 字幕无法在 chrome://、新选项卡或扩展页面上运行
供应商
• OpenAI Live Translate — 使用 gpt-realtime-translate 的专用实时翻译;来自 gpt-realtime-whisper 的源转录本;可选翻译音频输出。
• Gemini 实时翻译 — Google Gemini 通过 WebSockets 进行实时翻译,带有gemini-3.5-live-translate-preview;流媒体源和翻译字幕;可选翻译音频;自动检测源语言;提供免费套餐。
• Groq Whisper — 耳语转录(whisper-large-v3/whisper-large-v3-turbo)。通过 llama-3.3-70b-versatile 翻译。
新消息
• 新的可选 Groq Fast 模式可实现低延迟字幕和翻译
• API 密钥、计费、配额和速率限制错误的更清晰消息
• 字幕无法启动时出现页面错误提示
• OpenAI 和 Groq API 关键字段的清除按钮
• 更好的 Groq 处理简短语音和句子结尾
虚拟音频设备 - Windows 和 macOS虚拟音频设备可让您在内部应用程序之间路由声音。当您想要执行以下操作时,这对于实时字幕翻译器非常有用:
- 字幕系统音频或其他应用程序(当前选项卡之外)
- 将系统音频发送到 Zoom 或 Teams
- 在OBS中录制桌面音频
- 将麦克风 + 音乐混合到一个输出中
- 捕捉应用程序特定的声音
插件安装说明
1、在打开的谷歌浏览器的扩展管理器
就是点击最左侧的三个点,在弹出的菜单中选择【更多工具】——【扩展程序】
或者你可以在地址栏中直接输入chrome://extensions/
2、进入扩展程序页面后将开发者模式打勾
3、最后将解压出来的crx文件拖入到浏览器中即可安装添加
4、如果出现无法添加到个人目录中的情况,可以将crx文件右键,然后选择【管理员取得所有权】,再尝试重新安装
5、安装好后即可使用
扫码关注公众号,发【识别码】获取











