Docker 部署 funasr 语音转文字服务

共计 3275 个字符，预计需要花费 9 分钟才能阅读完成。

由于家人有需要，经常需要听会议记录或者通话录音，于是想着直接将录音导出，然后进行转文字，再通过 gpt 进行总结或者其他的操作。找了很多项目，最好还是在 nodeseek 论坛的坛友建议下，找到了 funasr 这个项目。使用感受是，识别准确率确实还不错，非常满足我的需求。

FunASR 是一个基础语音识别工具包，提供多种功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR 提供了便捷的脚本和教程，支持预训练好的模型的推理与微调。

目前 FunASR 支持 docker 部署，不过只有 cpu 版本，并且支持实时转换和离线转换。

如果仅仅是简单使用，那么其实不必要自己搭建服务，因为这个毕竟比较吃硬件。

此时可以访问官方 h5 页面：链接

Docker 部署 funasr 语音转文字服务

可以看见，页面确实比较简陋，但是该有的功能基本都有。

这里需要注意的是 asr 服务器地址：

wss://www.funasr.com:10096/：这个为实时语音识别地址，支持麦克风、文件如 pcm、wav 格式，但是不支持 mp3、m4a 等格式
wss://www.funasr.com:10095/：支持 mp3、m4a 等格式

效果：

Docker 部署 funasr 语音转文字服务

这里是把两个实时和离线两个服务都部署了，所以直接使用 docker-compose。

version: '3'
services:
  funasr:
    image: registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.5
    container_name: funasr
    ports:
      - "10095:10095"
    privileged: true
    volumes:
      - /home/docker/funasr/models:/workspace/models
      - /home/docker/funasr/samples:/samples
      - /home/docker/funasr/mp3:/mp3
    command: tail -f /dev/null
  funasr-online:
    image: registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.10
    container_name: funasr-online
    ports:
      - "10096:10095"
    privileged: true
    volumes:
      - /home/docker/funasr/models:/workspace/models
      - /home/docker/funasr/samples:/samples
      - /home/docker/funasr/mp3:/mp3
    command: tail -f /dev/null

其实只需要映射模型目录 /home/docker/funasr/models:/workspace/models 即可，其余的目录是为了方便测试而进行的映射。

如果需要查看官方测试案例和下载官方测试包，可以查看快速开始。

启动离线语音识别服务

# 进入容器
docker exec -it funasr bash
# 进入服务目录
cd /workspace/FunASR/runtime
# 启动服务
nohup bash run_server_2pass.sh  \
--model-thread-num 8 \
  --download-model-dir /workspace/models \
  --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
  --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx  \
  --online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx  \
  --punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx \
  --itn-dir thuduj12/fst_itn_zh \
  --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

# 如果您想关闭ssl，增加参数：--certfile 0
# 如果您想使用时间戳或者nn热词模型进行部署，请设置--model-dir为对应模型：
#   damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx（时间戳）
#   damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx（nn热词）
# 如果您想在服务端加载热词，请在宿主机文件./funasr-runtime-resources/models/hotwords.txt配置热词（docker映射地址为/workspace/models/hotwords.txt）:
#   每行一个热词，格式(热词 权重)：阿里巴巴 20

如果是第一次启动，那么需要等模型下载完成才可以使用，可以查看 log.txt 查看情况。

启动实时语音识别服务

# 进入容器
docker exec -it funasr-online bash
# 进入服务目录
cd /workspace/FunASR/runtime
# 启动服务
nohup bash run_server.sh \
--model-thread-num 8 \
--download-model-dir /workspace/models \
--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
--model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx \
--punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
--itn-dir thuduj12/fst_itn_zh \
--hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

# 如果您想关闭ssl，增加参数：--certfile 0
# 如果您想使用时间戳或者nn热词模型进行部署，请设置--model-dir为对应模型：
#   damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx（时间戳）
#   damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx（nn热词）
# 如果您想在服务端加载热词，请在宿主机文件./funasr-runtime-resources/models/hotwords.txt配置热词（docker映射地址为/workspace/models/hotwords.txt）:
#   每行一个热词，格式(热词 权重)：阿里巴巴 20

同样如果是第一次启动，也需要等待模型下载完成。

等待服务启动完毕以后，可以使用官方的 h5 页面，将 asr 替换为自己的服务器地址。或者将上面提到的 快速开始 里面的测试包下载，里面也有一样 h5 页面，并且可以自行修改一些内容，下面就是经过修改后的，时间上更为明显了。

Docker 部署 funasr 语音转文字服务

提醒：本文发布于352天前，文中所关联的信息可能已发生改变，请知悉！

AD:【腾讯云服务器大降价】2核4G 222元/3年 1核2G 38元/年

Docker 搭建 kodbox

之前介绍过 Docker 搭建可道云在线资源管理器 kodexplorer，今天要介绍的是 kodbox。 Kodbox 和 KodExplorer 都是基于Web的文件管理器，它们的功能和界面非常相似，但是它们是由不同的团队开发和维护的。虽然它们的功能和界面非常相似，但是Kodbox和KodExplorer在细节方面略有不同。例如，Kodbox支持在线编辑PDF文件，而KodExplorer则...

Axios 基本使用教程

1. 简介 Axios 是一个基于 promise 的网络请求库，作用于 node.js 和浏览器中。它提供了许多强大的特性，比如拦截器、请求和响应转换、取消请求等。具有如下特性：从浏览器发出 XMLHttpRequests 从 node.js 发出 http 请求支持 Promise API 拦截请求和响应转换请求和响应数据取消请求 JSON 数据的自动转换自动将数据对象序列化为正文...

NFS 安装和使用详解

1. 概念 nfs：network file system nfs即网络文件系统，它允许网络中的计算机之间通过网络共享资源。将NFS主机分享的目录，挂载到本地客户端当中，本地NFS的客户端应用可以透明地读写位于远端NFS服务器上的文件，在客户端看起来，就像访问本地文件一样。 nfs的作用：实现了不同及其之间的文件共享 2. 安装 yum install -y rpcbind nfs-utils #...

Shell 脚本备份多个服务器目录数据

比较重要的数据最好还是经常备份，以免数据丢失后悔莫及。对于有快照的服务器，可以利用快照进行备份，对于没有快照的，可以利用 rsync 备份到本地。以下脚本可以方便地进行备份，修改配置后定时运行即可： #!/bin/bash # 日志统一重定向 # 将所有输出重定向到 /tmp/backup.log，包括错误信息 exec >> /tmp/backup.log 2>&1 ...

Windows 无法使用代理的可能解决方案

今天用着代理，突然发现 v2rayN 不能用了，且测试所有的订阅服务器延迟返回都是 -1。然后又测试了手机和笔记本电脑，都没问题，于是重置电脑网络，发现还是无法解决问题。在毫无办法时，再次开机重启，发现桌面日历还是啥软件提示了一句话，大概是本地时间和服务器时间差别过大，导致无法同步。恍然大悟，原来是今天因为测试一些东西，修改了时间，于是调整为自动设置时间后就好了。这件事也是提醒了一下自己，如...

阿蛮君你可以让用 docker 把端口映射出来，不需要直接使用docker的容器ip去访问的

小沫就是通过zero访问服务器docker上未公开到0.0.0.0的服务，就相当于内网访问

阿蛮君那我目前看你的描述也其实不是非常理解，不是很清楚你需要访问其他容器的ip是有什么作用？

小沫转发了，在另一台服务器上也通不了

阿蛮君是不是服务器没开启ipv4转发

小沫就是用的host模式，通不了，zero官网和zero容器编排配置都没改变，迁移服务器前还能通，迁了之后就通不了了

阿蛮君都用其他网段了本身就是为了隔离而存在的，zerotier为什么不是使用host模式部署呢？

阿蛮君其实有公共的发现服务器和中继服务器，只需要安装客户端就行，当然你有公网也可以自己发现服务器和中继服务器。另外，手机客户端我没用过，应该网上一搜就能下载

cc 作者您好，我目前家里的nas有公网IP和域名，如果我想实现台式机电脑、单位电脑和手机设备文件的同步，那么我在nas端需要搭建【中继付服务器】、【发现服务器】和【客户端】合计3个容器吗？另外想问一下手机端的同步软件在哪里下载？

小沫请问docker部署的zerotier如何访问其他docker网段容器的ip，我试过网上那些防火墙规则都没用，能ping通容器了但是访问不了端口不去动防火墙默认ping不通容器ip只能ping通网段的网关

Docker 部署 funasr 语音转文字服务

前言

官方服务

自建asr服务器

Docker 搭建 kodbox

Axios 基本使用教程

NFS 安装和使用详解

Shell 脚本备份多个服务器目录数据

Windows 无法使用代理的可能解决方案

IDM 6.39.2 安装教程

Navicat15 最新版下载和安装教程

Dokcer 安装 v2rayA

Docker 搭建 headscale 异地组网完整教程

Ubuntu 22.04 锁屏不能远程连接的解决方案