deepspeech - 程序员宅基地

按照一定的信噪比给wav添加噪声

按照一定的信噪比dB加入随机噪声编译：g++ -o addnoise main.cpp -lm usage：./addnoise ori.wav noise.wav dB new.wav for example ：./addnoise hello.wav white_noise.wav 63 new.wav

Python-ProjectDeepSpeech是一款基于百度深度语音研究论文的开源语音文本引擎

标签： Python开发-机器学习

Project DeepSpeech是一款基于百度深度语音研究论文的开源语音文本引擎，采用机器学习技术训练的模型。 DeepSpeech项目使用Google的TensorFlow项目来实现。

deepspeechv2噪声版.rar

标签： deepspeechv2py

deepspeechv2 pytorch版训练加噪声

使用pycorrector时ssl.SSLCertVerificationError

标签： python Python开发-自然语言处理

Downloading data from https://deepspeech.bj.bcebos.com/zh_lm/zh_giga.no_cna_cmn.prune01244.klm Traceback (most recent call last): File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/...

基于树莓派构建深度学习语音识别系统

标签：算法音频

而深度学习技术可以通过端到端学习，自动从原始数据中学习到最佳的特征表示，减少了对领域知识和专业经验的依赖，降低了人工特征工程的成本和复杂性。训练深度学习模型：使用选择的深度学习框架和数据集，编写代码来...

语音识别系列︱paddlehub的开源语音识别模型测试（二）

这一篇开始主要是开源模型的测试，百度paddle有两个模块，paddlehub / paddlespeech都有语音识别模型，这边会拆分两篇来说。

carlini/audio_adversarial_examples源码安装方法

Nicholas Carlini是文章Audio Adversarial Examples: Targeted Attacks on Speech-to-Text的作者，他将自己的代码放在github上，地址为https://github.com/carlini/audio_adversarial_examples 本文介绍Nicholas ...

ER-NeRF实时对话数字人模型训练与部署

标签： AI

ER-NeRF是基于NeRF用于生成数字人的方法，可以达到实时生成的效果。

语音识别技术分类与总结

标签：语音识别人工智能

语音识别技术分类与总结

一个用于Mozilla的语音转文本服务的Android库模块-Android开发

标签： Android Miscellaneous

Mozilla的语音转文本服务的Android库模块androidspeech这是一个Android库，其中包含Mozilla的语音识别服务的API。安装依赖项{实现'com.github.mozilla：mozillaspeechlibrary：2.0.0'实现'...音频编码，语音活动检测

Keyword Spotting (KWS) | Deep Spoken Keyword Spotting: An Overview

标签： deep learning ai 语音识别

KWS

语音识别-speech

标签：识别

语音识别 C#，可以试着玩玩

Speech Recognition Using Deep Neural Networks A Systematic Review.pdf

标签： Speech Recognition Deep NeuralNetworks Review

Speech Recognition Using Deep Neural Networks: A Systematic Review ALI BOU NASSIF

基于OpenVINO的多输入model optimizer(Tensorflow)

wget -O - https://github.com/mozilla/DeepSpeech/releases/download/v0.3.0/deepspeech-0.3.0-models.tar.gz | tar xvfz - 文件内容如下 StepII:利用tensorflow中的summarize_graph对fronzen后的网络结构进行...

tensorflow-gpu2.0报错：Failed to get convolution algorithm. This is probably because cuDNN...

标签：深度学习 cuda tensorflow

tensorflow-gpu版本：2.0.0 CUDA版本：10.0.130 cuDNN版本：7.4.2（更新前）在使用tensorflow-gpu版本学习yolo3时遇到了卷积算法报错的问题： Failed to get convolution algorithm. This is probably because...

numcodecs-0.7.2-cp36-cp36m-win32

标签：数据

numcodecs-0.7.2-cp36-cp36m-win32

Deep Learning for NLP and Speech Recognition

标签： deep learning 深度学习 NLP 自然语言语音识别

Deep Learning for NLP and Speech Recognition，2019年新书，介绍深度学习在自然语言处理和语音识别中的应用。

语音学习笔记10------如何利用Deep CNN大幅提升识别准确率？

近日，百度将 Deep CNN 应用于语音识别研究，使用了 VGGNet ，以及包含 Residual 连接的深层 ...　机器之心对百度语音技术部识别技术负责人，同时也是 Deep Speech 中文研发负责人李先刚博士进行了独家专访，李先刚博

【AD-NeRF】音频驱动人脸NeRF

标签：音视频计算机视觉人工智能

任务目标：生成高质量的音频驱动的面部视频序列合成，实现音频到视觉人脸的跨模态映射。应用方向：数字人、聊天机器人、虚拟会议等针对这个任务，目前已经有了一些解决方案。早期的方案基于专业的建模师以及动作...

ASR语音转文字模型——项目落地

1.项目背景 2.技术原理 3.常见模型 4.数据预处理 5.模型复现效果 6.离线服务部署

windows 语音识别

广告关闭2017年12月，云+社区对外发布，从最开始的技术博客到现在拥有多个社区产品。未来，我们一起乘风破浪，创造无限可能。进入“中文语音识别”目录，然后运行下面的命令 pocketsphinxbinreleasex64pocketsphinx_...

生成语音对抗样本

标签： docker python tensorflow

audio_adversarial_examples （生成语音对抗样本）

【语音识别】自动语音识别（ASR）研究综述

标签：语音识别人工智能

自动语音识别（ASR）综述

Automatic speech recognition. A deep learning approach

标签： deep learnin speech recog

This book provides a comprehensive overview of the recent advancement in the field of automatic speech recognition with a focus on deep learning models including deep neural networks and many of their...

PyPI 官网下载 | dimod-0.9.0-cp36-cp36m-manylinux1_i686.whl

标签： Python库

资源来自pypi官网。资源全名：dimod-0.9.0-cp36-cp36m-manylinux1_i686.whl

解决“The name ‘x:0‘ refers to a Tensor which does not exist. The operation, ‘x‘, does not exist...

标签： tensorflow python 深度学习

解决 Tensorflow 重载meta图时"The name 'x:0' refers to a Tensor which does not exist. The operation, 'y', does not exist in the graph."问题描述解决过程总结（嫌啰嗦请直接看总结部分） ...