基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型
本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法。
本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法。
本项目使用中文人声的数据集,在Speech Denoising with Deep Feature Losses网络的基础上fine-tune,得到对中文音频有更好去噪效果的结果
群体课堂专注度分析、考试作弊系统、动态点名功能的Qt Demo,使用多人姿态估计、情绪识别、人脸识别、静默活体检测等技术
TextAttack 🐙 is a Python framework for adversarial attacks, data augmentation, and model training in NLP
A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统
tensorflow实现 YOLO v3目标检测算法(可fine-tuning)