Vosk 是一款离线开源语音识别工具包
最近更新:
2天前
用于快速开发 GenAI 应用程序的构建模块
最近更新:
2天前
TensorZero 创建了一个用于优化 LLM 应用程序的反馈循环——将生产数据转化为更智能、更快、更便宜的模型
最近更新:
2天前
mcp-for-beginners 是面向初学者的 Model Context Protocol (MCP) 课程
最近更新:
2天前
dots.llm1 是一个大规模的 Mixture of Experts (MoE)语言模型,在总共 1420 亿参数中激活 140 亿参数,借助精心设计且高效的数据处理流程,do
最近更新:
2天前
Chatterbox TTS 是开源 TTS 模型,基于 0.5B Llama 架构训练,不仅支持零样本语音克隆,还独创了情感夸张控制功能,能够让合成语音更生动有趣
最近更新:
2天前
AReaL (Ant Reasoning RL) 是开源的异步强化学习训练系统,用于大型推理模型
最近更新:
2天前
Jaaz是开源AI设计智能体(Agent),旨在简化创意生产流程
最近更新:
2天前
Qwen3 Embedding 是专为文本嵌入和排序任务设计的大模型
最近更新:
2天前
Tokasaurus 是一款专为高吞吐量工作负载设计的 LLM 推理引擎
最近更新:
2天前
PraisonAI 是一个可立即投入生产的多 AI 代理框架,具有自我反思功能,旨在创建 AI 代理,以自动化解决从简单任务到复杂挑战的各种问题
最近更新:
2天前
DeeplxFile是基于Deeplx和Playwright提供的简单易用,快速、免费、不限制文件大小,支持超长文本翻译,跨平台的文件翻译工具
最近更新:
2天前
LivePortrait 是基于图片生成动态表情的开源工具,能够通过一张照片快速生成高质量、生动的视频,尤其擅长捕捉和还原面部表情,支持人类和动物肖像的动画生成
最近更新:
2天前
Memvid 是颠覆传统的向量数据库处理方式,直接将文本数据编码成视频文件
最近更新:
2天前
PaperCoder是一个多智能体 LLM 系统,能够将论文转化为代码库
最近更新:
2天前
PlayDiffusion 是基于扩散模型的语音编辑模型,支持对语音特定部分进行替换、删除或调整,保持其余部分不变,并能作为高性能非自回归 TTS 使用
最近更新:
2天前
Video-XL-2 是新一代超长视频理解模型
最近更新:
2天前
The official Python client for the Huggingface Hub.
最近更新:
2天前
allbeapi是开源库API化平台,无需安装和部署第三方库,直接调用 API
最近更新:
2天前