vosk
Java

Vosk 是一款离线开源语音识别工具包

最近更新: 2天前

ragbits
Python

用于快速开发 GenAI 应用程序的构建模块

最近更新: 2天前

tensorzero
Python

TensorZero 创建了一个用于优化 LLM 应用程序的反馈循环——将生产数据转化为更智能、更快、更便宜的模型

最近更新: 2天前

microsoft-mcp-for-beginners
Python

mcp-for-beginners 是面向初学者的 Model Context Protocol (MCP) 课程

最近更新: 2天前

dots-llm1
Python

dots.llm1 是一个大规模的 Mixture of Experts (MoE)语言模型,在总共 1420 亿参数中激活 140 亿参数,借助精心设计且高效的数据处理流程,do

最近更新: 2天前

chatterbox-tts
Python

Chatterbox TTS 是开源 TTS 模型,基于 0.5B Llama 架构训练,不仅支持零样本语音克隆,还独创了情感夸张控制功能,能够让合成语音更生动有趣

最近更新: 2天前

AReaL
Python

AReaL (Ant Reasoning RL) 是开源的异步强化学习训练系统,用于大型推理模型

最近更新: 2天前

Jaaz
Python

Jaaz是开源AI设计智能体(Agent),旨在简化创意生产流程

最近更新: 2天前

Qwen3-Embedding
Python

Qwen3 Embedding 是专为文本嵌入和排序任务设计的大模型

最近更新: 2天前

tokasaurus
Python

Tokasaurus 是一款专为高吞吐量工作负载设计的 LLM 推理引擎

最近更新: 2天前

praisonai
Python

PraisonAI 是一个可立即投入生产的多 AI 代理框架,具有自我反思功能,旨在创建 AI 代理,以自动化解决从简单任务到复杂挑战的各种问题

最近更新: 2天前

cognee
Python

可靠的AI智能体响应

最近更新: 2天前

DeeplxFile
Python

DeeplxFile是基于Deeplx和Playwright提供的简单易用,快速、免费、不限制文件大小,支持超长文本翻译,跨平台的文件翻译工具

最近更新: 2天前

LivePortrait
Python

LivePortrait 是基于图片生成动态表情的开源工具,能够通过一张照片快速生成高质量、生动的视频,尤其擅长捕捉和还原面部表情,支持人类和动物肖像的动画生成

最近更新: 2天前

Memvid
Python

Memvid 是颠覆传统的向量数据库处理方式,直接将文本数据编码成视频文件

最近更新: 2天前

paper2code
Python

PaperCoder是一个多智能体 LLM 系统,能够将论文转化为代码库

最近更新: 2天前

PlayDiffusion
Python

PlayDiffusion 是基于扩散模型的语音编辑模型,支持对语音特定部分进行替换、删除或调整,保持其余部分不变,并能作为高性能非自回归 TTS 使用

最近更新: 2天前

Video-XL-2
Python

Video-XL-2 是新一代超长视频理解模型

最近更新: 2天前

huggingface_hub

The official Python client for the Huggingface Hub.

最近更新: 2天前

allbeapi
Python

allbeapi是开源库API化平台,无需安装和部署第三方库,直接调用 API

最近更新: 2天前

搜索帮助