SAGE - 高性能分布式推理框架
{width="72" height="72"}
# SAGE
**高性能分布式推理框架**
数据流原生的模块化、透明、可控的 LLM 工作流推理框架。让 AI 应用开发变得简单、高效、可观测。
[快速开始](getting-started/quickstart.md){.md-button .md-button--primary}
[查看演示](#demo){.md-button .md-button--secondary}
[GitHub](https://github.com/intellistream/SAGE){.md-button .md-button--secondary}
核心特性¶
- 首创数据流范式(原生流式处理 + 异步执行)
- 生产级 AI 管道(可观测、容错、可扩缩)
- 统一内存与计算接口(向量 DB、NeuroMem)
- 丰富的工具链(RAG、Agents、Pipeline Builder)
使用示例¶
文章监控系统¶
源源不断地从 arXiv 拉取文章,经过多级筛选和语义分析,定向推送用户感兴趣的研究进展。
查看示例 →
分布式智能家居系统¶
展示 SAGE 在 IoT 场景下的设备编排与事件驱动能力。
查看示例 →
智能扩缩容聊天系统¶
演示基于负载感知的自动扩缩容策略与在线模型服务。
查看示例 →
快速开始¶
使用 Conda(推荐):
conda create -n sage python=3.11.10
conda activate sage
# 克隆仓库并快速安装(开发者模式)
git clone https://github.com/intellistream/SAGE.git
cd SAGE
./quickstart.sh --dev --yes
或安装 PyPI 包:
查看完整安装指南: 安装文档 →
开发与贡献¶
欢迎参与 SAGE 的开发与讨论:
开发团队与合作¶
来自华中科技大学 IntelliStream Lab 与工业界合作伙伴。
团队负责人:张书豪 教授 — 教师主页
演示(快速预览)¶
以下为演示资源链接 —— 在本地或官网环境可以查看交互演示。
想要内嵌演示播放器或更丰富的互动内容,请告知,我可以把 Asciinema Player 或视频组件加入此页面。
如果你希望我把这份 Markdown 文件更进一步美化(例如添加网格布局、卡片样式、内嵌 Asciinema 播放器或 CTA 按钮样式),告诉我我会继续优化。