大模型相关术语
大模型领域常用名词解释(近100个)
AI与大模型常用术语表
大模型开发工具对比
深度比较大模型开发工具链-LangChain和Llama-Index
RAG
拥抱新一代RAG范式:DeepSearcher开启高效智能的文本检索新时代
什么是向量数据库?
Agent
智能体/Agent概念详解
一文带你了解大模型——智能体(Agent)
谷歌AI Agent白皮书:2025年AI智能体时代来临
Anthropic:Agents 最佳实践指南
MCP
MCP (Model Context Protocol),一篇就够了
一文看懂:MCP(大模型上下文)
部署大模型
ONNX
ONNX(Open Neural Network Exchange,开放神经网络交换),定义了一组与环境和平台无关的标准格式,为 AI 模型的互操作性提供了基础,使 AI 模型可以在不同框架和环境下交互使用。
官网:https://onnx.ai/
中文:https://onnx.org.cn/
微信公众号:AI典论
AI模型部署(1) – ONNX
AI模型部署(2) – ONNX Runtime
AI模型部署(3) – ONNX实例
AI模型部署(4) – 量化实例
大模型分布式部署/推理
实现大模型分布式部署的一些工具和框架:
TensorFlow:提供了多种分布式策略,如 tf.distribute.MirroredStrategy(数据并行)和 tf.distribute.TPUStrategy(TPU上的数据并行)。
PyTorch:提供了 torch.distributed 包,支持数据并行和模型并行。
Horovod:一个开源库,最初由Uber开发,支持TensorFlow、Keras、PyTorch等的分布式训练,简化了多GPU和多机器训练的实现。
DeepSpeed:微软开源的一个深度学习优化库,支持大规模模型的分布式训练和推理。
参考:基于vLLM多卡部署DeepSeek R1并集成Dify
Cake
LLM 和 StableDiffusion 分布式推理:Cake
Distributed LLM and StableDiffusion inference for mobile, desktop and server.
https://github.com/evilsocket/cake




