原创博客,欢迎光临
嵌入式是本职,AI 是兴趣,其它是无奈

大模型相关网文汇总

大模型相关术语

大模型领域常用名词解释(近100个)
AI与大模型常用术语表

大模型开发工具对比

深度比较大模型开发工具链-LangChain和Llama-Index

RAG

拥抱新一代RAG范式:DeepSearcher开启高效智能的文本检索新时代
什么是向量数据库?

Agent

智能体/Agent概念详解
一文带你了解大模型——智能体(Agent)
谷歌AI Agent白皮书:2025年AI智能体时代来临
Anthropic:Agents 最佳实践指南

MCP

MCP (Model Context Protocol),一篇就够了
一文看懂:MCP(大模型上下文)

部署大模型

ONNX

ONNX(Open Neural Network Exchange,开放神经网络交换),定义了一组与环境和平台无关的标准格式,为 AI 模型的互操作性提供了基础,使 AI 模型可以在不同框架和环境下交互使用。

官网:https://onnx.ai/
中文:https://onnx.org.cn/

微信公众号:AI典论
AI模型部署(1) – ONNX
AI模型部署(2) – ONNX Runtime
AI模型部署(3) – ONNX实例
AI模型部署(4) – 量化实例

大模型分布式部署/推理

实现大模型分布式部署的一些工具和框架:
TensorFlow:提供了多种分布式策略,如 tf.distribute.MirroredStrategy(数据并行)和 tf.distribute.TPUStrategy(TPU上的数据并行)。
PyTorch:提供了 torch.distributed 包,支持数据并行和模型并行。
Horovod:一个开源库,最初由Uber开发,支持TensorFlow、Keras、PyTorch等的分布式训练,简化了多GPU和多机器训练的实现。
DeepSpeed:微软开源的一个深度学习优化库,支持大规模模型的分布式训练和推理。

参考:基于vLLM多卡部署DeepSeek R1并集成Dify

Cake

LLM 和 StableDiffusion 分布式推理:Cake Distributed LLM and StableDiffusion inference for mobile, desktop and server.
https://github.com/evilsocket/cake

赞(0)
未经允许不得转载:程序员大狐狸 » 大模型相关网文汇总

评论 抢沙发

登录

找回密码

注册