原创博客,欢迎光临
嵌入式是本职,AI 是兴趣,其它是无奈

初识大模型应用开发技术(番外篇)

#大模型应用开发

大模型的两大缺陷

1. 没有最新信息
大模型的训练需要大量的计算资源和时间,因此它们的知识库通常是在某个时间点之前的数据集上训练的。例如,GPT-3.5 和 GPT-4 的知识截至 2021 年 9 月。这意味着它们无法提供此后的新信息或事件。为保持时效性,需定期重训模型,但成本高昂且耗时,导致大模型难以及时跟上信息更新。

2. 没有真逻辑
大模型生成的文本和回答主要基于训练数据的统计规律,而非严格的逻辑推理或形式化证明。因此,在处理复杂或需深入逻辑推理的问题时,它们可能产生看似合理但实际不准确的回答。此外,大模型通过预测给定上下文中的下一个词来生成文本,可能受训练数据中的偏见和错误影响,从而削弱逻辑严谨性。

普通人对大模型的认识误区

  • 误区一:大模型就是全能的。
  • 误区二:大模型意味着更准确。
  • 误区三:使用大模型不需要技术背景。
  • 误区二:模型参数越大越厉害。
  • 误区三:只要持续跟大模型聊天它就会越来越聪明。
  • 误区四:只要通过持续的 fine-tune(微调),模型就可以做到百分百正确。
赞(0)
未经允许不得转载:程序员大狐狸 » 初识大模型应用开发技术(番外篇)

评论 抢沙发

登录

找回密码

注册