创建自己的大模型应用

2024-03-07 1331阅读

温馨提示:这篇文章已超过378天没有更新,请注意相关的内容是否还可用!

教大型语言模型(LLM)思考的过程,有点像苏格拉底的“产婆术”。苏格拉底认为,他不能代替别人思考,但他可以通过提问引导别人思考,就好像产婆引导孕妇一样。

创建自己的大模型应用
(图片来源网络,侵删)

如何搭建一个自主可控的大模型(LLM)底座,所以即使你的工作环境不允许使用 OpenAI API 也没关系

首先,我们来为你的原型系统搭建一个“调度中心”,也就是用LangChain把LLM和记忆,工具,计划组件有机结合起来。使用LangChain基于 OpenAI 的 LLM 制作一个简易的 ChatGPT。

ConversationBufferMemory,它将帮助 LLM 记录我们的对话过程。

 ConversationChain,它会帮我们管理整个会话过程,通过调取 BufferMemory 中的对话信息,让无状态的 LLM 了解我们的对话上下文。

from langchain.llms import OpenAI
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory

 建好自己的大模型后,需要微调和训练领域知识

  1. 领域知识文档进行切片,生成语义向量(Embedding),存入向量数据库作为外部记忆。

  2. 建立向量数据库,检索向量数据库,获取技术文档的内容片段。

  3. 把检索反馈和问题一并交给大语言模型(LLM),让它理解文档内容,并针对问题形成恰当回答,返回。

以使用“更大”的模型来提升效果,比如 Meta 开源的 Llama 系列模型。Llama 是 Meta AI 公司于 2023 年 2 月发布的大型语言模型系列,Llama-2 已经非常接近 GPT-3.5 的水平,而且可以免费商用。

使用 Langchain 将你的 LLM 应用组合起来

VPS购买请点击我

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

目录[+]