本地部署资讯问答机器人:Langchain+Ollama+RSSHub 实现 RAG

一、背景

在这个信息爆炸💥的时代,人工筛选对自己有价值的信息无异于大海捞针。不过,幸好现在有了 AI 这个强大的工具,我们可以让它来帮我们做集检索、整合与分析为一体的工作。

这里,我想以 A 股行情(其他场景也类似)问答为例,希望构建这么一个 Bot,当我问它诸如「XX股票今天表现怎么样?」、「复盘今天的家电板块」等问题时,它可以迅速从海量市场数据中找到有价值的信息,帮我进行整合与分析,然后为我提供个性化的回复。

另外,这里我还有个要求,希望能在本地私有化部署,这就意味着与 coze 无缘了。

经过调研,我决定先采取 Langchain+Ollama 的技术栈来作为 demo 实现,当然,后续我也会考虑使用 dify、fastgpt 等更加直观易用的 AI 开发平台。

整体框架设计思路如下

image.png

另外,本次开发的运行环境是 Intel Mac,其他操作系统也可以。下载模型等可能需要梯子。

二、Langchain 简介

www.langchain.com/langchain

Langchain 是当前大模型应用开发的主流框架之一,旨在帮助开发者构建和部署基于大型语言模型(LLM)的应用。它提供了一系列的工具和接口,使得与LLM交互变得简单。通过 Langchain,开发者可以轻松创建定制的高级应用,如聊天机器人、问答系统和多种智能应用。

Langchain 的核心在于其“链”概念,这是一个模块化的组件系统,包括 Model I/O(模型输入输出)、Retrieval(数据检索)、Chains(链)、Agents(代理)、Memory(内存)、和 Callbacks(回调)。这些组件可灵活组合,以支持复杂的应用逻辑。

Model I/O 模块负责处理与语言模型的直接交互,包括发送请求和解析响应。Retrieval 模块用于增强语言模型的回答能力,通过向量数据库检索相关信息来支持回答生成。Chains 模块则是多个组件的集成,用于构建更复杂的应用逻辑。

Langchain 的生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具,这些工具能帮助开发者高效管理从原型到生产的各个阶段,以便优化 LLM 应用。
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈


三、Ollama 简介

ollama.com/

Ollama 是一个开箱即用的用于在本地运行大模型的框架。它的主要功能和特点包括:

  1. 支持多种大型语言模型:Ollama 支持包括 通义千问、Llama 2、Mistral 和 Gemma 等在内的多种大型语言模型,这些模型可用于不同的应用场景。

  2. 易于使用:Ollama 旨在使用户能够轻松地在本地环境中启动和运行大模型,适用于 macOS、Windows 和 Linux 系统,同时支持 cpu 和 gpu。

  3. 模型库:Ollama 提供了一个模型库,用户可以从中下载不同的模型。这些模型有不同的参数和大小,以满足不同的需求和硬件条件。

  4. 自定义模型:用户可以通过简单的步骤自定义模型,例如修改模型的温度参数来调整创造性和连贯性,或者设置特定的系统消息。

  5. API 和集成:Ollama 还提供了 REST API,用于运行和管理模型,以及与其他应用程序的集成选项。

  6. 社区贡献:Ollama 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。

总的来说,Ollama 是一个为了方便用户在本地运行和管理大型语言模型而设计的框架,具有良好的可扩展性和多样的使用场景。

后面在捏 Bot 的过程中需要使用 Ollama,我们需要先安装,访问以下链接进行下载安装。

ollama.com/download/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值