大模型-0、开篇-CSDN博客

本文链接：https://blog.csdn.net/weixin_44834328/article/details/135867222

本文作者分享了如何通过Python和neo4j技术实现大模型，目标是提高精度并直接对接数据源，减少依赖和服务调用问题。作者将记录实现过程中的挑战和注意事项，供读者参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景-为什么写这个

现在的大模型相当火，作为一个学技术的人，这个23年初刚开放的赛道肯定是要参与进来的。但是呢，目前的好多这种大模型相关的都需要知识付费。我是喜欢白嫖的人，无奈自己在这块也没啥实战经验，我又很想接触，因为这对我将来的发展肯定是好事一桩。幸运的是，现在有个老大哥带我玩这个东西，索性就将这些记录一下。只为加深自己的一些印象。如果这些记录有帮助到大家的，那自然再好不过了。

期望-想达成什么样的目标

目前好多公司出了自己的大模型，但是现阶段的大模型只适合一些开放式的回答。就好比两个人对话，你问对方中午吃了啥，对方可以说吃了包子、饺子、没吃、气饱了等等一系列回答，因为没有标准。所以如果把大模型当成一个陪聊机器人，那还是挺不错的。但是如果你需要一些精确度高的回答，大模型可能就会出错。比如1+1永远等于2，没有其他任何答案。如果大模型训练的语料里边没有1+1=2这个概念，它很可能给你回答出任意答案。比如1+1=3等等，它会自动尝试创造。这明显不是我们想要的结果。
也有些人会把大模型运用到现有的服务之上。比如大模型提取人们的关键字词，然后组成某服务接口需要的参数，然后请求后端服务，后端服务查询传统数据库返回之后，大模型再解析这些参数，组成相关对话答案，返回给用户。这是一种不错的服务方式，但是如果接口调用错误，可能得多调用几次，这样的后果就是–数据时效性就比较差。而且需要大量的服务和数据在背后做支撑。灵活性也没有那么高。
所以我们的期望就是将大模型尽量的直接对接数据源，尽快的返回用户想要的答案。

技术和工具-通过什么来实现

主要是通过python、neo4j来实现的。不太懂这两个技术也别怕，因为我的python也不6。neo4j更是第一次听。
下边列出的是需要安装的环境或工具，我的笔记本是win10系统：
conda（利用conda来创建python的虚拟环境）
下载链接：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2023.09-0-Windows-x86_64.exe
jdk17（oracle官网随便找一个版本的，是因为neo4j需要对呀版本的jdk环境来启动）
下载链接：https://download.oracle.com/java/17/latest/jdk-17_windows-x64_bin.zip
neo4j（知识图谱数据库）
下载链接：https://dist.neo4j.org/neo4j-community-5.16.0-windows.zip
pycharm（像idea一样的代码编辑器）
安装教程：https://blog.csdn.net/wangyuxiang946/article/details/130634049