大模型-0、开篇

本文作者分享了如何通过Python和neo4j技术实现大模型,目标是提高精度并直接对接数据源,减少依赖和服务调用问题。作者将记录实现过程中的挑战和注意事项,供读者参考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景-为什么写这个

现在的大模型相当火,作为一个学技术的人,这个23年初刚开放的赛道肯定是要参与进来的。但是呢,目前的好多这种大模型相关的都需要知识付费。我是喜欢白嫖的人,无奈自己在这块也没啥实战经验,我又很想接触,因为这对我将来的发展肯定是好事一桩。幸运的是,现在有个老大哥带我玩这个东西,索性就将这些记录一下。只为加深自己的一些印象。如果这些记录有帮助到大家的,那自然再好不过了。

期望-想达成什么样的目标

目前好多公司出了自己的大模型,但是现阶段的大模型只适合一些开放式的回答。就好比两个人对话,你问对方中午吃了啥,对方可以说吃了包子、饺子、没吃、气饱了等等一系列回答,因为没有标准。所以如果把大模型当成一个陪聊机器人,那还是挺不错的。但是如果你需要一些精确度高的回答,大模型可能就会出错。比如1+1永远等于2,没有其他任何答案。如果大模型训练的语料里边没有1+1=2这个概念,它很可能给你回答出任意答案。比如1+1=3等等,它会自动尝试创造。这明显不是我们想要的结果。
也有些人会把大模型运用到现有的服务之上。比如大模型提取人们的关键字词,然后组成某服务接口需要的参数,然后请求后端服务,后端服务查询传统数据库返回之后,大模型再解析这些参数,组成相关对话答案,返回给用户。这是一种不错的服务方式,但是如果接口调用错误,可能得多调用几次,这样的后果就是–数据时效性就比较差。而且需要大量的服务和数据在背后做支撑。灵活性也没有那么高。
所以我们的期望就是将大模型尽量的直接对接数据源,尽快的返回用户想要的答案。

技术和工具-通过什么来实现

主要是通过python、neo4j来实现的。不太懂这两个技术也别怕,因为我的python也不6。neo4j更是第一次听。
下边列出的是需要安装的环境或工具,我的笔记本是win10系统:
conda(利用conda来创建python的虚拟环境)
下载链接:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2023.09-0-Windows-x86_64.exe
jdk17(oracle官网随便找一个版本的,是因为neo4j需要对呀版本的jdk环境来启动)
下载链接:https://download.oracle.com/java/17/latest/jdk-17_windows-x64_bin.zip
neo4j(知识图谱数据库)
下载链接:https://dist.neo4j.org/neo4j-community-5.16.0-windows.zip
pycharm(像idea一样的代码编辑器)
安装教程:https://blog.csdn.net/wangyuxiang946/article/details/130634049

说明

后续文章会记录基本的实现逻辑和流程,包括过程中遇到的一些坑和某些需要注意的点。已经发布的文章可能也会再次修正。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值