详解Ollama api (Windows环境)

最新推荐文章于 2025-07-09 23:42:11 发布

垚武田

最新推荐文章于 2025-07-09 23:42:11 发布

阅读量5.3k

点赞数 4

CC 4.0 BY-SA版权

分类专栏： LLMs AI 文章标签： AIGC llama

本文链接：https://blog.csdn.net/TeamLee/article/details/144684037

Ollama可以像一个本地软件一样在Windows中运行。通常通过以下两种方法来使用Windows中的Ollama。

在cmd或powershell中输入命令
基于本地主机http://localhost:11434的Ollama API

关于Ollama的安装和命令行的使用方法可以参考我的另一篇博文。这篇博文主要介绍api的使用方法。

在`powershell`中获取Ollama API

下面是从powershell中获取Ollama API的一个简单示例（在cmd中同样如此）：

(Invoke-WebRequest -method POST -Body '{"model":"llama3.2", "prompt":"Why is the sky blue?", "stream": false}' -uri http://localhost:11434/api

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

垚武田

关注关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Ollama教程——生成内容API：利用Ollama的原生API进行AI应用开发

walkskyer的博客

04-22

1万+

在深入探讨ollama的API接口之前，让我们先了解一下API接口的基本概念及其在软件开发中的作用。API，或称应用程序编程接口，是一套明确定义的通讯方法，允许不同软件应用之间交换数据和功能。它们是现代软件开发不可或缺的一部分，尤其是在构建模块化、可扩展和维护性强的系统时。在使用生成完成（Generate a Completion）API时，精确而具体的提示词将大大提高生成内容的相关性和质量。例如，在构建聊天机器人时，根据上下文和用户的具体问题设计提示词，能够使回答更加准确和自然。

【Ai】--- Ollama 详解说明

秋知叶i

02-06

1353

在编程的艺术世界里，代码和灵感需要寻找到最佳的交融点，才能打造出令人为之惊叹的作品。而在这座秋知叶i博客的殿堂里，我们将共同追寻这种完美结合，为未来的世界留下属于我们的独特印记。

参与评论您还未登录，请先登录后发表或查看评论

Ollama API 交互详解

加入“Super Entity”，与全能开发团队共探AI智能体与数字人项目，开启前沿技术之旅。

03-02

1881

通过 Ollama 提供的 API 接口，开发者可以轻松地与本地部署的机器学习模型进行交互，实现文本生成、多轮对话等功能。Ollama 的 API 设计简洁明了，支持多种编程语言的集成，非常适合用于开发 AI 驱动的应用程序。希望本文能帮助你更好地理解和使用 Ollama API。如果有任何问题，欢迎查阅 Ollama 官方文档或社区支持。

【解决方法】ollama在powershell或者cmd运行时乱码报错

最新发布

靖待的CSDN博客

07-09

224

运行时，无论是powershell还是cmd都是乱码最后输出一句。

Ollama在Windows安装，使用，简单调用API

weixin_52454379的博客

09-25

5477

在Windows本地安装ollama，官方网页：https://ollama.com/download/windows下载完安装包，安装就好，默认应该是C盘。应该是没办法改，如果有小伙伴能改，也请告知一下。

Ollama系列05：Ollama API 使用指南

qifei2012的博客

03-20

2121

本文介绍了ollama api的用法，详细介绍了生成内容、多轮对话、大模型记忆功能的实现、提取参数化内容等接口。通过使用这些接口，我们可以将AI能力集成到现有的项目中，提升软件的智能化程度。轻松3步本地部署deepseek快速上手搭建私有的AI对话框和智能体—chatbox版快速上手搭建私有的AI对话框和智能体—cherryStudio搭建专属的知识库和问答系统—cherryStudio版👉如果你对这些内容感兴趣，关注[拓荒者IT]公众号，获取最新的文章内容。持续分享AI工具，AI应用场景，AI学习资源。

使用Ollama进行大模型的api部署

xuptyjs的博客

10-29

1万+

使用Ollama进行大模型的api部署有两种方式：原生接口和openai兼容接口。

Ollama API 交互

sre救赎之路

02-23

1605

Ollama 提供了基于 HTTP 的 API，允许开发者通过编程方式与模型进行交互。本文将详细介绍 Ollama API 的详细使用方法，包括请求格式、响应格式以及示例代码。

ollama教程——Ollama Tools功能详解实现复杂任务的完整教程

walkskyer的博客

08-19

1972

Ollama是一个开源框架，专门设计用于在本地运行大型语言模型。它通过将模型权重、配置和数据捆绑到一个包中，从而优化了设置和配置细节，包括GPU使用情况，这大大简化了在本地运行大型模型的过程。Ollama支持macOS和Linux操作系统，并且已经为Windows平台发布了预览版。Ollama的一个重要优势是其易用性。安装过程非常简单，例如在macOS上，用户可以直接从官网下载安装包并运行。而对于Windows用户，官方推荐在WSL 2中以Linux方式使用命令安装。

【AI 大模型开发者必看】Windows下AI交互界面Ollama Open WebUI 安装与配置详细教程

Spring Boot-Common On With You

07-01

146

在当下人工智能飞速发展的时代，本地部署大语言模型成为众多开发者探索创新应用的关键途径。Ollama 作为一款出色的工具，能助力我们在本地轻松启动并运行大型语言模型，而 Open WebUI 则为其提供了便捷直观的可视化交互界面。对于 AI 开发者而言，掌握 Ollama Open WebUI 的安装与配置，就如同为自己的开发工具箱增添了一把强大的利刃。接下来，逐步深入，详细了解其安装与配置过程。

Ollama部署大模型详解

topfine的博客

04-11

1523

Ollama的优势在哪里? 如何启动Ollama 配置适合自己Ollama 加载本地模型的方法

Task03:Ollama API 的使用

hello_fengfeng的博客

02-16

1921

Ollama 提供了强大的 REST API，使开发者能够方便地与大语言模型进行交互。通过 Ollama API，用户可以发送请求并接收模型生成的响应，应用于自然语言处理、文本生成等任务。本文将详细介绍生成补全、对话生成的基本操作，并对创建模型、复制模型、删除模型等常见操作也进行了说明。

windows 环境下访问docker中的ollama api服务

m0_49488235的博客

10-31

881

v open-webui:/app/backend/data \ # 将主机的卷 "open-webui" 挂载到容器的 "/app/backend/data" 目录。-v ollama:/root/.ollama \ # 将主机的卷 "ollama" 挂载到容器的 "/root/.ollama" 目录。--name open-webui \ # 为容器指定名称为 "open-webui"--结合内网穿透工具, 暴露语言大模型到互联网中.(类似gpt4)

【AI基础】大模型部署工具之ollama的安装部署以及api调用

热门推荐

旭日跑马踏云飞的专栏

06-17

4万+

ollama是大模型部署方案，对应docker，本质也是基于docker的容器化技术。ollama提供了openAI兼容的api，可以最大限度的减少理解和开发成本。

ollama大模型API调用接口

源代码杀手的博客

01-12

6567

ollama大模型调用:https://github.com/ollama/ollama/tree/main。

Ollama API 使用指南 - 解锁本地大模型潜能

sunshine_swai的博客

06-21

827

摘要：本文介绍了Ollama API在Python中的集成与应用，主要内容包括： API基础：服务启动方法和核心端点（文本生成、对话、嵌入等） Python实践：涵盖文本生成、流式响应、多轮对话和嵌入向量生成高级技巧：参数调优指南、模型管理和自定义模型创建实战案例：本地知识库问答系统实现性能优化：硬件加速和批处理策略特点：强调本地化部署的数据隐私优势提供详细的代码示例和参数说明包含从基础到高级的完整应用场景突出实用性和工程化思维适用于希望将大模型能力集成到本地应用的Python开发者。

Ollama：本地运行大型语言模型的轻量级框架

十年运维开发经验的王义杰在此分享自己的知识和经验

02-24

2995

Ollama是一个轻量级、可扩展的框架，用于在本地机器上构建和运行大型语言模型（LLM）。它提供了一个简单的API来创建、运行和管理模型，以及一个预构建模型库，可以轻松用于各种应用程序。Ollama的出现，使得在本地运行大型语言模型变得更加容易和方便。Ollama是一个非常有用的项目，它为本地运行大型语言模型提供了一个简单、轻量级和可扩展的解决方案。我相信Ollama将会在未来得到广泛应用，并推动LLM技术的普及和发展。

Ollama入门（windows版本）

qq_40600379的博客

03-25

5240

通过简单的安装指令，可以让用户执行一条命令就在本地运行开源大型语言模型，如gemma。

Ollama原生Api接口

小码农吗

02-11

3171

Ollama 的原生 API 提供了丰富的功能，包括模型管理、文本生成、对话交互等。与本地模型交互（如DeepSeek）。构建知识库检索和问答系统。集成到其他应用或服务中（如企业微信、飞书等）。如果需要更高级的功能（如知识库检索），可以结合或Dify等工具，利用它们的 API 接口实现更复杂的业务逻辑。😁 作者：Teddy (公众号：码尚云软件)ok！。。

windows怎么用Python调用ollama

02-28

<think>好的，我现在需要帮助用户了解如何在Windows上使用Python调用Ollama。首先，我需要确认用户对Ollama的了解程度。Ollama是一个本地运行大型语言模型的工具，支持多种模型如Llama 2、Mistral等。用户可能已经安装了Ollama，但不确定如何通过Python进行调用。接下来，我应该分步骤说明整个过程。首先，确保Ollama已经在Windows上正确安装并运行。用户可能需要下载exe文件并执行安装，或者通过命令行启动服务。需要提醒用户检查服务是否运行在正确的端口，默认是11434。然后，安装Python的HTTP请求库，比如requests。用户可能不熟悉发送HTTP请求，需要给出示例代码，比如如何调用generate API，以及如何处理流式响应。同时，要提到不同的API端点，如生成、聊天、嵌入等，可能需要不同的参数设置。另外，用户可能需要处理流式响应，这里需要展示如何逐块读取并拼接结果。还要注意错误处理，比如检查响应状态码，确保连接正常。最后，推荐使用社区封装的Python库，比如ollama-python或ollama，可以简化调用过程。需要给出安装命令和示例代码，说明如何安装和使用这些库，以及它们的优缺点。需要确保步骤清晰，代码示例正确，并且提醒用户可能的常见问题，比如服务未启动、端口占用等。同时，使用中文，避免专业术语过多，保持口语化，但又要准确。检查是否有遗漏的步骤，比如安装Python库、启动Ollama服务等，确保用户能一步步跟随操作。</think>在 Windows 系统使用 Python 调用 Ollama 的完整步骤如下（建议按顺序操作）：一、前期准备 1. 安装 Ollama - 访问官网 https://ollama.ai/download 下载 Windows 版安装包 - 双击安装后会自动创建系统服务（可在任务管理器→服务中查看"Ollama"服务状态） - 验证安装：打开 PowerShell 输入 `ollama --version` 2. 下载模型（以 Llama2 为例） ```powershell ollama pull llama2 ``` 3. Python 环境准备 ```powershell pip install requests # 基础HTTP请求库 pip install ollama # 可选官方Python库（2023年12月新增） ``` 二、两种调用方式详解方式一：直接通过 REST API 调用（推荐学习原理） ```python import requests # 基础配置 OLLAMA_HOST = 'http://localhost:11434' # 生成文本（带流式响应） def generate_stream(prompt, model="llama2"): url = f"{OLLAMA_HOST}/api/generate" payload = { "model": model, "prompt": prompt, "stream": True # 启用流式输出 } response = requests.post(url, json=payload, stream=True) response.raise_for_status() # 自动检测HTTP错误 full_response = "" for chunk in response.iter_lines(): if chunk: decoded = chunk.decode('utf-8') data = json.loads(decoded) if not data.get("done"): word = data.get("response", "") print(word, end='', flush=True) # 实时输出 full_response += word return full_response # 使用示例 result = generate_stream("为什么天空是蓝色的？") print("\n完整回答：", result) ``` 方式二：使用官方 Python 库（推荐生产环境） ```python import ollama # 同步生成 response = ollama.generate(model='llama2', prompt='解释量子计算') print(response['response']) # 流式生成（适合长响应） stream = ollama.generate( model='llama2', prompt='用五岁小孩能听懂的话解释黑洞', stream=True ) for chunk in stream: print(chunk['response'], end='', flush=True) ``` 三、进阶功能示例 1. 对话模式（保持上下文） ```python from ollama import Client client = Client(host='http://localhost:11434') # 初始化对话 messages = [ {'role': 'user', 'content': '哈利波特的主要角色有哪些？'} ] # 获取首轮响应 response = client.chat(model='llama2', messages=messages) print(response['message']['content']) # 追加对话 messages.append({'role': 'assistant', 'content': response['message']['content']}) messages.append({'role': 'user', 'content': '请详细介绍赫敏这个角色'}) # 继续对话 response = client.chat(model='llama2', messages=messages) ``` 四、常见问题排查 1. 服务未启动 ```python import requests try: response = requests.get('http://localhost:11434') print("Ollama 服务状态:", response.status_code) except ConnectionError: print("错误：请先启动Ollama服务！检查步骤：") print("1. Win+S搜索『服务』，找到Ollama确认状态为『正在运行』") print("2. 或在PowerShell执行：ollama serve") ``` 2. 端口占用冲突 ```powershell # 查看11434端口占用 netstat -ano | findstr :11434 # 如果被其他进程占用，可修改Ollama端口 setx OLLAMA_HOST "0.0.0.0:11435" ``` 3. 模型不存在错误 ```python # 获取可用模型列表 response = requests.get(f"{OLLAMA_HOST}/api/tags") print("已安装模型:", response.json()['models']) ``` 五、性能优化建议 1. 调整运行参数 ```python # 通过options参数控制生成质量 response = ollama.generate( model='llama2', prompt='写一篇关于AI伦理的短文', options={ 'temperature': 0.7, # 创造性（0-1） 'num_predict': 500, # 最大生成长度 'top_p': 0.9, # 核心采样率 'repeat_penalty': 1.2 # 重复惩罚 } ) ``` 2. GPU加速配置（需NVIDIA显卡） ```powershell # 安装CUDA工具包后设置环境变量 setx OLLAMA_DEBUG="1" ollama serve # 观察日志确认是否显示"CUDA capability detected" ```

详解Ollama api (Windows环境)

在powershell中获取Ollama API

在`powershell`中获取Ollama API