本地大模型部署 | Ryuzen Icemoon

password

icon

AI summary

type

status

date

slug

summary

1. 下载、安装、配置Ollama

有两种方式，裸机部署和docer部署，docker相对来说简单点，但网络问题不好解决。

以下采用裸机部署方案（Linux）：

命令行一键下载和安装：

如果没有报错，它会提示你 ollama 的默认配置文件地址：

修改默认配置，配置文件在：/etc/systemd/system/ollama.service，采用任意编辑器打开，推荐 vim。

模型默认放在 /usr/share/ollama/.ollama/models，如果需要更改模型存放位置，方便管理，需要对 OLLAMA_MODELS 进行配置：

配置完需要确保确保 ollama 用户有权限访问 /data/ollama/models 目录：

使用命令查看：sudo systemctl status ollama
打开11434端口的防火墙后，然后浏览器打开 http://your_ip:11434/，如果出现 Ollama is running，说明服务已经成功运行。

可以在ollama模型库查看可用模型：https://ollama.com/library/

以谷歌的gemma3模型为例，运行ollama run gemma3:27b 即可开始下载并运行模型。

默认5分钟没有使用就会自动退出，从显存里清空模型，这里可以指定一个参数 --keepalive 2562047h47m16.854775807s 可以让模型持续启动。

停止模型的命令：ollama stop gemma3:27b，

由于默认情况下，ollama是从自己官方网站上下载模型，速度很慢，为了加速模型下载，最好配置一个国内镜像。

到这就可以命令行交互了。

如果需要增强交互体验，可以使用Open-WebUI在网页上进行交互。

Open-WebUI可以通过docker下载，

按照官方README，运行一个带GPU支持的open-webui，

其中：--add-host=host.docker.internal:host-gateway 是为了添加一个主机名映射，将 host.docker.internal 指向宿主机的网关，方便容器访问宿主机服务

这里如果报https相关的tls错误，是因为docker代理没配置好（Linux走的代理上网）。

编辑 Docker 代理配置：

如果有配置代理，将 HTTPS_PROXY 改为 HTTP（强制降级）：

重启 Docker：

访问3000端口就可以网页对话啦

填入上面配置好的API地址即可，更加方便快捷。