MicrosoftのPhi-3-miniをローカルで動かしてブラウザで使用する

近頃話題の大規模言語モデルのPhi-3-miniをWindowsPCで動かしてみました。

OS：Windows 11
GPU：RTX 4060 Ti (VRAM 8GB)
WSLの中にあるdockerを使います
OllamaとOpen WebUIを使います

Dockerの準備
OllamaとOpen WebUIの起動
1. Ollama
2. Open WebUI
ブラウザでアクセス
モデルのダウンロードと切り替え
いよいよチャット実行
まとめ

Dockerの準備

WSLの中でDockerを動かします。インストール方法はこちらの記事で紹介しています。

Ubuntuにdockerをインストールしました。WSLでも同じだと思います。実行したコマンドは以下の通りです。sudo apt install ca-certificates curl gnupg lsb-releasesudo mkdi...

OllamaとOpen WebUIの起動

起動させるものは2個あります。

Ollama

まずはOllamaです。使用方法は公式に載っていました。

https://hub.docker.com/r/ollama/ollama

CPUだけ使う場合とGPUを使う場合でdockerのコマンドが変わります。

#CPUだけ使う場合
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

#GPUを使う場合
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

私の場合は後者のコマンドを実行しました。
初回はイメージのダウンロードが走り、その後起動します。
起動後はコンソールには特に何も表示されません。シェルの入力待ち状態に戻ります。

Open WebUI

Open WebUIのページはこちらです。

GitHub - open-webui/open-webui: User-friendly AI Interface (Supports Ollama, OpenAI API, ...)

User-friendly AI Interface (Supports Ollama, OpenAI API, ...) - open-webui/open-webui

実行するコマンドはこちら。
（スクロールが要るくらい長いですが、トリプルクリックで全選択できるはず）

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

こちらも起動後には特に何も表示されませんが、それでOKです。