XServer VPS 24GB に AI基盤を寄せ始めた話|結局 Dify の「運用の楽さ」に戻ってきた

最近また、VPS 側をかなり触っている。

前回、「XServer VPS の 24GB プランに AI 基盤を全部載せるか迷っている」という記事を書いたあと、実際に構成をかなり詰め直していた。

最初は、

・OpenWebUI
・Keycloak
・Qdrant
・Unstructured
・reranker
・n8n

を全部かなり細かく分離して考えていた。

でも、AI に構成相談しながら詰めていくと、だんだん現実が見えてきた。

「あれ、これメモリ結構ギリギリでは?」

という話。

まず、構成をかなり整理した

結局、今はこんな感じで進めている。

ホスト側

・PostgreSQL:3GB
・nginx:512MB
・OS / page cache / 予備:3.5GB

合計 約7GB

コンテナ側

・Portainer:512MB
・OpenWebUI:1.5GB
・Keycloak:1.5GB
・Dify:6GB
・cl-nagoya/ruri-v3-reranker-310m:2.5GB
・n8n:2.5GB
・n8n-runner:1GB

合計 約15.5GB

全体で約22.5GB。

かなりギリギリ寄り。

最初は「24GB あれば余裕だろ」と思っていたけど、AI 系を並べ始めると普通に重い。

特に reranker 周辺。

LLM 本体を OpenAI API 側に逃がしているから軽い気分になっていたけど、RAG をちゃんとやろうとすると結局メモリを食う。

この辺、実際に組み始めるまで分からなかった。

Dify をやめきれなかった

前回の記事を書いた時点では、

「もう OpenWebUI + n8n 中心でいいかな」

みたいな気分も結構あった。

実際、UI は OpenWebUI を使う予定。

ユーザーに Dify の画面を触らせる気もない。

でも、RAG 側を触り始めると、やっぱり Dify がかなり楽。

これを再認識した。

ドキュメント取り込み。
チャンク。
Embedding。
検索。

この辺を、ある程度まとめて面倒見てくれる。

もちろん細かく詰めるなら、全部自前で作ったほうが自由度は高いと思う。

でも、最近ちょっと考え方が変わってきた。

「全部理解して全部自作する」

より、

「ひとり情シスでも維持できる」

のほうが大事かもしれない、という感覚。

結局、運用って長い。

最初に構築して終わりじゃない。

数ヶ月後の自分が見ても分かるか。
止まった時すぐ触れるか。
夜に呼ばれても復旧できるか。

最近はそっちをかなり気にしている。

今は n8n 側をかなり触っている

今やっているのは、n8n 側で AI エージェントのベースを作る作業。

問い合わせを受けて、

・RAG を叩く
・検索結果を整形する
・OpenAI API に渡す
・必要なら分岐する

みたいな流れ。

正直、ここは最近の LLM にかなり驚いている。

n8n の構成とか、ほぼ AI に作ってもらっている。

もちろん全部そのまま信用はしていない。

でも、

「こういうフロー組みたい」
「この JSON 変換したい」
「ここで条件分岐したい」

みたいな話をすると、かなり普通に返ってくる。

昔なら数時間調べていたものが、かなり短縮される。

最近の LLM、本当に賢くなったなと思う。

検証環境としては、かなり楽

今回の検証で改めて思ったのが、XServer VPS のビジネスプラン、かなり気楽ということ。

ビジネスプランは週1回の自動バックアップがある。

仕事の合間にたまに触るような検証段階だと、

「最悪壊しても作り直せばいい」

で進められる。

これ、精神的にかなり大きい。

最近 AI 系は Docker 構成も複雑だし、依存関係も多い。

たまに本当に環境が壊れる。

でも「まあ戻せばいいか」で触れると、試行回数が増える。

結果として、構成理解も早くなる気がしている。

多分また構成は変わる

正直、この構成も完成形ではないと思う。

多分また変わる。

n8n の役割も変わるかもしれないし、Dify の使い方も変わるかもしれない。

reranker ももっと軽いものに逃げる可能性ある。

でも最近は、その「構成が揺れている状態」自体が、結構リアルだなと思っている。

展示会とか導入事例を見ると、綺麗な完成図が多い。

でも実際の現場って、

「これ重くない?」
「結局どこで管理する?」
「誰が直す?」
「その機能、本当に使う?」

みたいな話のほうが多い。

今はまだ、「完成したAI基盤」というより、

「ひとり情シスでも維持できそうなライン」を探している途中。

ただ、その試行錯誤をやっている時間が、あとで一番効いてくる気はしている。

以前書いた「Dify → OpenWebUI → SSO 構成まで。業務用 AI フロント環境を VPS 上で作った全体ログまとめ」の頃より、だいぶ現実的な視点で考えるようになってきた。

あと最近は、「全部自作する」より、「ちゃんと続く」のほうが大事なんだな、と少し思い始めている。