服务速查

端口、命令、路径，一页搞定

服务端口

服务	端口	健康检查	说明
oMLX Server	8000	`GET /v1/models`	推理引擎，Anthropic + OpenAI API
OpenClaw	18789	`GET /` HTTP 200	AI 网关 + Telegram Bot
NeoWatch Backend	3940	`GET /api/v1/health`	系统监控 API
NeoWatch Frontend	3939	`GET /` HTTP 200	赛博朋克仪表盘
Open WebUI	3000	`GET /` HTTP 200	Web 聊天界面 (Docker)

管理命令

code

# 服务状态
ai-status
 
# 启动/停止/重启
ai-start [service]
ai-stop [service]
ai-restart [service]
 
# 查看日志
ai-logs [service]
 
# 龙虾巡检
ai-patrol          # 或 Claude Code 中 /lobster
 
# 模型切换 (4-bit / 8-bit)
ai-switch 4bit
ai-switch 8bit

模型信息

模型	路径	大小	速度
M2.5 8-bit (主力)	`~/models/MiniMax-M2.5-MLX-8bit`	237 GB	~25 tok/s
M2.5 4-bit (备选)	`~/models/MiniMax-M2.5-MLX-4bit`	120 GB	~51 tok/s

关键路径

code

~/models/                          大模型权重
~/omlx-repo/                       oMLX 源码 (editable install)
~/omlx-env/                        oMLX venv
~/.omlx/model_settings.json        oMLX 模型配置
~/.omlx/cache/                     SSD Paged Cache

~/neowatch/backend/                NeoWatch API
~/neowatch/frontend/               NeoWatch UI
~/scripts/                         管理脚本
~/logs/                            所有服务日志

~/.openclaw/openclaw.json          OpenClaw 配置
~/.openclaw/workspace/             OpenClaw 认知文件
~/Library/LaunchAgents/ai.*.plist  LaunchAgent 配置

环境变量

变量	值	说明
`MLX_METAL_FAST_SYNCH`	`1`	GPU-CPU 同步加速

内存参考

状态	Wired	Free	Inactive
8-bit 稳态	~234 GB	~240 GB	变化
4-bit 稳态	~150 GB	~380 GB	变化

Inactive 是 file-backed mmap 缓存，不算真正占用。Available = Free + Inactive。

故障速查

症状	可能原因	处理
推理突然变慢 (tok/s 骤降)	GPU Hang 前兆	立即重启机器
推理静默卡死	SSD cache 死锁 (已修复)	更新 oMLX
OOM Panic	双进程加载	用 ai-switch，不要手动起
OpenClaw 68ms 完成	降级模式	清 sqlite 重启
服务崩溃循环	ThrottleInterval 太短	设为 60s

保持简洁，有问题先 ai-status 看一眼。