服务速查

端口、命令、路径,一页搞定


服务端口

服务端口健康检查说明
oMLX Server8000GET /v1/models推理引擎,Anthropic + OpenAI API
OpenClaw18789GET / HTTP 200AI 网关 + Telegram Bot
NeoWatch Backend3940GET /api/v1/health系统监控 API
NeoWatch Frontend3939GET / HTTP 200赛博朋克仪表盘
Open WebUI3000GET / HTTP 200Web 聊天界面 (Docker)

管理命令

code
# 服务状态
ai-status
 
# 启动/停止/重启
ai-start [service]
ai-stop [service]
ai-restart [service]
 
# 查看日志
ai-logs [service]
 
# 龙虾巡检
ai-patrol          # 或 Claude Code 中 /lobster
 
# 模型切换 (4-bit / 8-bit)
ai-switch 4bit
ai-switch 8bit

模型信息

模型路径大小速度
M2.5 8-bit (主力)~/models/MiniMax-M2.5-MLX-8bit237 GB~25 tok/s
M2.5 4-bit (备选)~/models/MiniMax-M2.5-MLX-4bit120 GB~51 tok/s

关键路径

code
~/models/                          大模型权重
~/omlx-repo/                       oMLX 源码 (editable install)
~/omlx-env/                        oMLX venv
~/.omlx/model_settings.json        oMLX 模型配置
~/.omlx/cache/                     SSD Paged Cache

~/neowatch/backend/                NeoWatch API
~/neowatch/frontend/               NeoWatch UI
~/scripts/                         管理脚本
~/logs/                            所有服务日志

~/.openclaw/openclaw.json          OpenClaw 配置
~/.openclaw/workspace/             OpenClaw 认知文件
~/Library/LaunchAgents/ai.*.plist  LaunchAgent 配置

环境变量

变量说明
MLX_METAL_FAST_SYNCH1GPU-CPU 同步加速

内存参考

状态WiredFreeInactive
8-bit 稳态~234 GB~240 GB变化
4-bit 稳态~150 GB~380 GB变化

Inactive 是 file-backed mmap 缓存,不算真正占用。Available = Free + Inactive


故障速查

症状可能原因处理
推理突然变慢 (tok/s 骤降)GPU Hang 前兆立即重启机器
推理静默卡死SSD cache 死锁 (已修复)更新 oMLX
OOM Panic双进程加载用 ai-switch,不要手动起
OpenClaw 68ms 完成降级模式清 sqlite 重启
服务崩溃循环ThrottleInterval 太短设为 60s

保持简洁,有问题先 ai-status 看一眼。