คู่มือ Deploy vLLM บน NVIDIA DGX Spark Cluster — 12 Bugs ที่เราเจอจริง พร้อม Architecture Flow และ Troubleshooting Playbook

บันทึกประสบการณ์จริงการสร้าง 2 vLLM clusters (AI BOX 1-4) บน NVIDIA DGX Spark สำหรับรัน Qwen3.5-122B-A10B-FP8 TP=2 cross-node ผ่าน ConnectX-7 200Gbps RoCE — architecture design flow, deployment step-by-step, และวิธีแก้ 12 bugs ที่เจอจริงบนฮาร์ดแวร์ production