Qwen3.5-35B无限制版：需要什么配置？怎么部署？

Qwen3.5-35B 登顶开源模型热门榜第一。不过不是 Qwen 官方的模型，而是去审查破解版——模型 ID：HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive。

需要什么配置？

Q4 量化版约 21GB，再加上上下文，至少需要 24GB 显存。台式机的话，显卡只能选 RTX 3090、RTX 4090 或 RTX 5090 系列。另外一条路是 32GB 内存或以上的苹果 Mac。

如果已经有了满足要求的配置，现在就可以直接部署。没有的话，下面是两套方案。

RTX 5090D V2 拥有 24GB GDDR7 显存，跑 Q4 量化版游刃有余。

MacBook Air M5 32GB 统一内存，刚好能装下 Q4 量化版（约 21GB）。苹果的统一内存是 CPU 和 GPU 共用，不像 PC 那样有显存和内存之分。

这里要特别说一下：这个模型是 MoE 架构，推理时每次只激活 3B 的权重做计算，对内存带宽的实际需求远低于同尺寸的密集模型。Mac 在这个模型上的体验，比同等质量的密集 27B 模型更流畅。 这个模型确实有点例外。

推荐机型：

两个方案怎么选： 已经在苹果生态或预算相对有限，选 Mac 方案；要极致推理速度、同时跑多个任务，或者本来就要组台高端 PC，选 5090 装机。

Ollama 是目前最主流的本地大模型管理工具，Windows 和 Mac 都支持。

Mac 用户建议在搜索时优先找 MLX 版本，推理速度更快。

去 lmstudio.ai 下载安装，Windows 和 Mac 都有
打开后在搜索栏输入：HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive，找到 Q4_K_M 量化版下载
加载模型后直接在内置对话界面使用

LM Studio 的优势是能实时显示显存占用，方便判断当前配置能不能撑住。

踩坑提醒：

如果你已经有 Mac 并且是 32GB 版本，现在就可以直接试。