LM Studio 完全指南：从零开始在本地跑通大模型

前序：算是赶个晚班车，因为我觉得其实比ollma更方便些，适合隐私文件的处理，当然内容审核依然比较严格，（ps:国内对于内容审核稍轻松些的应该是DeepSeek的模型，使用api调用避免前端审核）,请注意一定一定一定根据电脑配置来下载模型，否则要么死机，要么等到天荒地老。

LM Studio 是目前最友好的本地模型运行工具之一。它支持 Windows、macOS 和 Linux，拥有漂亮的图形界面，让你可以轻松搜索、下载并运行模型。

本教程将带你一步步完成从硬件评估、软件安装、模型选择到高级开发用法的全过程。

第一部分：出发前的准备

在开始之前，我们需要先检查一下你的电脑是否准备好了。本地运行模型，最核心的硬件指标是内存（RAM）或显存（VRAM）。

你可以根据自己的需求，参考以下标准：

最低要求（运行小模型）：

内存 (RAM)：16 GB
操作系统：
- Mac: Apple Silicon (M1/M2/M3), macOS 14+
- Windows: Windows 10/11, x64 (需支持AVX2指令集) 或 ARM64
- Linux: Ubuntu 20.04+ (或其他发行版的AppImage)
硬盘：10 GB 可用空间
GPU：可选，但强烈建议有4GB以上显存的显卡用于加速

推荐要求（流畅运行）：

内存 (RAM)：32 GB 或以上
操作系统：
- Mac: Apple Silicon (M2 Max/Ultra) 或更新，64GB统一内存
- Windows: 32GB+ RAM, NVIDIA/AMD 显卡 (8GB+ VRAM)
硬盘：50 GB 以上 (SSD 更佳)
GPU：8GB+ VRAM (NVIDIA RTX 3090/4090 或 AMD RX 7900 XT)

特别注意：

你可能会在下载模型时看到 Q4_K_M、Q8_0 这样的词。这是量化标识。简单来说，量化就像压缩图片，可以大幅减小模型文件的大小和对内存的需求，同时尽可能保留原模型的能力。

其中，Q4_K_M 是目前公认的“甜点”级别，它在性能和模型质量上取得了最佳平衡。本教程后面推荐的模型，也都会基于这个量化级别。

第二部分：安装与初体验

下载与安装LM Studio
访问官网：打开浏览器，访问 LM Studio 的官方网站 lmstudio.ai。
下载：根据你的操作系统，下载对应的安装包。
安装：
- macOS：打开下载好的 .dmg 文件，将 LM Studio 拖入“应用程序”文件夹。
- Windows：双击 .exe 文件，按照安装向导的提示进行安装。
- Linux：为下载的 .AppImage 文件添加执行权限，然后双击运行或通过终端执行。
首次启动与配置

安装后第一次打开LM Studio，它会自动在你的用户目录下创建模型文件夹，用来存放模型、配置文件等。界面非常简洁，主要包含“聊天”、“发现模型”和“我的模型”几个选项卡。

第三部分：选择并下载你的第一个模型

LM Studio 内置了模型搜索功能，你可以在“发现”页面直接搜索并下载模型。

模型推荐：从新手到进阶

根据硬件配置，这里整理了几款表现优秀的模型：

Qwen2.5 (通义千问) 7B / 14B
- 量化级别：Q4_K_M
- 推荐场景：中文全能王。日常对话、写作、知识问答
- 推荐内存：16GB+
DeepSeek-R1 (深度求索) 14B
- 量化级别：Q4_K_M
- 推荐场景：推理专家。逻辑推理、数学、编程
- 推荐内存：16GB+
Llama 3.2 (Meta) 3B / 8B
- 量化级别：Q4_K_M
- 推荐场景：轻量级首选。低配置电脑、快速响应
- 推荐内存：8GB - 16GB
LFM-2B-24B-A2B (Liquid AI) 24B
- 量化级别：Q4_K_M
- 推荐场景：效率与性能的平衡。编码、复杂任务
- 推荐内存：32GB+
Qwen2.5 Coder 32B
- 量化级别：Q4_K_M
- 推荐场景：编程专用。代码生成、调试、解释
- 推荐内存：32GB+

如何选择？

下载操作

第四部分：运行模型

浮生札记