冬季 Swift 培训 · 正传之外：现代 AI 编程全景

你会得到什么

一张分层概念地图，知道每个词解决什么问题，不再“术语堆砌”。

核心思维

从“写 prompt”升级到“定义规范、构建闭环、评估结果”。

工程目标

把 AI 从一次性回答器，变成能持续完成任务的系统。

适配对象

面向 iOS/Apple 开发者，覆盖课堂项目与团队协作场景。

阅读建议： 先看第 2 节路线图和第 12 节总结，再按 3~11 节逐步补细节。每节都带了“能落地”的判断标准。

这节课想解决什么问题
整体路线图：五个台阶
第一阶：LLM
第二阶：Tool Calling
第三阶：RAG
第四阶：Agent
第五阶（上）：Skills
第五阶（下）：MCP
vibe coding：一种工作方式
现代编程范式的四个转变
面向 iOS/Apple 的成长路径
总结：完整概念地图

1) 这节课想解决什么问题

把“会用 AI”升级为“会设计 AI 工作流”

很多同学已经会用 ChatGPT / Claude / Cursor 写代码，但在工程层面还会卡在三个关键问题：能不能验证、能不能复用、能不能团队协作。

为什么有时编译通过，有时出现不存在的 API？
Agent 和普通对话到底差在哪？
RAG / Tool Calling / MCP 是并列概念还是上下层关系？

本讲义目标就是把这些问题压缩成一套可执行框架。

2) 整体路线图：五个台阶

五层不是替代关系，而是叠加关系

第 1 阶 LLM会生成，但没手没眼没记忆

第 2 阶 Tool Calling可执行、可验证

第 3 阶 RAG检索真实知识

第 4 阶 Agent多步计划与闭环

第 5 阶 Skills + MCP团队复用与标准化接入

3) 第一阶：LLM

LLM 是聪明的大脑，但天生“孤立”

断网：知识冻结在训练截止日。
没手：不能直接运行 `xcodebuild` 或改你项目文件。
没记忆：超出上下文窗口后不会自动保留长期经验。

“幻觉”不是偶然 bug，而是概率生成机制导致的结构性风险：它会优先生成“像答案”的文本，而不是“被验证的事实”。

工程结论： 只用 LLM 写代码，最多是“高效草稿”；要变成“可靠交付”，必须引入执行与检索能力。 

4) 第二阶：Tool Calling

给模型一双手：从“能写”到“能验证”

Tool Calling 的核心是：模型声明要调用什么工具，外部程序实际执行，再把结果回传给模型继续推理。

常见工具类型

终端编译、测试执行、文件系统、数据库查询、HTTP 请求、搜索引擎。

带来的质变

把“文本建议”升级为“工程闭环”：写完即跑、失败即修、可追踪可复现。

5) 第三阶：RAG

给模型一双眼：先查证再回答

RAG（检索增强生成）解决的是“知识来源不可信”的问题。模型先检索你的知识库，再基于检索片段生成回答。

可放入 README、架构约定、API 文档、历史踩坑记录。
可显著减少“风格漂移”和“项目内 API 幻觉”。

Tool Calling 关注什么

执行动作与实时结果，例如编译、测试、调用 API。

RAG 关注什么

回答依据与知识正确性，例如规范、设计决策、接口约束。

6) 第四阶：Agent

从“一问一答”到“持续做事”

Agent 的关键不是“会说话”，而是能在多步任务里持续循环：观察、思考、行动、再观察。

四大组件

Planning & Reasoning：任务拆解和动态调整
Memory：情节/语义/程序记忆
Tools：能操作真实环境
Environment：文件、Git、CI、外部服务

真实局限

长链路任务易跑偏
早期误判会在后续放大
幻觉触发错误行动链
需要人工设置关键检查点

7) 第五阶（上）：Skills

把“会做”变成“稳定可复现地做”

Skills 的价值是把团队隐性经验固化为可执行规则，避免同类任务每次都凭个人习惯随机发挥。

text

my-skill/
  SKILL.md
  scripts/
  templates/
  assets/

模块创建 Skill

自动生成 Model / ViewModel / View / Tests，强制 MVVM 约束。

质量检查 Skill

统一跑 SwiftLint、格式化、测试，并输出质量摘要。

PR 生成 Skill

自动产出改动说明、风险点、review 重点和变更记录。

团队收益

新成员直接复用流程，减少“靠口传”的培训成本。

8) 第五阶（下）：MCP

工具接入标准化：统一插头，而非重复造轮子

MCP（Model Context Protocol）解决的是“工具集成碎片化”：同一工具接入一次，多个 AI 应用可复用。

MCP Server

工具提供方，封装认证、权限和数据转换，并暴露标准能力。

MCP Client

AI 应用侧，发现并连接 Server，给模型暴露可用能力并回传结果。

区分关系：`Tool Calling` 是“模型如何调用工具”的机制层。
`MCP` 是“工具如何标准化接入与复用”的协议层。
`RAG` 主要负责“读取可靠知识”，MCP 还能执行写操作。

9) vibe coding：一种工作方式

它是交互范式，不是单一技术

vibe coding 的本质是“意图驱动 + 快速迭代”，你描述目标感觉，AI 产出代码，然后根据运行结果继续对话修正。

适合场景

Demo、PoC、学习探索、hackathon、小工具。

高风险场景

长期维护核心模块、性能敏感路径、安全敏感逻辑、多人共享代码。

实践建议： vibe coding 要配护栏，最低要求是 `看 diff + 跑测试 + 做代码审查`，否则技术债会非常快地累积。

10) 现代编程范式的四个转变

1. Code-first → Spec-first

先定义验收标准与边界，再让 AI 实现，不要让 AI 猜需求。

2. 文件生成 → 系统编排

关注完整交付链：检索、生成、验证、修复、文档、PR。

3. 一次性 Prompt → 可复用资产

把高频流程沉淀成 Skills，把工具接入标准化为 MCP。

4. 能跑就行 → 持续评估

持续检查覆盖率、性能、可维护性与边界行为，不只看“当前通过”。

11) 面向 iOS/Apple 的成长路径

Step 0

把 LLM 用好（基础）

你要能清晰描述输入/输出/边界，并能审查和手改 AI 代码。

Step 1

接入 Tool Calling（验证闭环）

每次生成后都跑编译与测试，养成“先验证再接受”的习惯。

Step 2

建设 RAG（项目知识）

把架构约定、API 说明、命名规范和历史坑文档化并可检索。

Step 3

升级 Agent（多步任务）

给出完整目标，设置关键检查点，让 Agent 做执行与反馈闭环。

Step 4

沉淀 Skills（团队规范）

把高频流程和质量要求固化为技能包，降低团队协作波动。

Step 5

标准化 MCP（统一工具接入）

把个人“本机可用”升级为团队“可复用、可维护、可扩展”。

12) 总结：完整概念地图

一句话总览： 现代 AI 编程不是“让 AI 帮你写几段代码”，而是构建一个可计划、可执行、可验证、可复用的工程系统。

LLM 决定“生成能力”。
Tool Calling 决定“执行与验证能力”。
RAG 决定“知识可靠性”。
Agent 决定“多步任务完成能力”。
Skills + MCP 决定“团队级复用与治理能力”。

主线之外 · 现代 AI 编程全景