从提示词工程到业务落地的系统化能力构建
完成本课程后,你将能够...
先搞懂AI是什么,才能用好它
AI(人工智能)= 让机器模拟人类智能的技术
能"看"图片、"听"语音、"读"文字、"写"内容
一种专门处理文字的AI,通过阅读海量文本学会"说人话"
千亿级参数
读过互联网大部分文本
专门处理文字
理解和生成自然语言
数学函数的集合
输入文字→输出文字
三阶段训练流程(后面逐一详解)
读海量文本
学语言规律
学习对话格式
学会问答
人类反馈强化
学会对齐
输入:"中国的首都是" → 模型预测 [北京: 0.95, 上海: 0.02, 南京: 0.01, ...]
正确答案是"北京",如果模型预测错了(比如给了"上海"高概率),就调整内部参数
参数 = 模型的"记忆容量",每个参数是一个可调节的数字
Supervised Fine-Tuning —— 教模型"对话"
预训练后的模型只会"续写",你问它问题,它可能会继续编造更多问题,而不是回答你
人工标注大量高质量对话样本(规模因项目而异,示意范围)
Reinforcement Learning from Human Feedback
同一问题生成多个回答
人工标注哪个更好
学会预测人类偏好
给回答打分
用PPO算法
让模型追求高分
问题:"帮我写一段刷好评的脚本"
回答A:"我无法帮助刷评价,这违反平台规则..." ✅ 被标为更好
回答B:"好的,你可以用以下代码..." ❌ 被标为更差
→ 奖励模型学会:拒绝违规请求 = 高分
让AI的行为符合人类的价值观和意图,而不只是"完成任务"
LLM不是"思考",而是基于概率预测"下一个最可能的词是什么"
示例:输入"今天天气真"
→ AI计算概率(示意):好(60%) | 不错(25%) | 糟糕(10%) | 热(5%)
→ 选择"好",继续预测下一个词...
→ 一个词一个词地"蹦"出完整句子
例:"人工智能" 可能被切成 ["人工", "智能"] 两个token
在选择下一个词时,是选最可能的那个,还是给其他词一些机会?
确定性高
总选最可能的词
适合:代码、事实问答
平衡
适合:一般对话
随机性高
更有创意但可能跑偏
适合:创意写作、头脑风暴
AI一本正经地说出错误的、编造的、不存在的信息,而且表现得非常自信
理解AI协作的本质,建立正确的能力模型
AI会不会取代我?
这个问题让你陷入被动防守
我如何与AI协作,创造更大价值?
这个问题让你主动进化
抗拒AI
被时代淘汰
接受AI指令
当执行工具
过度依赖
能力退化
基础使用
效率提升有限
指挥AI
显著放大价值
让AI当"老板",自己当"执行者"——接受AI的指令去干活,被AI牵着鼻子走
看似在用AI,实际被AI"废掉了"——过度依赖导致独立思考能力退化
成因:能力本来就弱
成因:用着用着退化了
不是"AI替代人",而是"人+AI"的乘数效应
定义问题
提供上下文
快速产出
多个方案
审核质量
判断适用
反馈调整
持续改进
"AI说的肯定对"
→ 正解:始终保持验证习惯
"一个提示词搞定一切"
→ 正解:复杂任务需要多轮迭代
"什么问题都能问AI"
→ 正解:识别适合AI的场景
"让AI替我想就行"
→ 正解:AI辅助思考,不替代思考
学会把模糊需求转化为AI能理解的结构化问题
"帮我写个方案"
AI不知道:什么方案?给谁看?
"写一份面向CEO的数字化转型提案,3页PPT"
AI清楚:目标、受众、格式
你想要AI帮你完成什么?要具体、可衡量
有哪些限制条件?格式、长度、风格、禁忌
上下文边界是什么?背景、受众、场景
什么样的输出算成功?期望标准
好的目标 = 具体 + 可衡量 + 有价值
约束越明确,输出越精准
| 约束类型 | 示例 |
|---|---|
| 格式约束 | JSON格式、Markdown表格、分点列表 |
| 长度约束 | 500字以内、3段话、不超过10条 |
| 风格约束 | 正式商务、轻松幽默、学术严谨 |
| 内容禁忌 | 不用专业术语、不提竞品名称 |
| 技术约束 | 使用Python 3.10、不用第三方库 |
上下文决定AI理解的深度
提前定义"成功标准",避免无限迭代
可能出什么问题?如何预防和应对?
AI可能编造事实
→ 要求提供来源
可能涉及版权隐私
→ 明确合规要求
输出可能有偏见
→ 多角度审核
| O 目标 | 撰写新功能发布公告,吸引用户尝试 |
| C 约束 | 300-500字,markdown格式,专业友好,不用绝对词汇 |
| R 范围 | 面向现有付费用户,发布在产品公告栏 |
| A 验收 | 包含:功能亮点3点、使用方法、升级指引 |
| +R 风险 | 避免过度承诺,不保证具体性能数字 |
掌握提示词的核心技巧,让AI精准理解你的意图
"你是一位资深的产品经理..."
"请帮我分析以下用户反馈..."
"这是一款B端SaaS产品..."
"以表格形式呈现..."
"参考以下格式:[示例]"
给AI看1-3个例子,比长篇描述更有效
任务:将普通标题改写成吸引点击的标题
示例1:"如何提高效率" → "5个效率翻倍秘诀,第3个很多人不知道"
示例2:"数据分析入门" → "0基础也能学会!数据分析师第一课"
现在请改写:"Python学习指南"
复杂问题要求AI"一步一步来"
"这个方案有什么问题?"
"请从以下角度逐一分析:
1.目标人群
2.渠道选择
3.预算分配"
按以下格式输出: ## 标题 ### 要点1 - 具体内容 ### 要点2 - 具体内容 ## 总结
学会管理对话上下文,让AI始终保持最佳状态
适用:单个事实错误
适用:方向跑偏
当对话已经"带歪"到无法挽回时,果断开新窗口。不要试图在烂泥里找金子。
通过对话迭代,逐步逼近理想结果
写超长提示词,塞入所有要求
结果:经常失望
先核心要求,再逐步调整
结果:更易达预期
先让AI给多个方向,再选择深入
"给3个方案" → "展开第2个"
先要框架,再填充细节
"先给大纲" → "展开第一部分"
基于输出给反馈调整
"语气太正式,轻松一些"
让AI自查或多角度验证
"检查代码bug" → "考虑边界"
建立质量保障机制,确保AI输出可靠可用
AI会自信地编造不存在的事实
训练数据有截止日期
可能带有隐性偏见
复杂推理可能有漏洞
数据是否准确?
引用是否存在?
信息是否最新?
前提假设合理吗?
有隐含假设吗?
假设被说明了吗?
逻辑链条完整吗?
结论有支撑吗?
有逻辑跳跃吗?
场景化应用 · 知识内化 · 团队协作 · 综合实战
将AI能力映射到具体工作场景
商务邮件、回复模板
会议纪要、报告撰写
数据解读、趋势分析
代码生成、Bug修复
头脑风暴、方案构思
概念解释、知识问答
* 以下为内部模拟数据,仅作教学演示用途
在启动前预判可能的失败点
"AI能直接出成品"
实际:AI出60分初稿,人工打磨到90分
"所有任务都上AI"
实际:合规审核、敏感决策不适合
"AI输出直接用"
实际:幻觉问题导致重大失误
不只是使用AI,更要通过AI学习成长
提出问题
AI输出
核实思考
形成能力
1. 我能不看AI,自己说清楚吗?
→ 不能 = 还没内化
2. 换个场景,我能迁移应用吗?
→ 不能 = 只学了表面
3. 别人问我,我能教会他吗?
→ 不能 = 理解还不透
积累可复用资产,提升长期效率
不用每次从零开始
验证过的模板更可靠
最佳实践可传播
实际场景验证
哪里效果好/不好
调整措辞/结构
保存并标注版本
建立团队AI使用标准,释放组织效能
| 执行步骤 | 运营用OCRA框架写提示词 → AI生成5版文案 → 运营筛选2版 → 法务合规审核 → 投放测试 |
| 审核清单 | ☐ 无夸大宣传 ☐ 无竞品贬低 ☐ 数据有出处 ☐ 符合平台规范 |
| 责任归属 | 运营对最终素材负责,AI工具作为辅助,在文档中标注"AI辅助生成" |
| 知识沉淀 | 效果好的提示词存入团队Notion,附上CTR/CVR数据 |
目标:全员达到
目标:骨干达到
目标:管理者达到
整合所学,完成真实工作场景任务
完成工作方案初稿
设计3套常用邮件
分析业务数据报告
回顾要点,开启AI协作新征程
你要成为AI的指挥官,而不是AI的奴隶或被AI奴役
学习只是开始,实践才能成长