人工智能课程ppt提纲

Posted Nov 22, 2025 Updated Dec 4, 2025

By tianyongcan

63 min read

人工智能课程ppt提纲

这份提纲是根据您提供的《第一章人工智能概述》PPT内容整理的，专为开卷考试快速索引设计。

第一章人工智能概述复习提纲

1.1 人工智能的概念

定义：
- 由计算机实现的人造智能，模拟、延伸、扩展人类智能 1。
图灵测试 (Turing Test)：
- 提出者：阿兰·图灵（Alan Turing），计算机科学与人工智能之父 2。
- 标准：如果一个人在相当长时间内无法区分对话对象是人还是机器（30%的人误判），则机器具有智能 3333。
智能的特征：
- 感知能力（视觉、听觉等）4。
- 记忆与思维能力（逻辑思维、形象思维）5。
- 学习与自适应能力 6。
- 行为能力 7。
研究目标：
- 延伸和增强人类能力，实现人机和谐共生 8。
表现形式：
- 智能软件：专家系统、知识库 9。
- 智能设备：嵌入式系统（智能家电、智能仪表）10101010。
- 智能机器：机器人（如智能汽车）11111111。
- 智能系统：智能网络、多智能体系统（MAS）、Agent 121212121212121212。
- 最新进展 (2025)：AI智能体元年，通用智能体 “Manus” 13。

1.2 人工智能的研究途径与方法

符号主义 (Symbolism)：
- 别名：功能模拟学派、逻辑主义 141414。
- 核心：物理符号系统假设，基于知识和推理（显式知识）151515。
- 代表：纽厄尔、西蒙、专家系统 16。
连接主义 (Connectionism)：
- 别名：结构模拟学派、仿生学派 171717。
- 核心：神经网络，数值计算，模拟大脑生理结构 181818。
- 代表：M-P模型、感知器、BP算法、深度学习 19。
行为主义 (Behaviorism)：
- 别名：行为模拟学派、进化主义、控制论学派 202020。
- 核心：感知-动作模式，与环境交互，自适应 212121。
- 代表：Brooks（六足机器人）22。
集成模拟法：三种方法取长补短 23232323。

1.3 人工智能的分支领域

基于脑功能模拟：
- 机器感知：模式识别（图形识别、语音识别）24。
- 机器联想：联想存储 25。
- 机器推理：演绎、归纳、类比推理；自然演绎法、判定法、归结原理 26262626。
- 机器学习：机械学习、归纳学习、数据挖掘 27272727。
- 机器理解：自然语言理解 (NLP)、图形理解 28282828。
- 机器行为：机器人行动规划 29292929。
基于实现技术领域划分
- 符号智能
- 计算智能
基于应用领域
- 问题求解与博弈
- 逻辑推理与证明
- 计算智能
- 分布式人工智能
- 自动程序设计
- 专家系统
- 机器学习
- 自然语言理解
- 机器人学
- 模式识别
- 机器视觉
- 神经网络
- 。。。
基于技术/应用系统：
- 专家系统 (ES)：模拟专家决策，含有大量专门知识 30303030。
- 博弈：下棋（深蓝、AlphaGo、Libratus）31。
- 分布式人工智能 (DAI)：分布式问题求解、多智能体系统 (MAS/Agent) 32323232。
- 计算智能：神经网络、进化计算（遗传算法）、模糊技术 33333333。
- 机器视觉：图像处理、检测 34。
- 智能控制：无需人工干预的自动控制 35。
常用编程语言：Python, Java, C++, Lisp, Prolog 36。

1.4 人工智能的基本技术

推理技术 37。
搜索技术 38。
知识表示与知识库技术 39。
归纳技术 40。
联想技术 41。

1.5 人工智能的发展历史

孕育期 (1956前)：图灵机、M-P神经元模型 42。
诞生 (1956)：达特茅斯会议 (Dartmouth Workshop)，麦卡锡提出“人工智能”一词 43。
发展阶段：
1. 神经元网络时代 (40s-50s)：感知器，受限于XOR问题 (Minsky) 44。
2. 通用方法时代 (50s-60s)：逻辑理论机(LT)、通用问题求解(GPS) 45。
3. 知识工程时代 (60s-80s)：专家系统 (DENDRAL, MYCIN)，费根鲍姆提出“知识工程” 46464646。
4. 神经网络复苏 (80s-90s)：Hopfield网、BP算法 47474747。
5. 数据与网络时代 (90s-2000s)：深蓝战胜卡斯帕罗夫，数据挖掘 48484848。
6. 深度学习时代 (2006至今)：Hinton提出深度置信网络，AlphaGo，大模型 49。
大模型 (Large Models)：海量参数，预训练+微调，通用性强 50。

1.6 人工智能的典型应用

金融：智能风控、智能投研 51。
公共安全：生物特征识别（人脸、指纹）、智能办案 52。
医疗健康：医学影像分析（腾讯觅影）、手术机器人（天玑）、药物设计 535353535353535353。
交通出行：自动驾驶（L1-L5分级），百度无人车、奥迪L3 545454545454545454。
其他：智能教育、工业制造、娱乐（冬奥会机器人）、智能客服 55555555555555555555555555555555。
国家创新平台：百度（自动驾驶）、阿里云（城市大脑）、腾讯（医疗影像）、科大讯飞（智能语音）56。

1.7 未来发展趋势与挑战

趋势：
- 从专用智能向通用智能 (AGI) 发展 57。
- 从人工+智能向自主智能系统发展 58。
- 人机混合智能 59。
- 大模型方向：对齐、多模态、智能体 (Agent)、具身智能 60。
挑战 (伯克利视角)：
- 持续学习、鲁棒决策、可解读性 (Explainable AI)、安全飞地、对抗学习、数据隐私 61。
国家战略：
- 中国：《新一代人工智能发展规划》（2017），三步走战略 (2020, 2025, 2030) 62626262。
- 美国：“美国人工智能计划”，保持霸主地位 63。这是根据您提供的第二章PPT内容整理的复习提纲，专为开卷考试快速检索设计。

第二章知识表示复习提纲

2.1 概述

知识工程 (Knowledge Engineering)
- 定义：利用计算机/通信技术实现知识的自动转移和应用 1。
- 包含环节：知识获取、知识表示、知识应用 2。
- 核心地位：爱德华·费根鲍姆 (Edward Feigenbaum) 于1977年提出 3。
- 大数据时代特征：从数据到智慧 (Smart Data) 4。
知识的概念与分类
- 按作用分类：
  - 描述性知识 (事实性) 5555。
  - 判断性知识 (启发性/规则) 6666。
  - 过程性知识 (控制策略) 7777。
- 按层次分类：
  - 对象级知识 (领域相关) 8。
  - 元级知识 (关于知识的知识) 9。
知识表示 (Knowledge Representation)
- 构成：符号 (结构) + 处理机制 10。
- 要求：表示能力、可理解性、便于获取、便于搜索、便于推理 11。

2.2 知识表示的基本方法

2.2.1 谓词逻辑表示法
- 基础：命题逻辑与谓词逻辑 (形式语言) 12。
- 特点：自然性、精确性、严密性、容易实现 13。
- 局限：不能表示不确定性、组合爆炸、效率低 14。
- 应用：PROLOG语言 15。
2.2.2 产生式表示法 (Production Systems)
- 规则形式：IF P THEN Q (前提 -> 结论/动作) 16。
- 系统组成：
  - 规则库 (Rule Base)：存储领域知识 17171717。
  - 综合数据库 (Fact Base/Dynamic DB)：存放事实、中间结果 18181818。
  - 推理机 (Inference Engine)：控制系统 (匹配、冲突解决、操作) 19191919。
- 推理方式：
  - 正向推理 (数据/事实 -> 目标) 20。
  - 反向推理 (目标 -> 初始事实) 21。
  - 双向推理。
- 冲突解决策略：专一性排序、规则排序、规模排序、就近排序 22222222。
- 优缺点：清晰、模块化、自然；但难扩展、效率低 23。
2.2.3 框架表示法 (Frame Representation)
- 结构：框架名、槽 (Slot)、侧面 (Facet)、值 (Value) 24。
- 特性：继承性 (子框架继承父框架槽值) 25。
- 推理方法：匹配、搜索、填槽 26。
- 特点：结构化强，但缺乏理论体系 27。
2.2.4 语义网络表示法 (Semantic Networks)
- 定义：节点 (事物/概念) + 有向边 (关系) 28。
- 常用关系：
  - 实例关系 (ISA / is-a) 29。
  - 分类/泛化关系 (AKO / a-kind-of) 30。
  - 聚集/整体部分关系 (A-part-of) 31。
  - 属性关系、成员关系 (a-member-of)、逻辑关系 (AND/OR)、方位关系 32。
- 复杂表示：事件节点法、全称/存在量词表示 33333333。
- 推理过程：继承推理、匹配推理 34。
- 特点：结构性、联想性、自索引性 35。

2.3 知识图谱 (Knowledge Graph)

2.3.1 概念
- 定义：描述客观世界的概念、实体、事件及其关系，通常用三元组 (资源-属性-属性值) 表示 36。
- 起源：Google (2012) 37。
- 组成：知识 (数据特征) + 图谱 (结构特征) 38。
2.3.2 体系架构与关键技术
- 逻辑架构：模式层 (Ontology) + 数据层 (Graph DB) 39。
- 构建流程 (以CN-DBpedia为例)：
  1. 信息抽取 (Extraction)：爬虫、文档解析、深度学习(LSTM-RNN) 40404040。
  2. 信息对齐/标准化 (Normalization) 41。
  3. 知识链接/分类 (Enrichment) 42。
  4. 信息修正 (Correction)：错误发现、众包修正 43。
  5. 内容更新 (Update)：周期+动态 44。
  6. 知识存储 (Storage) 45。
- 相关技术：知识推理、知识问答 46。
2.3.3 典型知识图谱
- 通用：Freebase, Wikidata, DBpedia, YAGO, CN-DBpedia, XLORE 47。
2.3.4 主要应用
- 辅助搜索 (语义搜索)、辅助问答 (Siri/WolframAlpha)、辅助决策、辅助AI (常识推理)、垂直领域 (金融/电商) 48。
2.3.5 特点与趋势
- 特点：逻辑推理、可解释性、自然关联 49。
- 研究热点：LLM融合、多模态KG、动态/实时KG、区块链结合、跨语言KG 50。

附录：专家系统 (Expert Systems)

定义与特点：
- 基于知识的智能系统，分离了知识与推理 51。
- 特点：启发性、透明性 (解释功能)、灵活性 52。
系统结构 53535353：
- 知识库：核心，含领域知识与元知识。
- 推理机：模拟思维，执行控制循环 (匹配-选择-执行)。
- 动态数据库：黑板/工作区。
- 人机界面。
- 解释模块：回答 How & Why。
- 知识库管理系统。
推理技术：
- 假言推理 (Modus Ponens) vs. 拒取式 (Modus Tollens) 54。
- 正向推理 (数据驱动) vs. 反向推理 (目标驱动) 55。
典型系统实例：
- DENDRAL：第一个专家系统 (化学) 56。
- MYCIN：医疗诊断 (血液感染)，使用产生式规则 57。
- PROSPECTOR：地质勘探 58。
新型专家系统：
- 黑板模型 (Blackboard Model) 59。
- 分布式/协同专家系统 (Multi-agent) 60。
- 模糊专家系统、神经网络专家系统 61616161。这是根据您提供的第三章PPT内容整理的复习提纲，专为开卷考试快速检索设计。

第三章通过搜索进行问题求解复习提纲

3.1 问题求解智能体 (Problem-Solving Agents)

基本定义：通过传感器感知环境，通过执行器作用于环境 1。
处理流程：目标形式化 $\rightarrow$ 问题形式化 $\rightarrow$ 搜索 $\rightarrow$ 执行 2。
- 搜索 (Search)：在模型中模拟动作序列，直到找到通往目标的路径 3333。

3.2 问题形式化 (Problem Formulation)

5个组成部分 4444：
1. 状态空间 (State Space)：所有可能状态的集合。
2. 初始状态 (Initial State)：智能体启动时的状态。
3. 目标状态 (Goal State)：一个或多个目标状态的集合。
4. 动作 (Actions)：智能体可采取的行动。
5. 转移模型 (Transition Model)：描述动作产生的结果。
相关概念：
- 路径代价 (Path Cost)：通常是动作代价的累加。
- 最优解 (Optimal Solution)：路径代价最小的解 5。
典型问题示例：
- 8数码问题 (8-puzzle)：标准化问题 6。
- 寻径问题 (Route Finding)：真实世界问题（如罗马尼亚地图、航空旅行） 7。

3.3 搜索算法基础

树搜索 (Tree Search)：
- 基本思想：从初始状态出发，探索路径，构建搜索树 8。
- 节点 (Node) vs 状态 (State)：节点是数据结构（含父节点、深度、路径代价$g(x)$），状态是物理配置 9。
性能评估指标 10：
1. 完备性 (Completeness)：有解时是否保证找到解。
2. 时间复杂度 (Time Complexity)：生成/扩展的节点数。
3. 空间复杂度 (Space Complexity)：内存中存储的最大节点数。
4. 最优性 (Optimality)：是否找到代价最低的解。

3.4 无信息搜索策略 (Uninformed Search)

定义：只使用问题定义中的信息，不包含目标位置线索 11。
1. 广度优先搜索 (BFS) 12
- 策略：先扩展根节点，再层层扩展（FIFO队列）。
- 性质：完备（若分支因子$b$有限）；最优（若步长代价相等）；时间/空间复杂度均为 $O(b^{d+1})$。
- 缺点：空间（内存）需求巨大。
1. 一致代价搜索 (Uniform-Cost Search) 13
- 策略：扩展$g(n)$（路径代价）最小的节点（优先队列）。
- 性质：完备；最优；类似于BFS但按代价扩展。
1. 深度优先搜索 (DFS) 14
- 策略：优先扩展最深的节点（LIFO队列）。
- 性质：不完备（可能陷入死循环）；不最优；时间 $O(b^m)$；空间 $O(bm)$（线性空间，内存消耗小）。
1. 深度受限搜索 (DLS) 15
- 策略：DFS加上深度界限 $L$。
1. 迭代加深搜索 (IDS) 16
- 策略：反复调用DLS，界限 $L=0, 1, 2, \dots$。
- 性质：完备；最优（若步长代价=1）；时间 $O(b^d)$；空间 $O(bd)$。
- 评价：结合了BFS的完备性/最优性和DFS的空间优势，是首选的无信息搜索策略。

3.5 有信息 (启发式) 搜索策略 (Informed Search)

定义：利用启发式函数 $h(n)$ 提供目标位置线索 17。
评估函数 $f(n)$：
- $g(n)$：从初始状态到 $n$ 的实际代价。
- $h(n)$：从 $n$ 到目标的估计代价。
1. 贪心最佳优先搜索 (Greedy Best-First Search) 18
- 策略：扩展 $h(n)$ 最小的节点（看起来离目标最近）。
- 性质：不完备（可能死循环）；不最优；时间/空间 $O(b^m)$。
1. A 搜索 (A Search)** 19
- 策略：扩展 $f(n) = g(n) + h(n)$ 最小的节点。
- 性质：
  - 完备性：是（除非有无穷多节点 $f \le f(G)$）。
  - 最优性：是（前提是 $h(n)$ 是可采纳的/一致的） 20202020。
- 应用案例：八数码、修道士和野人、游戏寻路 21。

3.6 启发式函数 (Heuristic Functions)

可采纳性 (Admissibility)：$h(n) \le h^*(n)$，即从不高估到达目标的代价 22222222。
一致性 (Consistency/Monotonicity)：满足三角不等式 $h(n) \le c(n, a, n’) + h(n’)$ 23。
典型例子 (8数码问题) 24：
- $h_1$：错位滑块的数量。
- $h_2$：曼哈顿距离（所有滑块到目标位置的距离之和）。
- 比较：$h_2 \ge h_1$，故 $h_2$ 优于（支配）$h_1$，搜索节点更少 25。
构造方法：从松弛问题（Relaxed Problem，减少限制条件）的精确解推导 26。
- 例如：TSP问题的松弛版本是最小生成树 27。这是根据您提供的第四章PPT内容整理的复习提纲，专为开卷考试快速检索设计。

第四章复杂环境中的搜索复习提纲

4.1 局部搜索和优化问题

基本概念
- 适用场景：路径无关，目标状态即是解（优化问题）1。
- 特点：迭代改进，只保持当前状态，内存占用少 2。
- 状态空间地形：全局最大值、局部最大值、山肩、平坦最大值 3。
爬山法 (Hill Climbing)
- 定义：贪心局部搜索，向最陡上升方向移动 4。
- 缺陷：易陷入局部极大值、平台区（山肩）5。
- 变体：随机爬山法、随机重启爬山法 6。
模拟退火 (Simulated Annealing)
- 原理：结合爬山法和随机游走，允许以一定概率接受“坏”移动 7。
- 机制：概率随 $\Delta E$ 和温度 $T$ 变化 8。
- 性质：$T$ 下降足够慢时，能找到全局最优解（玻尔兹曼分布）9。
局部束搜索 (Local Beam Search)
- 原理：保留 $k$ 个状态，并行搜索 10。
- 变体：随机束搜索（增加多样性）。
进化算法 (Evolutionary Algorithms)
- 原理：随机局部束搜索 + 后代生成（自然选择隐喻） 11。
- 关键步骤：选择 (Selection)、杂交 (Crossover)、突变 (Mutation) 12。
连续状态空间搜索
- 方法：梯度上升/下降 ($\nabla f$) 13。
- 迭代求根：Newton-Raphson 方法 14。

4.2 非确定性与部分可观测环境搜索

非确定性动作 (Nondeterministic Actions)
- 概念：信念状态 (Belief State)，结果是条件规划 (Contingency Plan) 15。
- 模型：与或搜索树 (AND-OR Search Trees) 16。
  - “或”节点：智能体的选择。
  - “与”节点：环境的选择（分支）。
- 实例：不稳定的真空吸尘器世界 17。
- 策略：反复尝试 (Try-Again) 18。
部分可观测环境 (Partially Observable)
- 基本流程：预测 (Prediction) $\rightarrow$ 可能感知 (Possible Percepts) $\rightarrow$ 更新 (Update) 19。
- PERCEPT(s) 函数。

4.3 博弈搜索 (Game Theory)

基本概念
- 类型：双人完备信息博弈 (Zero-sum)、机遇性博弈 20。
- 博弈树：MAX节点（我方）与 MIN节点（对手）交替 21。
极大极小过程 (Minimax)
- 原理：MAX选择最大估值，MIN选择最小估值 22。
- 估价函数：对叶节点进行静态估值 23。
$\alpha-\beta$ 剪枝 (Alpha-Beta Pruning)
- 目的：减少搜索节点，提高效率 24。
- $\alpha$ 值：MAX节点当前最大下界。
- $\beta$ 值：MIN节点当前最小上界。
- 规则：
  - $\beta$ 剪枝：MAX节点 $\alpha \ge$ 先辈 $\beta$。
  - $\alpha$ 剪枝：MIN节点 $\beta \le$ 先辈 $\alpha$。

4.4 案例分析：AI围棋 (AlphaGo)

发展历程
- AlphaGo Fan (2015) $\rightarrow$ AlphaGo Lee (2016) $\rightarrow$ Master (2017) $\rightarrow$ Zero (2017) 25。
核心技术体系
1. 蒙特卡罗模拟 (Monte Carlo Simulation)：随机对弈评估盘面 26。
2. 多臂老虎机问题 (Multi-armed Bandit)：UCB/UCT 算法平衡探索与利用 27。
3. 蒙特卡罗树搜索 (MCTS) 28：
  - 四个步骤：选择、扩展、模拟、更新。
  - 结合离线知识：Elo Rating 排序、剪枝 29。
4. 深度神经网络 30303030：
  - 策略网络 (Policy Network)：减少搜索宽度（选点）。
  - 值网络 (Value Network)：减少搜索深度（局面评估）。
AlphaGo Zero 的改进 31
- 自对弈强化学习 (无人类棋谱)。
- 策略与价值网络合二为一。
- 不再使用随机模拟 (Rollout)。
- 使用残差网络 (ResNet)。

4.5 AI 前沿应用

化学/生物领域
- AlphaFold：蛋白质结构预测 (2024诺贝尔化学奖相关) 32。
- 逆向合成分析：化学界的 “AlphaGo”，利用 MCTS 和深度学习规划合成路径 33。
AutoML (自动机器学习)
- 目标：自动化模型设计、超参数优化 34。
- NAS (神经架构搜索)：搜索最优网络结构 35。
- ENAS (高效神经架构搜索)：通过参数共享 (Parameter Sharing) 提高效率 36。这是根据您提供的第六章PPT内容整理的复习提纲，专为开卷考试快速检索设计。

第六章智能体与多智能体系统复习提纲

6.1 概述

智能体 (Agent) 定义：驻留在某一环境下，能够自主 (Autonomous)、灵活 (Flexible) 地执行动作以满足设计目标的行为实体 1。
特征：
- 驻留性：驻留在环境中，通过感知输入和动作输出与环境交互 2。
- 自主性：无外部干涉下自主运行，控制自身行为 3。
- 灵活性：
  - 反应性 (Reactive)：感知环境并适时反应 4。
  - 自发性 (Pro-active)：主动产生目标并实施行为 5。
  - 社会性 (Social)：与其他智能体交互、合作、协商 6。
Agent要素 (BDI模型)：认知 (信念)、情感 (愿望)、意向 (意图) 7。

6.2 Agent及其结构

计算机系统中的地位：独立的功能模块/应用系统，含决策生成器（核心主控）8。
结构分类：
1. 反应式 Agent：基于简单的“感知-动作”规则 (if-then)，无复杂推理 9。
2. 慎思式 Agent：基于知识库的逻辑推理 (如 BDI模型)，行为决策是定理证明过程 10。
3. 跟踪式 Agent：维护内部状态，跟踪世界变化和自身影响 11。
4. 基于目标的 Agent：结合目标信息与动作结果进行决策 12。
5. 基于效果 (Utility) 的 Agent：使用效用函数衡量状态满意度，追求高质量结果 13。
6. 复合式 Agent：集成多种结构层次 14。
软件 Agent：后台进程 (Demon)，如杀毒软件监控模块 15。
人工生命 Agent：具有自我成长、繁殖能力的动态实体 16。

6.3 多智能体系统 (MAS)

定义：多个相对独立又相互作用的智能体构成的系统 17。
特点：
- 智能体间交互与协同：通过通信语言 (ACL) 交互，无全局控制 18。
- 无全局观点：各智能体信息不完整 19。
- 不可预测性：环境开放、动态 20。
应用示例：
- 物理MAS：恒温调控系统 21。
- 软件MAS：病毒防护系统 22。
- 场景：低空经济多无人机配送 23、火星探矿机器人 24。

6.4 Agent通信

通信方式：
- 消息传递 (需通道，如TCP/IP)。
- 黑板系统 (共享存储区)。
- 邮箱 (暂存) 25。
言语行为理论 (Speech Act Theory)：断言型、指示型、承诺型等 26。
通信语言 (ACL)：
- 功能：表达交互意图 (语用) 和内容 (语义) 27。
- 代表语言：KQML (知识查询与操纵语言)、FIPA ACL 28。
- FIPA ACL通信行为：Inform (通知), Request (请求), Agree (同意), Refuse (拒绝), Propose (提议), CFP (招标) 等 29。
- 消息结构：包含 sender, receiver, content, ontology, protocol 等 30。

6.5 协调与协作

协调 (Coordination)：解决冲突 (死锁/活锁)，调整意图以适应环境和其他Agent 3131。
- 方法：组织结构化、合同、多Agent规划、协商 32。
协作 (Cooperation)：非对抗Agent间为共同目标工作 33。
- 类型：协作型、自私型、混合型 34。
- 过程：产生需求 $\rightarrow$ 协作规划 $\rightarrow$ 寻求伙伴 $\rightarrow$ 选择方案 $\rightarrow$ 实现目标 $\rightarrow$ 评估 35。
交互协议与模型：
- 合同网协议 (Contract Net Protocol, CNP)：管理器 (Manager) 发布任务 (招标) $\rightarrow$ 参与者 (Bidder) 投标 $\rightarrow$ 管理器中标 $\rightarrow$ 签订合同 36。
  - 适用场景：任务分配、负载均衡。
- 协商机制：投票、拍卖、谈判 37。
案例 (EINSTein)：基于多Agent的作战仿真，研究高层涌现行为 38。

6.6 移动Agent (Mobile Agent)

定义：能自主在网络主机间移动的Agent，支持“代码移向数据” 39393939。
状态：程序状态 (代码)、数据状态 (变量)、执行状态 (线程) 40。
- 强移动：携带全部三种状态。
- 弱移动：仅携带程序和数据状态。
关键技术：
- 通信：移动Agent与服务Agent (C/S)、Agent间 (P2P)、组通信 41。
- 安全性：主机保护 (防恶意Agent)、Agent保护 (防恶意主机) 42。
- 容错与管理 43。
应用：移动计算、网络管理、分布式信息检索 44。

6.7 多Agent系统开发框架 JADE

简介：Java Agent DEvelopment Framework，遵循FIPA规范的开源中间件 45。
组成：
- 软件开发包：封装Agent通信等功能。
- 运行环境：主容器 (Main Container) + 普通容器，提供AMS (管理系统) 和 DF (目录服务/黄页) 46。
- 图形化工具：调试与管理工具。
通信机制：容器内 (Java事件)、容器间 (RMI)、平台间 (IIOP) 47。
编程模型：setup() 初始化，addBehaviour() 添加行为 (如 CyclicBehaviour, OneShotBehaviour) 48。

6.8 案例：火星探矿机器人

场景设计：M×M网格环境，包含矿产、障碍物、能量站 49。
Agent能力：移动、探测、采集、卸载、交互 50。
多Agent模式：
- 场景二：同构Agent合作 (信息共享)。
- 场景三：异构Agent合作 (多角色：采矿Agent + 探测Agent) 51。
JADE实现：定义不同类型的Agent类，通过ACL消息进行坐标和矿产信息的交互 52。这是根据您提供的第七章PPT内容整理的复习提纲，专为开卷考试快速检索设计。

第七章机器人复习提纲

7.1 机器人基本概念

定义：通过操纵真实世界去完成任务的实体智能体 1。
组成：
- 实体效应器 (Effectors)：腿、轮子、关节、夹具（如平行钳、三指夹具、Shadow灵巧手）2。
- 传感器 (Sensors)：
  - 被动式：摄像头（立体视觉）、麦克风、GPS。
  - 主动式：声纳、雷达、扫描激光雷达（LiDAR）3。
  - 内部测量：陀螺仪、加速度计、力矩传感器。
- 执行器 (Actuators)：电动、液压、气动；驱动关节（旋转、平移、球形）运动 4。
类型：
- 机械手 (Manipulators)：固定基座，如工业机械臂。
- 移动机器人 (Mobile Robots)：UAV（无人机）、AUV（水下）、自主无人车、腿式机器人。
- 其他：假体、外骨骼、具身智能机器人。

7.2 机器人学解决的问题

三级层次结构 5：
1. 任务规划 (Task Planning)：高层级动作策略（如“移动到门口”）。
2. 运动规划 (Motion Planning)：从点到点的路径规划。
3. 控制 (Control)：驱动执行器完成运动。
核心特性：连续状态/动作空间、非确定性、部分可观测。

7.3 机器人感知 (Perception)

任务：将传感器测量值映射到环境的内部表示。
定位 (Localization)：确定机器人在哪。
- 蒙特卡罗定位 (MCL)：基于粒子滤波 6。
- 卡尔曼滤波 (Kalman Filter)：高斯分布后验概率；EKF（扩展卡尔曼滤波）用于非线性模型 7777。
SLAM (同时定位与地图构建)：在未知环境中同时构建地图和定位 8。
机器学习应用：自监督学习、无监督学习（低维嵌入）。

7.4 规划及控制

基本概念：
- 工作空间 (Workspace)：机器人移动的物理空间。
- 构形空间 (Configuration Space, C-space)：所有构成机器人的点的抽象多维空间 9。
运动规划方法 10：
- 沃罗诺伊图 (Voronoi Diagram)：基于障碍物距离划分区域，路径远离障碍物 11。
- 概率路线图 (PRM)：采样无碰撞里程碑并连接。
- 快速探索随机树 (RRT)：双向生长树结构，概率完备 12。
- 轨迹优化：利用势场法使路径远离碰撞 13。
轨迹跟踪控制：
- P控制器 (比例)：反比于误差的力，不严格稳定（易抖动）。
- PD控制器 (比例微分)：增加微分项，严格稳定 14。
- PID控制器：比例积分微分。
- 计算扭矩控制：结合逆动力学模型和反馈误差补偿。

7.5 规划不确定的行动

问题：动作执行有误差（如速度不确定性圆锥）15。
策略：
- 精细运动规划 (Fine-motion planning)：设计一系列保护移动（如沿着墙滑入孔洞）。
- 在线重规划。
- 信息收集动作：如海岸导航启发式（靠近地标以减少不确定性）。

7.6 强化学习与具身智能

强化学习 (RL)：
- 挑战：连续状态空间、样本复杂性（Sim-to-Real迁移）。
- 方法：端对端学习、元学习。
具身智能 (Embodied AI) 16：
- 定义：基于物理身体进行感知和行动的智能系统。
- 核心要素：本体、智能体、数据、学习进化框架。
- 关键技术：芯片（GPGPU/FPGA/ASIC）、传感器、伺服电机（直驱）、AI算法、云服务。
- 趋势：跨模态交互、自适应学习、人机共栖 17。

7.7 人类和机器人协作

博弈模型：将人机交互建模为不完全信息博弈。
预测与协调：
- 预测人类动作（由于人类不是完美理性的）。
- 协作目标：联合优化代价函数 ($J_H = J_R$)。
学习人类意图：
- 逆强化学习 (Inverse RL)：从人类演示中推断代价函数（偏好学习）。
- 模仿学习：行为克隆。

7.8 应用领域

工业：装配、搬运。
医疗：手术机器人（达芬奇）、康复外骨骼。
服务：扫地机器人 (Roomba)、配送无人机。
自动驾驶：特斯拉、Waymo。
探索：火星车 (Curiosity)。这是根据您提供的第八章PPT内容整理的复习提纲，专为开卷考试快速检索设计。

第八章自然语言处理技术复习提纲

8.1 自然语言理解的一般问题

基本概念
- 语言智能：基于人类自然语言属性，探索语言活动运作机理，赋予机器类人语言活动功能 1。
- 自然语言特点：多义性、上下文相关性、模糊性、非系统性、环境相关性 2。
- 自然语言理解 (NLU) 定义：
  - 微观：从自然语言到机器内部的一个映射 3。
  - 宏观：机器能够执行人类期望的语言功能（如回答问题、文摘生成、翻译等）4。
发展阶段
1. 理性主义 (符号逻辑)：萌芽期至90年代初，以规则、词典、模板为主 55。
2. 经验主义 (统计学习)：90年代初至2013年，以语料、特征、统计模型（N-Gram, HMM, SVM）为主 66。
3. 连结主义 (深度学习)：2013年至今，多层神经网络（Deep Learning, LSTM, Transformer, BERT, LLM） 777。
理解的层次
1. 韵律学 (Prosody)：节奏和语调 8。
2. 音韵学 (Phonology)：声音的形成（语音识别基础） 9。
3. 词态学 (Morphology)：单词的构成（词素、前缀、后缀） 10。
4. 语法/句法 (Syntax)：单词组合成短语/句子的规律 11。
5. 语义学 (Semantics)：单词、短语和句子的意思 12。
6. 语用学 (Pragmatics)：语言的使用方法及对听众的效果（环境知识） 13。
7. 世界知识 (World Knowledge)：通用背景知识 14。

8.2 词法分析

任务：单词切分、找出词素、确定词义 15。
英语词法分析
- 特点：有词性、数、时态、派生、变形；词根只有一个 16。
- 算法：查词典 -> 若未找到则修改单词 (去掉后缀等) -> 重复 17。
- 难点：词义判断（需依赖上下文） 18。
汉语分词
- 难点：
  1. 切分歧义：
    - 交集歧义：如“地面积” (地面/积 vs 地/面积) 19。
    - 组合歧义：如“把手” (动词+名词 vs 名词) 20。
  2. 未登录词 (OOV)：新词、网络流行语 (如“给力”) 21。

8.3 句法分析

短语结构文法
- 定义：$G=(T, N, S, P)$，其中 $T$为终结符，$N$为非终结符，$S$为起始符，$P$为产生式规则 22。
- 推导：利用产生式规则将符号串重写，直到生成句子 23。
Chomsky 文法体系 (四种形式) 24
- 0型文法：无约束短语结构文法 (能力最强，很少用于NLP) 25。
- 1型文法：上下文有关文法 (Context-Sensitive)，自然语言属于此类 26。
- 2型文法：上下文无关文法 (Context-Free)，规则 $A \rightarrow x$ 27。
- 3型文法：正则文法 (Regular)，包括左/右线性文法 28。
分析方法
- 句法分析树：树根为初始符号，叶子为终结符 29。
- 转移网络 (Transition Networks)：结点表示状态，弧表示符号匹配与转移 30。
  - 扩充转移网络 (ATN)：用于处理上下文有关语言 31。

8.4 语义分析

语义文法：将文法知识和语义知识组合，以统一方式定义规则（如直接用“SHIP”、“ATTRIBUTE”等语义类别代替语法类别） 32。
格文法 (Case Grammar)
- 核心：以动词为中心构造 33。
- 结构：名词/介词短语以与动词的关系（格）来表示，如 Agent (施事), Dative (与格/接受者) 34。
- 特点：深层结构表示，主动句与被动句的格表示相同 35。

8.5 大规模真实文本处理 (语料库)

语料库语言学：
- 特点：规模大、处理真实文本、结合规则与统计方法 36。
- 趋势：部分分析/理解/翻译代替全分析/理解/翻译 37。
- 结构化语言模型：如 PCFG (概率上下文无关文法) 38。
汉语语料库加工技术
1. 自动分词 39：
  - 最大匹配法 (MM)：正向，按定长截取匹配。
  - 逆向最大匹配法 (RMM)：从右到左匹配，正确率通常高于MM。
  - 逐词遍历匹配法。
2. 词性标注 40：
  - 难点：兼类词的歧义排除。
  - 方法：基于规则、基于概率统计 (HMM等)。
3. 词义标注 41：
  - 难点：多义词的歧义排除 (WSD)。
  - 方法：利用上下文环境，基于词典或语料库统计。
语义资源
- WordNet：基于认知语言学的英语词典，按语义组织 (同义词集)，名词组成继承关系，动词组成语义网 42424242。
- 知网 (HowNet)：中英文语义资源，定义万物、时间、空间等7大类别 43。
- 北大语料库：完成词语切分和词性标注 44。

8.6 典型对话系统与模型发展

早期系统：
- ELIZA (1966)：模拟心理治疗医生 45。
- SHRDLU (1970s)：积木世界对话系统 46。
- LUNAR：月球标本数据查询 47。
现代系统：
- IBM Watson：问答系统，战胜人类选手 48。
- 微软小冰：强调情商 (EQ) 和闲聊 49。
- 对话系统分类：任务导向型 (解决具体需求) vs 开放域 (闲聊/情感陪伴) 50。
- 神经机器翻译 (NMT)：Encoder-Decoder框架 -> Transformer -> BERT 51。

8.7 预训练模型 (2025年视角)

发展趋势：参数规模指数级增长 (GPT-3 达 1750亿参数)，无需微调即可完成任务 52525252。
主流模型 (2025)：
- 闭源通用：
  - GPT-5 (OpenAI)：多模态、深度推理、实时路由 53。
  - Claude-3.5-Sonnet (Anthropic)：长文档理解 (200k tokens)，低幻觉率 54。
- 开源模型：
  - Qwen2.5 (阿里巴巴)：中文处理精度高，MoE架构 55。
  - Llama-Nemotron (英伟达+Qwen)：推理效率优化 56。
  - 英伟达开源代码模型：代码生成与调试 57。
- 专项任务：
  - Stream-Omni (中科院)：多模态实时交互 58。
  - ERNIE 4.0 (百度)：中文知识增强，融合知识图谱 59。

8.8 总结与展望

当前问题：缺乏知识表示、缺乏未知语言处理能力、缺乏解释性、单模态局限 60。
未来方向：与神经科学结合、构建高质量资源、多模态信息融合 61。这是根据您提供的《大模型技术》（2025年10月27日）PPT内容整理的复习提纲，专为开卷考试快速检索设计。

大模型技术复习提纲

1. 大模型简介

1.1 定义与核心概念
- 大模型 (Large Model)：具有大规模参数和复杂计算结构的机器学习模型 (数十亿至数千亿参数)。
- 别名：基础模型 (Foundation Model)。
- 核心特性：通过训练海量数据学习复杂模式，实现智能的涌现 (Emergence)，具备更强大泛化能力。
- 大语言模型 (LLM)：大模型在自然语言处理领域的应用。
1.2 发展历程
- Pre-GPT 时代：N-Gram, HMM, RNN, LSTM, CNN。
- GPT/BERT 时代 (2018-2020)：Transformer 架构的引入。
- Scaling Law 时代 (2020-)：DeepMind 提出大模型训练的缩放法则。
- ChatGPT 时代 (2022-)：标志性事件，推动 LLM 商业化。

2. 大模型的基本结构与特点

2.1 基本结构 (以 LLM 为例)
- 主要架构：Encoder-Decoder (如 T5/BART), Decoder-Only (如 GPT/Llama), Encoder-Only (如 BERT)。
- 核心组件 (Transformer)：
  - 多头自注意力机制 (Multi-Head Attention)：并行处理，捕获长距离依赖。
  - 前馈网络 (Feed-Forward Networks)：非线性变换。
  - 残差连接 (Residual Connections)：解决梯度消失。
  - 层归一化 (Layer Normalization)：加速训练。
2.2 大模型的特点
1. 大规模参数：实现复杂的特征表示和模式学习。
2. 大规模数据：从海量数据中学习知识。
3. 智能涌现：具备零样本/少样本学习 (Zero/Few-Shot Learning) 和推理能力。
4. 通用性：适应广泛的下游任务。
5. 可迁移性：预训练 + 微调/提示学习。

3. 大模型的应用场景

自然语言处理 (NLP)：文本生成 (诗歌/代码)、机器翻译、摘要、问答系统、情感分析。
代码生成与开发：Copilot, Debugging, 代码审查。
多模态：图像生成 (DALL-E)、语音识别、视频理解。
具身智能 (Embodied AI)：机器人控制、人机协作。
科学研究：辅助药物发现、材料科学。

4. 大模型的训练

4.1 预训练 (Pre-training)：
- 目标：在大规模数据上学习通用语言表示。
- 任务：
  - 掩码语言模型 (MLM)：如 BERT，预测被遮盖的单词。
  - 因果语言模型 (CLM)：如 GPT，预测下一个词。
  - 去噪自编码 (Denoising Autoencoding)：如 T5，重建损坏文本。
4.2 后续优化 (对齐)：
- 指令微调 (Instruction Tuning)：使模型理解并遵循人类指令。
- 人类反馈强化学习 (RLHF)：
  1. 收集人类偏好数据。
  2. 训练奖励模型 (Reward Model, RM)。
  3. 使用 PPO 等算法优化 LLM，使其输出与 RM 奖励一致。

5. 大模型的优化方法

5.1 推理优化
- 硬件加速：使用 A100/H100/昇腾等芯片。
- 模型剪枝 (Pruning)：去除不重要的连接。
- 知识蒸馏 (Knowledge Distillation)：用大模型指导小模型训练。
- 量化 (Quantization)：降低浮点精度 (如 FP16 $\rightarrow$ Int8/Int4) 以减少计算和内存。
5.2 高效微调 (PEFT)
- 全参数微调 (Full Fine-Tuning)：计算开销大。
- 参数高效微调 (PEFT)：只训练少数参数。
  - LoRA (Low-Rank Adaptation)：在原始权重旁插入低秩矩阵 $A, B$，仅训练 $A, B$。
  - P-Tuning/Prompt Tuning：只训练 Soft Prompt Tokens。
5.3 Agent 增强
- ReAct：Reasoning (推理) + Action (行动) 框架，使 LLM 能规划和使用工具。
- MoE (Mixture of Experts)：混合专家模型，并行激活稀疏专家，提高参数效率。

6. 大模型的常见问题和挑战

6.1 准确性问题
- 事实性错误 (Hallucination)：模型生成与事实不符的内容（“一本正经地胡说八道”）。
- 知识盲区：对最新信息或特定领域知识缺乏了解。
6.2 可靠性问题 (安全与伦理)
- 安全风险：训练数据合规性、数据偏见、对抗性攻击。
- 安全伦理：政治敏感、犯罪违法、歧视/偏见、仇恨言论等风险对话场景。
6.3 成本与效率
- 高昂的训练成本：需要大量计算资源和时间。
- 部署成本：推理耗时和内存占用大。

7. 未来发展方向和趋势

更大规模的模型：参数级别持续增长，如超大规模模型。
更高效的训练方法：研究更智能的参数初始化、优化算法等。
融合多模态信息：结合文本、图像、语音的多模态模型将是重点。
Agent 智能体的突破：具备高级推理、多步规划和工具调用能力的自主智能体。
可信赖 AI：解决可解释性 (XAI)、可验证性、公平性等问题。这是根据您提供的《AGI发展新范式-多智能体Manus技术解析》（2025年秋季）PPT内容整理的复习提纲，专为开卷考试快速检索设计。

AGI发展新范式-多智能体Manus技术解析复习提纲

1. 简要概述

1.1 Manus 的诞生与定位
- 发布时间：2025年3月6日（中国AI团队 Monica）。
- 核心哲学：“Mens et Manus”（手脑并用）——实现从“思考者”到“执行者”的质变。
- 定位：全球首款通用 Agent 产品（通用智能体），具备自主决策与多场景适应能力。
1.2 主要功能
1. 智能决策中枢：通过强化学习和多模态感知实现自主决策，适用于动态复杂场景。
2. 多模态交互：支持语音、图像、文本，实现无障碍沟通。
3. 跨领域适配：通过迁移学习和微调快速部署。
4. 自主任务执行：结合知识图谱和工具调用，自动规划并执行复杂任务。

2. 工作原理

2.1 基础架构 (4层结构)
1. 感知层 (Perception Layer)：多模态传感器/数据接入，完成环境感知和数据预处理。
2. 认知层 (Cognition Layer)：
  - 大语言模型 (LLM)：推理与泛化能力。
  - 知识图谱 (KG)：领域知识存储与检索。
  - 强化学习 (RL)：决策与优化能力。
3. 规划与执行层 (Planning & Execution Layer)：
  - 任务分解：将复杂任务拆解为子任务。
  - 工具调用 (Tool Call)：利用外部 API 或工具。
  - 多 Agent 协同：管理和协调子智能体。
4. 环境层 (Environment Layer)：实际操作环境（虚拟或现实）。
2.2 工作机制
- 决策链路：感知输入 $\rightarrow$ 认知推理 $\rightarrow$ 任务规划 $\rightarrow$ 执行反馈 $\rightarrow$ 自我修正。

3. 核心技术

3.1 多 Agent 协同框架
- 架构：由中央协调 Agent (Central Agent) 和多个功能性 Agent 构成。
- Central Agent：负责任务分解、资源分配、冲突协调。
- 功能 Agent：专注于特定任务，如数据分析 Agent、代码生成 Agent。
- 通信协议：基于 FIPA ACL 标准，确保 Agent 间的可理解通信。
3.2 深度强化学习
- 算法：基于 PPO (Proximal Policy Optimization) 改进的在线学习框架。
- 特点：结合人类反馈 (RLHF)，加速模型在特定场景下的收敛速度。
3.3 实时知识图谱融合
- 功能：通过 Neo4j/JanusGraph 存储实时知识，解决大模型的事实性错误 (Hallucination) 和知识时效性问题。

4. 创新之处

创新点：
1. 通用 Agent 架构：统一了 LLM、KG 和 RL 三种核心范式。
2. 自适应工具调用：智能选择并组合工具链。
3. 跨任务零样本迁移：快速适应新任务。
4. 可解释性与可控性：任务规划过程透明化。

5. 应用场景

智能办公：公文起草、会议记录、跨部门协作。
金融服务：量化交易策略生成、智能投顾、风险评估。
智能制造：生产流程优化、故障预测与诊断。
低空经济：无人机群调度、复杂环境路径规划。

6. 当前缺陷与挑战

缺陷/挑战：
- 算力与能耗矛盾：高精度感知和持续学习消耗大量算力。
- 跨领域迁移挑战：缺乏通用的框架支持快速跨行业适配。
- 实时决策延迟：在复杂场景中，决策生成速度仍需优化。

7. 发展趋势

未来方向：
1. AGI 市场规模：预计到2030年全球市场规模将达4710亿美元。
2. Agent 协作深化：向更复杂、更去中心化的 Agent 协作网络发展。
3. 多模态升级：实现图像、语音、视频的深度理解与生成。
4. 合规与安全：加强数据隐私保护和伦理对齐，确保可信赖。

This post is licensed under CC BY 4.0 by the author.

第一章 人工智能概述 复习提纲

1.1 人工智能的概念

1.2 人工智能的研究途径与方法

1.3 人工智能的分支领域

1.4 人工智能的基本技术

1.5 人工智能的发展历史

1.6 人工智能的典型应用

1.7 未来发展趋势与挑战

第二章 知识表示 复习提纲

2.1 概述

2.2 知识表示的基本方法

2.3 知识图谱 (Knowledge Graph)

附录：专家系统 (Expert Systems)

第三章 通过搜索进行问题求解 复习提纲

3.1 问题求解智能体 (Problem-Solving Agents)

3.2 问题形式化 (Problem Formulation)

3.3 搜索算法基础

3.4 无信息搜索策略 (Uninformed Search)

3.5 有信息 (启发式) 搜索策略 (Informed Search)

3.6 启发式函数 (Heuristic Functions)

第四章 复杂环境中的搜索 复习提纲

4.1 局部搜索和优化问题

4.2 非确定性与部分可观测环境搜索

4.3 博弈搜索 (Game Theory)

4.4 案例分析：AI围棋 (AlphaGo)

4.5 AI 前沿应用

第六章 智能体与多智能体系统 复习提纲

6.1 概述

6.2 Agent及其结构

6.3 多智能体系统 (MAS)

6.4 Agent通信

6.5 协调与协作

6.6 移动Agent (Mobile Agent)

6.7 多Agent系统开发框架 JADE

6.8 案例：火星探矿机器人

第七章 机器人 复习提纲

7.1 机器人基本概念

7.2 机器人学解决的问题

7.3 机器人感知 (Perception)

7.4 规划及控制

7.5 规划不确定的行动

7.6 强化学习与具身智能

7.7 人类和机器人协作

7.8 应用领域

第八章 自然语言处理技术 复习提纲

8.1 自然语言理解的一般问题

8.2 词法分析

8.3 句法分析

8.4 语义分析

8.5 大规模真实文本处理 (语料库)

8.6 典型对话系统与模型发展

8.7 预训练模型 (2025年视角)

8.8 总结与展望

大模型技术 复习提纲

1. 大模型简介

2. 大模型的基本结构与特点

3. 大模型的应用场景

4. 大模型的训练

5. 大模型的优化方法

6. 大模型的常见问题和挑战

7. 未来发展方向和趋势

AGI发展新范式-多智能体Manus技术解析 复习提纲

1. 简要概述

2. 工作原理

3. 核心技术

4. 创新之处

5. 应用场景

6. 当前缺陷与挑战

7. 发展趋势

第一章人工智能概述复习提纲

第二章知识表示复习提纲

第三章通过搜索进行问题求解复习提纲

第四章复杂环境中的搜索复习提纲

第六章智能体与多智能体系统复习提纲

第七章机器人复习提纲

第八章自然语言处理技术复习提纲

大模型技术复习提纲

AGI发展新范式-多智能体Manus技术解析复习提纲