人工智能课程ppt提纲
这份提纲是根据您提供的《第一章 人工智能概述》PPT内容整理的,专为开卷考试快速索引设计。
第一章 人工智能概述 复习提纲
1.1 人工智能的概念
定义:
- 由计算机实现的人造智能,模拟、延伸、扩展人类智能 1。
图灵测试 (Turing Test):
提出者:阿兰·图灵(Alan Turing),计算机科学与人工智能之父 2。
标准:如果一个人在相当长时间内无法区分对话对象是人还是机器(30%的人误判),则机器具有智能 3333。
智能的特征:
感知能力(视觉、听觉等)4。
记忆与思维能力(逻辑思维、形象思维)5。
学习与自适应能力 6。
行为能力 7。
研究目标:
- 延伸和增强人类能力,实现人机和谐共生 8。
表现形式:
智能软件:专家系统、知识库 9。
智能设备:嵌入式系统(智能家电、智能仪表)10101010。
智能机器:机器人(如智能汽车)11111111。
智能系统:智能网络、多智能体系统(MAS)、Agent 121212121212121212。
最新进展 (2025):AI智能体元年,通用智能体 “Manus” 13。
1.2 人工智能的研究途径与方法
符号主义 (Symbolism):
别名:功能模拟学派、逻辑主义 141414。
核心:物理符号系统假设,基于知识和推理(显式知识)151515。
代表:纽厄尔、西蒙、专家系统 16。
连接主义 (Connectionism):
别名:结构模拟学派、仿生学派 171717。
核心:神经网络,数值计算,模拟大脑生理结构 181818。
代表:M-P模型、感知器、BP算法、深度学习 19。
行为主义 (Behaviorism):
别名:行为模拟学派、进化主义、控制论学派 202020。
核心:感知-动作模式,与环境交互,自适应 212121。
代表:Brooks(六足机器人)22。
集成模拟法:三种方法取长补短 23232323。
1.3 人工智能的分支领域
基于脑功能模拟:
机器感知:模式识别(图形识别、语音识别)24。
机器联想:联想存储 25。
机器推理:演绎、归纳、类比推理;自然演绎法、判定法、归结原理 26262626。
机器学习:机械学习、归纳学习、数据挖掘 27272727。
机器理解:自然语言理解 (NLP)、图形理解 28282828。
机器行为:机器人行动规划 29292929。
- 基于实现技术领域划分
- 符号智能
- 计算智能
- 基于应用领域
- 问题求解与博弈
- 逻辑推理与证明
- 计算智能
- 分布式人工智能
- 自动程序设计
- 专家系统
- 机器学习
- 自然语言理解
- 机器人学
- 模式识别
- 机器视觉
- 神经网络
- 。。。
基于技术/应用系统:
专家系统 (ES):模拟专家决策,含有大量专门知识 30303030。
博弈:下棋(深蓝、AlphaGo、Libratus)31。
分布式人工智能 (DAI):分布式问题求解、多智能体系统 (MAS/Agent) 32323232。
计算智能:神经网络、进化计算(遗传算法)、模糊技术 33333333。
机器视觉:图像处理、检测 34。
智能控制:无需人工干预的自动控制 35。
- 常用编程语言:Python, Java, C++, Lisp, Prolog 36。
1.4 人工智能的基本技术
推理技术 37。
搜索技术 38。
知识表示与知识库技术 39。
归纳技术 40。
联想技术 41。
1.5 人工智能的发展历史
孕育期 (1956前):图灵机、M-P神经元模型 42。
诞生 (1956):达特茅斯会议 (Dartmouth Workshop),麦卡锡提出“人工智能”一词 43。
发展阶段:
神经元网络时代 (40s-50s):感知器,受限于XOR问题 (Minsky) 44。
通用方法时代 (50s-60s):逻辑理论机(LT)、通用问题求解(GPS) 45。
知识工程时代 (60s-80s):专家系统 (DENDRAL, MYCIN),费根鲍姆提出“知识工程” 46464646。
神经网络复苏 (80s-90s):Hopfield网、BP算法 47474747。
数据与网络时代 (90s-2000s):深蓝战胜卡斯帕罗夫,数据挖掘 48484848。
深度学习时代 (2006至今):Hinton提出深度置信网络,AlphaGo,大模型 49。
大模型 (Large Models):海量参数,预训练+微调,通用性强 50。
1.6 人工智能的典型应用
金融:智能风控、智能投研 51。
公共安全:生物特征识别(人脸、指纹)、智能办案 52。
医疗健康:医学影像分析(腾讯觅影)、手术机器人(天玑)、药物设计 535353535353535353。
交通出行:自动驾驶(L1-L5分级),百度无人车、奥迪L3 545454545454545454。
其他:智能教育、工业制造、娱乐(冬奥会机器人)、智能客服 55555555555555555555555555555555。
国家创新平台:百度(自动驾驶)、阿里云(城市大脑)、腾讯(医疗影像)、科大讯飞(智能语音)56。
1.7 未来发展趋势与挑战
趋势:
从专用智能向通用智能 (AGI) 发展 57。
从人工+智能向自主智能系统发展 58。
人机混合智能 59。
大模型方向:对齐、多模态、智能体 (Agent)、具身智能 60。
挑战 (伯克利视角):
- 持续学习、鲁棒决策、可解读性 (Explainable AI)、安全飞地、对抗学习、数据隐私 61。
国家战略:
中国:《新一代人工智能发展规划》(2017),三步走战略 (2020, 2025, 2030) 62626262。
美国:“美国人工智能计划”,保持霸主地位 63。 这是根据您提供的第二章PPT内容整理的复习提纲,专为开卷考试快速检索设计。
第二章 知识表示 复习提纲
2.1 概述
知识工程 (Knowledge Engineering)
定义:利用计算机/通信技术实现知识的自动转移和应用 1。
包含环节:知识获取、知识表示、知识应用 2。
核心地位:爱德华·费根鲍姆 (Edward Feigenbaum) 于1977年提出 3。
大数据时代特征:从数据到智慧 (Smart Data) 4。
知识的概念与分类
按作用分类:
描述性知识 (事实性) 5555。
判断性知识 (启发性/规则) 6666。
过程性知识 (控制策略) 7777。
按层次分类:
对象级知识 (领域相关) 8。
元级知识 (关于知识的知识) 9。
知识表示 (Knowledge Representation)
构成:符号 (结构) + 处理机制 10。
要求:表示能力、可理解性、便于获取、便于搜索、便于推理 11。
2.2 知识表示的基本方法
2.2.1 谓词逻辑表示法
基础:命题逻辑与谓词逻辑 (形式语言) 12。
特点:自然性、精确性、严密性、容易实现 13。
局限:不能表示不确定性、组合爆炸、效率低 14。
应用:PROLOG语言 15。
2.2.2 产生式表示法 (Production Systems)
规则形式:IF P THEN Q (前提 -> 结论/动作) 16。
系统组成:
规则库 (Rule Base):存储领域知识 17171717。
综合数据库 (Fact Base/Dynamic DB):存放事实、中间结果 18181818。
推理机 (Inference Engine):控制系统 (匹配、冲突解决、操作) 19191919。
推理方式:
正向推理 (数据/事实 -> 目标) 20。
反向推理 (目标 -> 初始事实) 21。
双向推理。
冲突解决策略:专一性排序、规则排序、规模排序、就近排序 22222222。
优缺点:清晰、模块化、自然;但难扩展、效率低 23。
2.2.3 框架表示法 (Frame Representation)
结构:框架名、槽 (Slot)、侧面 (Facet)、值 (Value) 24。
特性:继承性 (子框架继承父框架槽值) 25。
推理方法:匹配、搜索、填槽 26。
特点:结构化强,但缺乏理论体系 27。
2.2.4 语义网络表示法 (Semantic Networks)
定义:节点 (事物/概念) + 有向边 (关系) 28。
常用关系:
实例关系 (ISA / is-a) 29。
分类/泛化关系 (AKO / a-kind-of) 30。
聚集/整体部分关系 (A-part-of) 31。
属性关系、成员关系 (a-member-of)、逻辑关系 (AND/OR)、方位关系 32。
复杂表示:事件节点法、全称/存在量词表示 33333333。
推理过程:继承推理、匹配推理 34。
特点:结构性、联想性、自索引性 35。
2.3 知识图谱 (Knowledge Graph)
2.3.1 概念
定义:描述客观世界的概念、实体、事件及其关系,通常用三元组 (资源-属性-属性值) 表示 36。
起源:Google (2012) 37。
组成:知识 (数据特征) + 图谱 (结构特征) 38。
2.3.2 体系架构与关键技术
逻辑架构:模式层 (Ontology) + 数据层 (Graph DB) 39。
构建流程 (以CN-DBpedia为例):
信息抽取 (Extraction):爬虫、文档解析、深度学习(LSTM-RNN) 40404040。
信息对齐/标准化 (Normalization) 41。
知识链接/分类 (Enrichment) 42。
信息修正 (Correction):错误发现、众包修正 43。
内容更新 (Update):周期+动态 44。
知识存储 (Storage) 45。
相关技术:知识推理、知识问答 46。
2.3.3 典型知识图谱
- 通用:Freebase, Wikidata, DBpedia, YAGO, CN-DBpedia, XLORE 47。
2.3.4 主要应用
- 辅助搜索 (语义搜索)、辅助问答 (Siri/WolframAlpha)、辅助决策、辅助AI (常识推理)、垂直领域 (金融/电商) 48。
2.3.5 特点与趋势
特点:逻辑推理、可解释性、自然关联 49。
研究热点:LLM融合、多模态KG、动态/实时KG、区块链结合、跨语言KG 50。
附录:专家系统 (Expert Systems)
定义与特点:
基于知识的智能系统,分离了知识与推理 51。
特点:启发性、透明性 (解释功能)、灵活性 52。
系统结构 53535353:
知识库:核心,含领域知识与元知识。
推理机:模拟思维,执行控制循环 (匹配-选择-执行)。
动态数据库:黑板/工作区。
人机界面。
解释模块:回答 How & Why。
知识库管理系统。
推理技术:
假言推理 (Modus Ponens) vs. 拒取式 (Modus Tollens) 54。
正向推理 (数据驱动) vs. 反向推理 (目标驱动) 55。
典型系统实例:
DENDRAL:第一个专家系统 (化学) 56。
MYCIN:医疗诊断 (血液感染),使用产生式规则 57。
PROSPECTOR:地质勘探 58。
新型专家系统:
黑板模型 (Blackboard Model) 59。
分布式/协同专家系统 (Multi-agent) 60。
模糊专家系统、神经网络专家系统 61616161。 这是根据您提供的第三章PPT内容整理的复习提纲,专为开卷考试快速检索设计。
第三章 通过搜索进行问题求解 复习提纲
3.1 问题求解智能体 (Problem-Solving Agents)
基本定义:通过传感器感知环境,通过执行器作用于环境 1。
处理流程:目标形式化 $\rightarrow$ 问题形式化 $\rightarrow$ 搜索 $\rightarrow$ 执行 2。
- 搜索 (Search):在模型中模拟动作序列,直到找到通往目标的路径 3333。
3.2 问题形式化 (Problem Formulation)
5个组成部分 4444:
状态空间 (State Space):所有可能状态的集合。
初始状态 (Initial State):智能体启动时的状态。
目标状态 (Goal State):一个或多个目标状态的集合。
动作 (Actions):智能体可采取的行动。
转移模型 (Transition Model):描述动作产生的结果。
相关概念:
路径代价 (Path Cost):通常是动作代价的累加。
最优解 (Optimal Solution):路径代价最小的解 5。
典型问题示例:
8数码问题 (8-puzzle):标准化问题 6。
寻径问题 (Route Finding):真实世界问题(如罗马尼亚地图、航空旅行) 7。
3.3 搜索算法基础
树搜索 (Tree Search):
基本思想:从初始状态出发,探索路径,构建搜索树 8。
节点 (Node) vs 状态 (State):节点是数据结构(含父节点、深度、路径代价$g(x)$),状态是物理配置 9。
性能评估指标 10:
完备性 (Completeness):有解时是否保证找到解。
时间复杂度 (Time Complexity):生成/扩展的节点数。
空间复杂度 (Space Complexity):内存中存储的最大节点数。
最优性 (Optimality):是否找到代价最低的解。
3.4 无信息搜索策略 (Uninformed Search)
定义:只使用问题定义中的信息,不包含目标位置线索 11。
- 广度优先搜索 (BFS) 12
策略:先扩展根节点,再层层扩展(FIFO队列)。
性质:完备(若分支因子$b$有限);最优(若步长代价相等);时间/空间复杂度均为 $O(b^{d+1})$。
缺点:空间(内存)需求巨大。
- 一致代价搜索 (Uniform-Cost Search) 13
策略:扩展$g(n)$(路径代价)最小的节点(优先队列)。
性质:完备;最优;类似于BFS但按代价扩展。
- 深度优先搜索 (DFS) 14
策略:优先扩展最深的节点(LIFO队列)。
性质:不完备(可能陷入死循环);不最优;时间 $O(b^m)$;空间 $O(bm)$(线性空间,内存消耗小)。
- 深度受限搜索 (DLS) 15
- 策略:DFS加上深度界限 $L$。
- 迭代加深搜索 (IDS) 16
策略:反复调用DLS,界限 $L=0, 1, 2, \dots$。
性质:完备;最优(若步长代价=1);时间 $O(b^d)$;空间 $O(bd)$。
评价:结合了BFS的完备性/最优性和DFS的空间优势,是首选的无信息搜索策略。
3.5 有信息 (启发式) 搜索策略 (Informed Search)
定义:利用启发式函数 $h(n)$ 提供目标位置线索 17。
评估函数 $f(n)$:
$g(n)$:从初始状态到 $n$ 的实际代价。
$h(n)$:从 $n$ 到目标的估计代价。
- 贪心最佳优先搜索 (Greedy Best-First Search) 18
策略:扩展 $h(n)$ 最小的节点(看起来离目标最近)。
性质:不完备(可能死循环);不最优;时间/空间 $O(b^m)$。
- A 搜索 (A Search)** 19
策略:扩展 $f(n) = g(n) + h(n)$ 最小的节点。
性质:
完备性:是(除非有无穷多节点 $f \le f(G)$)。
最优性:是(前提是 $h(n)$ 是可采纳的/一致的) 20202020。
应用案例:八数码、修道士和野人、游戏寻路 21。
3.6 启发式函数 (Heuristic Functions)
可采纳性 (Admissibility):$h(n) \le h^*(n)$,即从不高估到达目标的代价 22222222。
一致性 (Consistency/Monotonicity):满足三角不等式 $h(n) \le c(n, a, n’) + h(n’)$ 23。
典型例子 (8数码问题) 24:
$h_1$:错位滑块的数量。
$h_2$:曼哈顿距离(所有滑块到目标位置的距离之和)。
比较:$h_2 \ge h_1$,故 $h_2$ 优于(支配)$h_1$,搜索节点更少 25。
构造方法:从松弛问题(Relaxed Problem,减少限制条件)的精确解推导 26。
- 例如:TSP问题的松弛版本是最小生成树 27。 这是根据您提供的第四章PPT内容整理的复习提纲,专为开卷考试快速检索设计。
第四章 复杂环境中的搜索 复习提纲
4.1 局部搜索和优化问题
基本概念
适用场景:路径无关,目标状态即是解(优化问题)1。
特点:迭代改进,只保持当前状态,内存占用少 2。
状态空间地形:全局最大值、局部最大值、山肩、平坦最大值 3。
爬山法 (Hill Climbing)
定义:贪心局部搜索,向最陡上升方向移动 4。
缺陷:易陷入局部极大值、平台区(山肩)5。
变体:随机爬山法、随机重启爬山法 6。
模拟退火 (Simulated Annealing)
原理:结合爬山法和随机游走,允许以一定概率接受“坏”移动 7。
机制:概率随 $\Delta E$ 和温度 $T$ 变化 8。
性质:$T$ 下降足够慢时,能找到全局最优解(玻尔兹曼分布)9。
局部束搜索 (Local Beam Search)
原理:保留 $k$ 个状态,并行搜索 10。
变体:随机束搜索(增加多样性)。
进化算法 (Evolutionary Algorithms)
原理:随机局部束搜索 + 后代生成(自然选择隐喻) 11。
关键步骤:选择 (Selection)、杂交 (Crossover)、突变 (Mutation) 12。
连续状态空间搜索
方法:梯度上升/下降 ($\nabla f$) 13。
迭代求根:Newton-Raphson 方法 14。
4.2 非确定性与部分可观测环境搜索
非确定性动作 (Nondeterministic Actions)
概念:信念状态 (Belief State),结果是条件规划 (Contingency Plan) 15。
模型:与或搜索树 (AND-OR Search Trees) 16。
“或”节点:智能体的选择。
“与”节点:环境的选择(分支)。
实例:不稳定的真空吸尘器世界 17。
策略:反复尝试 (Try-Again) 18。
部分可观测环境 (Partially Observable)
基本流程:预测 (Prediction) $\rightarrow$ 可能感知 (Possible Percepts) $\rightarrow$ 更新 (Update) 19。
PERCEPT(s) 函数。
4.3 博弈搜索 (Game Theory)
基本概念
类型:双人完备信息博弈 (Zero-sum)、机遇性博弈 20。
博弈树:MAX节点(我方)与 MIN节点(对手)交替 21。
极大极小过程 (Minimax)
原理:MAX选择最大估值,MIN选择最小估值 22。
估价函数:对叶节点进行静态估值 23。
$\alpha-\beta$ 剪枝 (Alpha-Beta Pruning)
目的:减少搜索节点,提高效率 24。
$\alpha$ 值:MAX节点当前最大下界。
$\beta$ 值:MIN节点当前最小上界。
规则:
$\beta$ 剪枝:MAX节点 $\alpha \ge$ 先辈 $\beta$。
$\alpha$ 剪枝:MIN节点 $\beta \le$ 先辈 $\alpha$。
4.4 案例分析:AI围棋 (AlphaGo)
发展历程
- AlphaGo Fan (2015) $\rightarrow$ AlphaGo Lee (2016) $\rightarrow$ Master (2017) $\rightarrow$ Zero (2017) 25。
核心技术体系
蒙特卡罗模拟 (Monte Carlo Simulation):随机对弈评估盘面 26。
多臂老虎机问题 (Multi-armed Bandit):UCB/UCT 算法平衡探索与利用 27。
蒙特卡罗树搜索 (MCTS) 28:
四个步骤:选择、扩展、模拟、更新。
结合离线知识:Elo Rating 排序、剪枝 29。
深度神经网络 30303030:
策略网络 (Policy Network):减少搜索宽度(选点)。
值网络 (Value Network):减少搜索深度(局面评估)。
AlphaGo Zero 的改进 31
自对弈强化学习 (无人类棋谱)。
策略与价值网络合二为一。
不再使用随机模拟 (Rollout)。
使用残差网络 (ResNet)。
4.5 AI 前沿应用
化学/生物领域
AlphaFold:蛋白质结构预测 (2024诺贝尔化学奖相关) 32。
逆向合成分析:化学界的 “AlphaGo”,利用 MCTS 和深度学习规划合成路径 33。
AutoML (自动机器学习)
目标:自动化模型设计、超参数优化 34。
NAS (神经架构搜索):搜索最优网络结构 35。
ENAS (高效神经架构搜索):通过参数共享 (Parameter Sharing) 提高效率 36。 这是根据您提供的第六章PPT内容整理的复习提纲,专为开卷考试快速检索设计。
第六章 智能体与多智能体系统 复习提纲
6.1 概述
智能体 (Agent) 定义:驻留在某一环境下,能够自主 (Autonomous)、灵活 (Flexible) 地执行动作以满足设计目标的行为实体 1。
特征:
驻留性:驻留在环境中,通过感知输入和动作输出与环境交互 2。
自主性:无外部干涉下自主运行,控制自身行为 3。
灵活性:
反应性 (Reactive):感知环境并适时反应 4。
自发性 (Pro-active):主动产生目标并实施行为 5。
社会性 (Social):与其他智能体交互、合作、协商 6。
Agent要素 (BDI模型):认知 (信念)、情感 (愿望)、意向 (意图) 7。
6.2 Agent及其结构
计算机系统中的地位:独立的功能模块/应用系统,含决策生成器(核心主控)8。
结构分类:
反应式 Agent:基于简单的“感知-动作”规则 (if-then),无复杂推理 9。
慎思式 Agent:基于知识库的逻辑推理 (如 BDI模型),行为决策是定理证明过程 10。
跟踪式 Agent:维护内部状态,跟踪世界变化和自身影响 11。
基于目标的 Agent:结合目标信息与动作结果进行决策 12。
基于效果 (Utility) 的 Agent:使用效用函数衡量状态满意度,追求高质量结果 13。
复合式 Agent:集成多种结构层次 14。
软件 Agent:后台进程 (Demon),如杀毒软件监控模块 15。
人工生命 Agent:具有自我成长、繁殖能力的动态实体 16。
6.3 多智能体系统 (MAS)
定义:多个相对独立又相互作用的智能体构成的系统 17。
特点:
智能体间交互与协同:通过通信语言 (ACL) 交互,无全局控制 18。
无全局观点:各智能体信息不完整 19。
不可预测性:环境开放、动态 20。
应用示例:
物理MAS:恒温调控系统 21。
软件MAS:病毒防护系统 22。
场景:低空经济多无人机配送 23、火星探矿机器人 24。
6.4 Agent通信
通信方式:
消息传递 (需通道,如TCP/IP)。
黑板系统 (共享存储区)。
邮箱 (暂存) 25。
言语行为理论 (Speech Act Theory):断言型、指示型、承诺型等 26。
通信语言 (ACL):
功能:表达交互意图 (语用) 和内容 (语义) 27。
代表语言:KQML (知识查询与操纵语言)、FIPA ACL 28。
FIPA ACL通信行为:Inform (通知), Request (请求), Agree (同意), Refuse (拒绝), Propose (提议), CFP (招标) 等 29。
消息结构:包含 sender, receiver, content, ontology, protocol 等 30。
6.5 协调与协作
协调 (Coordination):解决冲突 (死锁/活锁),调整意图以适应环境和其他Agent 3131。
- 方法:组织结构化、合同、多Agent规划、协商 32。
协作 (Cooperation):非对抗Agent间为共同目标工作 33。
类型:协作型、自私型、混合型 34。
过程:产生需求 $\rightarrow$ 协作规划 $\rightarrow$ 寻求伙伴 $\rightarrow$ 选择方案 $\rightarrow$ 实现目标 $\rightarrow$ 评估 35。
交互协议与模型:
合同网协议 (Contract Net Protocol, CNP):管理器 (Manager) 发布任务 (招标) $\rightarrow$ 参与者 (Bidder) 投标 $\rightarrow$ 管理器中标 $\rightarrow$ 签订合同 36。
- 适用场景:任务分配、负载均衡。
协商机制:投票、拍卖、谈判 37。
案例 (EINSTein):基于多Agent的作战仿真,研究高层涌现行为 38。
6.6 移动Agent (Mobile Agent)
定义:能自主在网络主机间移动的Agent,支持“代码移向数据” 39393939。
状态:程序状态 (代码)、数据状态 (变量)、执行状态 (线程) 40。
强移动:携带全部三种状态。
弱移动:仅携带程序和数据状态。
关键技术:
通信:移动Agent与服务Agent (C/S)、Agent间 (P2P)、组通信 41。
安全性:主机保护 (防恶意Agent)、Agent保护 (防恶意主机) 42。
容错与管理 43。
应用:移动计算、网络管理、分布式信息检索 44。
6.7 多Agent系统开发框架 JADE
简介:Java Agent DEvelopment Framework,遵循FIPA规范的开源中间件 45。
组成:
软件开发包:封装Agent通信等功能。
运行环境:主容器 (Main Container) + 普通容器,提供AMS (管理系统) 和 DF (目录服务/黄页) 46。
图形化工具:调试与管理工具。
通信机制:容器内 (Java事件)、容器间 (RMI)、平台间 (IIOP) 47。
编程模型:
setup()初始化,addBehaviour()添加行为 (如CyclicBehaviour,OneShotBehaviour) 48。
6.8 案例:火星探矿机器人
场景设计:M×M网格环境,包含矿产、障碍物、能量站 49。
Agent能力:移动、探测、采集、卸载、交互 50。
多Agent模式:
场景二:同构Agent合作 (信息共享)。
场景三:异构Agent合作 (多角色:采矿Agent + 探测Agent) 51。
JADE实现:定义不同类型的Agent类,通过ACL消息进行坐标和矿产信息的交互 52。 这是根据您提供的第七章PPT内容整理的复习提纲,专为开卷考试快速检索设计。
第七章 机器人 复习提纲
7.1 机器人基本概念
定义:通过操纵真实世界去完成任务的实体智能体 1。
组成:
实体效应器 (Effectors):腿、轮子、关节、夹具(如平行钳、三指夹具、Shadow灵巧手)2。
传感器 (Sensors):
被动式:摄像头(立体视觉)、麦克风、GPS。
主动式:声纳、雷达、扫描激光雷达(LiDAR)3。
内部测量:陀螺仪、加速度计、力矩传感器。
执行器 (Actuators):电动、液压、气动;驱动关节(旋转、平移、球形)运动 4。
类型:
机械手 (Manipulators):固定基座,如工业机械臂。
移动机器人 (Mobile Robots):UAV(无人机)、AUV(水下)、自主无人车、腿式机器人。
其他:假体、外骨骼、具身智能机器人。
7.2 机器人学解决的问题
三级层次结构 5:
任务规划 (Task Planning):高层级动作策略(如“移动到门口”)。
运动规划 (Motion Planning):从点到点的路径规划。
控制 (Control):驱动执行器完成运动。
核心特性:连续状态/动作空间、非确定性、部分可观测。
7.3 机器人感知 (Perception)
任务:将传感器测量值映射到环境的内部表示。
定位 (Localization):确定机器人在哪。
蒙特卡罗定位 (MCL):基于粒子滤波 6。
卡尔曼滤波 (Kalman Filter):高斯分布后验概率;EKF(扩展卡尔曼滤波)用于非线性模型 7777。
SLAM (同时定位与地图构建):在未知环境中同时构建地图和定位 8。
机器学习应用:自监督学习、无监督学习(低维嵌入)。
7.4 规划及控制
基本概念:
工作空间 (Workspace):机器人移动的物理空间。
构形空间 (Configuration Space, C-space):所有构成机器人的点的抽象多维空间 9。
运动规划方法 10:
沃罗诺伊图 (Voronoi Diagram):基于障碍物距离划分区域,路径远离障碍物 11。
概率路线图 (PRM):采样无碰撞里程碑并连接。
快速探索随机树 (RRT):双向生长树结构,概率完备 12。
轨迹优化:利用势场法使路径远离碰撞 13。
轨迹跟踪控制:
P控制器 (比例):反比于误差的力,不严格稳定(易抖动)。
PD控制器 (比例微分):增加微分项,严格稳定 14。
PID控制器:比例积分微分。
计算扭矩控制:结合逆动力学模型和反馈误差补偿。
7.5 规划不确定的行动
问题:动作执行有误差(如速度不确定性圆锥)15。
策略:
精细运动规划 (Fine-motion planning):设计一系列保护移动(如沿着墙滑入孔洞)。
在线重规划。
信息收集动作:如海岸导航启发式(靠近地标以减少不确定性)。
7.6 强化学习与具身智能
强化学习 (RL):
挑战:连续状态空间、样本复杂性(Sim-to-Real迁移)。
方法:端对端学习、元学习。
具身智能 (Embodied AI) 16:
定义:基于物理身体进行感知和行动的智能系统。
核心要素:本体、智能体、数据、学习进化框架。
关键技术:芯片(GPGPU/FPGA/ASIC)、传感器、伺服电机(直驱)、AI算法、云服务。
趋势:跨模态交互、自适应学习、人机共栖 17。
7.7 人类和机器人协作
博弈模型:将人机交互建模为不完全信息博弈。
预测与协调:
预测人类动作(由于人类不是完美理性的)。
协作目标:联合优化代价函数 ($J_H = J_R$)。
学习人类意图:
逆强化学习 (Inverse RL):从人类演示中推断代价函数(偏好学习)。
模仿学习:行为克隆。
7.8 应用领域
工业:装配、搬运。
医疗:手术机器人(达芬奇)、康复外骨骼。
服务:扫地机器人 (Roomba)、配送无人机。
自动驾驶:特斯拉、Waymo。
探索:火星车 (Curiosity)。 这是根据您提供的第八章PPT内容整理的复习提纲,专为开卷考试快速检索设计。
第八章 自然语言处理技术 复习提纲
8.1 自然语言理解的一般问题
基本概念
语言智能:基于人类自然语言属性,探索语言活动运作机理,赋予机器类人语言活动功能 1。
自然语言特点:多义性、上下文相关性、模糊性、非系统性、环境相关性 2。
自然语言理解 (NLU) 定义:
微观:从自然语言到机器内部的一个映射 3。
宏观:机器能够执行人类期望的语言功能(如回答问题、文摘生成、翻译等)4。
发展阶段
理性主义 (符号逻辑):萌芽期至90年代初,以规则、词典、模板为主 55。
经验主义 (统计学习):90年代初至2013年,以语料、特征、统计模型(N-Gram, HMM, SVM)为主 66。
连结主义 (深度学习):2013年至今,多层神经网络(Deep Learning, LSTM, Transformer, BERT, LLM) 777。
理解的层次
韵律学 (Prosody):节奏和语调 8。
音韵学 (Phonology):声音的形成(语音识别基础) 9。
词态学 (Morphology):单词的构成(词素、前缀、后缀) 10。
语法/句法 (Syntax):单词组合成短语/句子的规律 11。
语义学 (Semantics):单词、短语和句子的意思 12。
语用学 (Pragmatics):语言的使用方法及对听众的效果(环境知识) 13。
世界知识 (World Knowledge):通用背景知识 14。
8.2 词法分析
任务:单词切分、找出词素、确定词义 15。
英语词法分析
特点:有词性、数、时态、派生、变形;词根只有一个 16。
算法:查词典 -> 若未找到则修改单词 (去掉后缀等) -> 重复 17。
难点:词义判断(需依赖上下文) 18。
汉语分词
难点:
切分歧义:
交集歧义:如“地面积” (地面/积 vs 地/面积) 19。
组合歧义:如“把手” (动词+名词 vs 名词) 20。
未登录词 (OOV):新词、网络流行语 (如“给力”) 21。
8.3 句法分析
短语结构文法
定义:$G=(T, N, S, P)$,其中 $T$为终结符,$N$为非终结符,$S$为起始符,$P$为产生式规则 22。
推导:利用产生式规则将符号串重写,直到生成句子 23。
Chomsky 文法体系 (四种形式) 24
0型文法:无约束短语结构文法 (能力最强,很少用于NLP) 25。
1型文法:上下文有关文法 (Context-Sensitive),自然语言属于此类 26。
2型文法:上下文无关文法 (Context-Free),规则 $A \rightarrow x$ 27。
3型文法:正则文法 (Regular),包括左/右线性文法 28。
分析方法
句法分析树:树根为初始符号,叶子为终结符 29。
转移网络 (Transition Networks):结点表示状态,弧表示符号匹配与转移 30。
- 扩充转移网络 (ATN):用于处理上下文有关语言 31。
8.4 语义分析
语义文法:将文法知识和语义知识组合,以统一方式定义规则(如直接用“SHIP”、“ATTRIBUTE”等语义类别代替语法类别) 32。
格文法 (Case Grammar)
核心:以动词为中心构造 33。
结构:名词/介词短语以与动词的关系(格)来表示,如 Agent (施事), Dative (与格/接受者) 34。
特点:深层结构表示,主动句与被动句的格表示相同 35。
8.5 大规模真实文本处理 (语料库)
语料库语言学:
特点:规模大、处理真实文本、结合规则与统计方法 36。
趋势:部分分析/理解/翻译代替全分析/理解/翻译 37。
结构化语言模型:如 PCFG (概率上下文无关文法) 38。
汉语语料库加工技术
自动分词 39:
最大匹配法 (MM):正向,按定长截取匹配。
逆向最大匹配法 (RMM):从右到左匹配,正确率通常高于MM。
逐词遍历匹配法。
词性标注 40:
难点:兼类词的歧义排除。
方法:基于规则、基于概率统计 (HMM等)。
词义标注 41:
难点:多义词的歧义排除 (WSD)。
方法:利用上下文环境,基于词典或语料库统计。
语义资源
WordNet:基于认知语言学的英语词典,按语义组织 (同义词集),名词组成继承关系,动词组成语义网 42424242。
知网 (HowNet):中英文语义资源,定义万物、时间、空间等7大类别 43。
北大语料库:完成词语切分和词性标注 44。
8.6 典型对话系统与模型发展
早期系统:
ELIZA (1966):模拟心理治疗医生 45。
SHRDLU (1970s):积木世界对话系统 46。
LUNAR:月球标本数据查询 47。
现代系统:
IBM Watson:问答系统,战胜人类选手 48。
微软小冰:强调情商 (EQ) 和闲聊 49。
对话系统分类:任务导向型 (解决具体需求) vs 开放域 (闲聊/情感陪伴) 50。
神经机器翻译 (NMT):Encoder-Decoder框架 -> Transformer -> BERT 51。
8.7 预训练模型 (2025年视角)
发展趋势:参数规模指数级增长 (GPT-3 达 1750亿参数),无需微调即可完成任务 52525252。
主流模型 (2025):
闭源通用:
GPT-5 (OpenAI):多模态、深度推理、实时路由 53。
Claude-3.5-Sonnet (Anthropic):长文档理解 (200k tokens),低幻觉率 54。
开源模型:
Qwen2.5 (阿里巴巴):中文处理精度高,MoE架构 55。
Llama-Nemotron (英伟达+Qwen):推理效率优化 56。
英伟达开源代码模型:代码生成与调试 57。
专项任务:
Stream-Omni (中科院):多模态实时交互 58。
ERNIE 4.0 (百度):中文知识增强,融合知识图谱 59。
8.8 总结与展望
当前问题:缺乏知识表示、缺乏未知语言处理能力、缺乏解释性、单模态局限 60。
未来方向:与神经科学结合、构建高质量资源、多模态信息融合 61。 这是根据您提供的《大模型技术》(2025年10月27日)PPT内容整理的复习提纲,专为开卷考试快速检索设计。
大模型技术 复习提纲
1. 大模型简介
1.1 定义与核心概念
大模型 (Large Model):具有大规模参数和复杂计算结构的机器学习模型 (数十亿至数千亿参数)。
别名:基础模型 (Foundation Model)。
核心特性:通过训练海量数据学习复杂模式,实现智能的涌现 (Emergence),具备更强大泛化能力。
大语言模型 (LLM):大模型在自然语言处理领域的应用。
1.2 发展历程
Pre-GPT 时代:N-Gram, HMM, RNN, LSTM, CNN。
GPT/BERT 时代 (2018-2020):Transformer 架构的引入。
Scaling Law 时代 (2020-):DeepMind 提出大模型训练的缩放法则。
ChatGPT 时代 (2022-):标志性事件,推动 LLM 商业化。
2. 大模型的基本结构与特点
2.1 基本结构 (以 LLM 为例)
主要架构:Encoder-Decoder (如 T5/BART), Decoder-Only (如 GPT/Llama), Encoder-Only (如 BERT)。
核心组件 (Transformer):
多头自注意力机制 (Multi-Head Attention):并行处理,捕获长距离依赖。
前馈网络 (Feed-Forward Networks):非线性变换。
残差连接 (Residual Connections):解决梯度消失。
层归一化 (Layer Normalization):加速训练。
2.2 大模型的特点
大规模参数:实现复杂的特征表示和模式学习。
大规模数据:从海量数据中学习知识。
智能涌现:具备零样本/少样本学习 (Zero/Few-Shot Learning) 和推理能力。
通用性:适应广泛的下游任务。
可迁移性:预训练 + 微调/提示学习。
3. 大模型的应用场景
自然语言处理 (NLP):文本生成 (诗歌/代码)、机器翻译、摘要、问答系统、情感分析。
代码生成与开发:Copilot, Debugging, 代码审查。
多模态:图像生成 (DALL-E)、语音识别、视频理解。
具身智能 (Embodied AI):机器人控制、人机协作。
科学研究:辅助药物发现、材料科学。
4. 大模型的训练
4.1 预训练 (Pre-training):
目标:在大规模数据上学习通用语言表示。
任务:
掩码语言模型 (MLM):如 BERT,预测被遮盖的单词。
因果语言模型 (CLM):如 GPT,预测下一个词。
去噪自编码 (Denoising Autoencoding):如 T5,重建损坏文本。
4.2 后续优化 (对齐):
指令微调 (Instruction Tuning):使模型理解并遵循人类指令。
人类反馈强化学习 (RLHF):
收集人类偏好数据。
训练奖励模型 (Reward Model, RM)。
使用 PPO 等算法优化 LLM,使其输出与 RM 奖励一致。
5. 大模型的优化方法
5.1 推理优化
硬件加速:使用 A100/H100/昇腾等芯片。
模型剪枝 (Pruning):去除不重要的连接。
知识蒸馏 (Knowledge Distillation):用大模型指导小模型训练。
量化 (Quantization):降低浮点精度 (如 FP16 $\rightarrow$ Int8/Int4) 以减少计算和内存。
5.2 高效微调 (PEFT)
全参数微调 (Full Fine-Tuning):计算开销大。
参数高效微调 (PEFT):只训练少数参数。
LoRA (Low-Rank Adaptation):在原始权重旁插入低秩矩阵 $A, B$,仅训练 $A, B$。
P-Tuning/Prompt Tuning:只训练 Soft Prompt Tokens。
5.3 Agent 增强
ReAct:Reasoning (推理) + Action (行动) 框架,使 LLM 能规划和使用工具。
MoE (Mixture of Experts):混合专家模型,并行激活稀疏专家,提高参数效率。
6. 大模型的常见问题和挑战
6.1 准确性问题
事实性错误 (Hallucination):模型生成与事实不符的内容(“一本正经地胡说八道”)。
知识盲区:对最新信息或特定领域知识缺乏了解。
6.2 可靠性问题 (安全与伦理)
安全风险:训练数据合规性、数据偏见、对抗性攻击。
安全伦理:政治敏感、犯罪违法、歧视/偏见、仇恨言论等风险对话场景。
6.3 成本与效率
高昂的训练成本:需要大量计算资源和时间。
部署成本:推理耗时和内存占用大。
7. 未来发展方向和趋势
更大规模的模型:参数级别持续增长,如超大规模模型。
更高效的训练方法:研究更智能的参数初始化、优化算法等。
融合多模态信息:结合文本、图像、语音的多模态模型将是重点。
Agent 智能体的突破:具备高级推理、多步规划和工具调用能力的自主智能体。
可信赖 AI:解决可解释性 (XAI)、可验证性、公平性等问题。 这是根据您提供的《AGI发展新范式-多智能体Manus技术解析》(2025年秋季)PPT内容整理的复习提纲,专为开卷考试快速检索设计。
AGI发展新范式-多智能体Manus技术解析 复习提纲
1. 简要概述
1.1 Manus 的诞生与定位
发布时间:2025年3月6日(中国AI团队 Monica)。
核心哲学:“Mens et Manus”(手脑并用)——实现从“思考者”到“执行者”的质变。
定位:全球首款通用 Agent 产品(通用智能体),具备自主决策与多场景适应能力。
1.2 主要功能
智能决策中枢:通过强化学习和多模态感知实现自主决策,适用于动态复杂场景。
多模态交互:支持语音、图像、文本,实现无障碍沟通。
跨领域适配:通过迁移学习和微调快速部署。
自主任务执行:结合知识图谱和工具调用,自动规划并执行复杂任务。
2. 工作原理
2.1 基础架构 (4层结构)
感知层 (Perception Layer):多模态传感器/数据接入,完成环境感知和数据预处理。
认知层 (Cognition Layer):
大语言模型 (LLM):推理与泛化能力。
知识图谱 (KG):领域知识存储与检索。
强化学习 (RL):决策与优化能力。
规划与执行层 (Planning & Execution Layer):
任务分解:将复杂任务拆解为子任务。
工具调用 (Tool Call):利用外部 API 或工具。
多 Agent 协同:管理和协调子智能体。
环境层 (Environment Layer):实际操作环境(虚拟或现实)。
2.2 工作机制
- 决策链路:感知输入 $\rightarrow$ 认知推理 $\rightarrow$ 任务规划 $\rightarrow$ 执行反馈 $\rightarrow$ 自我修正。
3. 核心技术
3.1 多 Agent 协同框架
架构:由中央协调 Agent (Central Agent) 和多个功能性 Agent 构成。
Central Agent:负责任务分解、资源分配、冲突协调。
功能 Agent:专注于特定任务,如数据分析 Agent、代码生成 Agent。
通信协议:基于 FIPA ACL 标准,确保 Agent 间的可理解通信。
3.2 深度强化学习
算法:基于 PPO (Proximal Policy Optimization) 改进的在线学习框架。
特点:结合人类反馈 (RLHF),加速模型在特定场景下的收敛速度。
3.3 实时知识图谱融合
- 功能:通过 Neo4j/JanusGraph 存储实时知识,解决大模型的事实性错误 (Hallucination) 和知识时效性问题。
4. 创新之处
创新点:
通用 Agent 架构:统一了 LLM、KG 和 RL 三种核心范式。
自适应工具调用:智能选择并组合工具链。
跨任务零样本迁移:快速适应新任务。
可解释性与可控性:任务规划过程透明化。
5. 应用场景
智能办公:公文起草、会议记录、跨部门协作。
金融服务:量化交易策略生成、智能投顾、风险评估。
智能制造:生产流程优化、故障预测与诊断。
低空经济:无人机群调度、复杂环境路径规划。
6. 当前缺陷与挑战
缺陷/挑战:
算力与能耗矛盾:高精度感知和持续学习消耗大量算力。
跨领域迁移挑战:缺乏通用的框架支持快速跨行业适配。
实时决策延迟:在复杂场景中,决策生成速度仍需优化。
7. 发展趋势
未来方向:
AGI 市场规模:预计到2030年全球市场规模将达4710亿美元。
Agent 协作深化:向更复杂、更去中心化的 Agent 协作网络发展。
多模态升级:实现图像、语音、视频的深度理解与生成。
合规与安全:加强数据隐私保护和伦理对齐,确保可信赖。