Post

人工智能课程ppt提纲

人工智能课程ppt提纲

这份提纲是根据您提供的《第一章 人工智能概述》PPT内容整理的,专为开卷考试快速索引设计。

第一章 人工智能概述 复习提纲

1.1 人工智能的概念

  • 定义

    • 由计算机实现的人造智能,模拟、延伸、扩展人类智能 1。
  • 图灵测试 (Turing Test)

    • 提出者:阿兰·图灵(Alan Turing),计算机科学与人工智能之父 2。

    • 标准:如果一个人在相当长时间内无法区分对话对象是人还是机器(30%的人误判),则机器具有智能 3333。

  • 智能的特征

    • 感知能力(视觉、听觉等)4。

    • 记忆与思维能力(逻辑思维、形象思维)5。

    • 学习与自适应能力 6。

    • 行为能力 7。

  • 研究目标

    • 延伸和增强人类能力,实现人机和谐共生 8。
  • 表现形式

    • 智能软件:专家系统、知识库 9。

    • 智能设备:嵌入式系统(智能家电、智能仪表)10101010。

    • 智能机器:机器人(如智能汽车)11111111。

    • 智能系统:智能网络、多智能体系统(MAS)、Agent 121212121212121212。

    • 最新进展 (2025):AI智能体元年,通用智能体 “Manus” 13。

1.2 人工智能的研究途径与方法

  • 符号主义 (Symbolism)

    • 别名:功能模拟学派、逻辑主义 141414。

    • 核心:物理符号系统假设,基于知识和推理(显式知识)151515。

    • 代表:纽厄尔、西蒙、专家系统 16。

  • 连接主义 (Connectionism)

    • 别名:结构模拟学派、仿生学派 171717。

    • 核心:神经网络,数值计算,模拟大脑生理结构 181818。

    • 代表:M-P模型、感知器、BP算法、深度学习 19。

  • 行为主义 (Behaviorism)

    • 别名:行为模拟学派、进化主义、控制论学派 202020。

    • 核心:感知-动作模式,与环境交互,自适应 212121。

    • 代表:Brooks(六足机器人)22。

  • 集成模拟法:三种方法取长补短 23232323。

1.3 人工智能的分支领域

  • 基于脑功能模拟

    • 机器感知:模式识别(图形识别、语音识别)24。

    • 机器联想:联想存储 25。

    • 机器推理:演绎、归纳、类比推理;自然演绎法、判定法、归结原理 26262626。

    • 机器学习:机械学习、归纳学习、数据挖掘 27272727。

    • 机器理解:自然语言理解 (NLP)、图形理解 28282828。

    • 机器行为:机器人行动规划 29292929。

  • 基于实现技术领域划分
    • 符号智能
    • 计算智能
  • 基于应用领域
    • 问题求解与博弈
    • 逻辑推理与证明
    • 计算智能
    • 分布式人工智能
    • 自动程序设计
    • 专家系统
    • 机器学习
    • 自然语言理解
    • 机器人学
    • 模式识别
    • 机器视觉
    • 神经网络
    • 。。。
  • 基于技术/应用系统

    • 专家系统 (ES):模拟专家决策,含有大量专门知识 30303030。

    • 博弈:下棋(深蓝、AlphaGo、Libratus)31。

    • 分布式人工智能 (DAI):分布式问题求解、多智能体系统 (MAS/Agent) 32323232。

    • 计算智能:神经网络、进化计算(遗传算法)、模糊技术 33333333。

    • 机器视觉:图像处理、检测 34。

    • 智能控制:无需人工干预的自动控制 35。

  • 常用编程语言:Python, Java, C++, Lisp, Prolog 36。

1.4 人工智能的基本技术

  • 推理技术 37。

  • 搜索技术 38。

  • 知识表示与知识库技术 39。

  • 归纳技术 40。

  • 联想技术 41。

1.5 人工智能的发展历史

  • 孕育期 (1956前):图灵机、M-P神经元模型 42。

  • 诞生 (1956):达特茅斯会议 (Dartmouth Workshop),麦卡锡提出“人工智能”一词 43。

  • 发展阶段

    1. 神经元网络时代 (40s-50s):感知器,受限于XOR问题 (Minsky) 44。

    2. 通用方法时代 (50s-60s):逻辑理论机(LT)、通用问题求解(GPS) 45。

    3. 知识工程时代 (60s-80s):专家系统 (DENDRAL, MYCIN),费根鲍姆提出“知识工程” 46464646。

    4. 神经网络复苏 (80s-90s):Hopfield网、BP算法 47474747。

    5. 数据与网络时代 (90s-2000s):深蓝战胜卡斯帕罗夫,数据挖掘 48484848。

    6. 深度学习时代 (2006至今):Hinton提出深度置信网络,AlphaGo,大模型 49。

  • 大模型 (Large Models):海量参数,预训练+微调,通用性强 50。

1.6 人工智能的典型应用

  • 金融:智能风控、智能投研 51。

  • 公共安全:生物特征识别(人脸、指纹)、智能办案 52。

  • 医疗健康:医学影像分析(腾讯觅影)、手术机器人(天玑)、药物设计 535353535353535353。

  • 交通出行:自动驾驶(L1-L5分级),百度无人车、奥迪L3 545454545454545454。

  • 其他:智能教育、工业制造、娱乐(冬奥会机器人)、智能客服 55555555555555555555555555555555。

  • 国家创新平台:百度(自动驾驶)、阿里云(城市大脑)、腾讯(医疗影像)、科大讯飞(智能语音)56。

1.7 未来发展趋势与挑战

  • 趋势

    • 从专用智能向通用智能 (AGI) 发展 57。

    • 从人工+智能向自主智能系统发展 58。

    • 人机混合智能 59。

    • 大模型方向:对齐、多模态、智能体 (Agent)、具身智能 60。

  • 挑战 (伯克利视角)

    • 持续学习、鲁棒决策、可解读性 (Explainable AI)、安全飞地、对抗学习、数据隐私 61。
  • 国家战略

    • 中国:《新一代人工智能发展规划》(2017),三步走战略 (2020, 2025, 2030) 62626262。

    • 美国:“美国人工智能计划”,保持霸主地位 63。 这是根据您提供的第二章PPT内容整理的复习提纲,专为开卷考试快速检索设计。

第二章 知识表示 复习提纲

2.1 概述

  • 知识工程 (Knowledge Engineering)

    • 定义:利用计算机/通信技术实现知识的自动转移和应用 1。

    • 包含环节:知识获取、知识表示、知识应用 2。

    • 核心地位:爱德华·费根鲍姆 (Edward Feigenbaum) 于1977年提出 3。

    • 大数据时代特征:从数据到智慧 (Smart Data) 4。

  • 知识的概念与分类

    • 按作用分类

      • 描述性知识 (事实性) 5555。

      • 判断性知识 (启发性/规则) 6666。

      • 过程性知识 (控制策略) 7777。

    • 按层次分类

      • 对象级知识 (领域相关) 8。

      • 元级知识 (关于知识的知识) 9。

  • 知识表示 (Knowledge Representation)

    • 构成:符号 (结构) + 处理机制 10。

    • 要求:表示能力、可理解性、便于获取、便于搜索、便于推理 11。

2.2 知识表示的基本方法

  • 2.2.1 谓词逻辑表示法

    • 基础:命题逻辑与谓词逻辑 (形式语言) 12。

    • 特点:自然性、精确性、严密性、容易实现 13。

    • 局限:不能表示不确定性、组合爆炸、效率低 14。

    • 应用:PROLOG语言 15。

  • 2.2.2 产生式表示法 (Production Systems)

    • 规则形式:IF P THEN Q (前提 -> 结论/动作) 16。

    • 系统组成

      • 规则库 (Rule Base):存储领域知识 17171717。

      • 综合数据库 (Fact Base/Dynamic DB):存放事实、中间结果 18181818。

      • 推理机 (Inference Engine):控制系统 (匹配、冲突解决、操作) 19191919。

    • 推理方式

      • 正向推理 (数据/事实 -> 目标) 20。

      • 反向推理 (目标 -> 初始事实) 21。

      • 双向推理。

    • 冲突解决策略:专一性排序、规则排序、规模排序、就近排序 22222222。

    • 优缺点:清晰、模块化、自然;但难扩展、效率低 23。

  • 2.2.3 框架表示法 (Frame Representation)

    • 结构:框架名、槽 (Slot)、侧面 (Facet)、值 (Value) 24。

    • 特性:继承性 (子框架继承父框架槽值) 25。

    • 推理方法:匹配、搜索、填槽 26。

    • 特点:结构化强,但缺乏理论体系 27。

  • 2.2.4 语义网络表示法 (Semantic Networks)

    • 定义:节点 (事物/概念) + 有向边 (关系) 28。

    • 常用关系

      • 实例关系 (ISA / is-a) 29。

      • 分类/泛化关系 (AKO / a-kind-of) 30。

      • 聚集/整体部分关系 (A-part-of) 31。

      • 属性关系、成员关系 (a-member-of)、逻辑关系 (AND/OR)、方位关系 32。

    • 复杂表示:事件节点法、全称/存在量词表示 33333333。

    • 推理过程:继承推理、匹配推理 34。

    • 特点:结构性、联想性、自索引性 35。

2.3 知识图谱 (Knowledge Graph)

  • 2.3.1 概念

    • 定义:描述客观世界的概念、实体、事件及其关系,通常用三元组 (资源-属性-属性值) 表示 36。

    • 起源:Google (2012) 37。

    • 组成:知识 (数据特征) + 图谱 (结构特征) 38。

  • 2.3.2 体系架构与关键技术

    • 逻辑架构:模式层 (Ontology) + 数据层 (Graph DB) 39。

    • 构建流程 (以CN-DBpedia为例):

      1. 信息抽取 (Extraction):爬虫、文档解析、深度学习(LSTM-RNN) 40404040。

      2. 信息对齐/标准化 (Normalization) 41。

      3. 知识链接/分类 (Enrichment) 42。

      4. 信息修正 (Correction):错误发现、众包修正 43。

      5. 内容更新 (Update):周期+动态 44。

      6. 知识存储 (Storage) 45。

    • 相关技术:知识推理、知识问答 46。

  • 2.3.3 典型知识图谱

    • 通用:Freebase, Wikidata, DBpedia, YAGO, CN-DBpedia, XLORE 47。
  • 2.3.4 主要应用

    • 辅助搜索 (语义搜索)、辅助问答 (Siri/WolframAlpha)、辅助决策、辅助AI (常识推理)、垂直领域 (金融/电商) 48。
  • 2.3.5 特点与趋势

    • 特点:逻辑推理、可解释性、自然关联 49。

    • 研究热点:LLM融合、多模态KG、动态/实时KG、区块链结合、跨语言KG 50。

附录:专家系统 (Expert Systems)

  • 定义与特点

    • 基于知识的智能系统,分离了知识与推理 51。

    • 特点:启发性、透明性 (解释功能)、灵活性 52。

  • 系统结构 53535353:

    • 知识库:核心,含领域知识与元知识。

    • 推理机:模拟思维,执行控制循环 (匹配-选择-执行)。

    • 动态数据库:黑板/工作区。

    • 人机界面

    • 解释模块:回答 How & Why。

    • 知识库管理系统

  • 推理技术

    • 假言推理 (Modus Ponens) vs. 拒取式 (Modus Tollens) 54。

    • 正向推理 (数据驱动) vs. 反向推理 (目标驱动) 55。

  • 典型系统实例

    • DENDRAL:第一个专家系统 (化学) 56。

    • MYCIN:医疗诊断 (血液感染),使用产生式规则 57。

    • PROSPECTOR:地质勘探 58。

  • 新型专家系统

    • 黑板模型 (Blackboard Model) 59。

    • 分布式/协同专家系统 (Multi-agent) 60。

    • 模糊专家系统、神经网络专家系统 61616161。 这是根据您提供的第三章PPT内容整理的复习提纲,专为开卷考试快速检索设计。

第三章 通过搜索进行问题求解 复习提纲

3.1 问题求解智能体 (Problem-Solving Agents)

  • 基本定义:通过传感器感知环境,通过执行器作用于环境 1。

  • 处理流程:目标形式化 $\rightarrow$ 问题形式化 $\rightarrow$ 搜索 $\rightarrow$ 执行 2。

    • 搜索 (Search):在模型中模拟动作序列,直到找到通往目标的路径 3333。

3.2 问题形式化 (Problem Formulation)

  • 5个组成部分 4444:

    1. 状态空间 (State Space):所有可能状态的集合。

    2. 初始状态 (Initial State):智能体启动时的状态。

    3. 目标状态 (Goal State):一个或多个目标状态的集合。

    4. 动作 (Actions):智能体可采取的行动。

    5. 转移模型 (Transition Model):描述动作产生的结果。

  • 相关概念

    • 路径代价 (Path Cost):通常是动作代价的累加。

    • 最优解 (Optimal Solution):路径代价最小的解 5。

  • 典型问题示例

    • 8数码问题 (8-puzzle):标准化问题 6。

    • 寻径问题 (Route Finding):真实世界问题(如罗马尼亚地图、航空旅行) 7。

3.3 搜索算法基础

  • 树搜索 (Tree Search)

    • 基本思想:从初始状态出发,探索路径,构建搜索树 8。

    • 节点 (Node) vs 状态 (State):节点是数据结构(含父节点、深度、路径代价$g(x)$),状态是物理配置 9。

  • 性能评估指标 10:

    1. 完备性 (Completeness):有解时是否保证找到解。

    2. 时间复杂度 (Time Complexity):生成/扩展的节点数。

    3. 空间复杂度 (Space Complexity):内存中存储的最大节点数。

    4. 最优性 (Optimality):是否找到代价最低的解。

  • 定义:只使用问题定义中的信息,不包含目标位置线索 11。

    1. 广度优先搜索 (BFS) 12
    • 策略:先扩展根节点,再层层扩展(FIFO队列)。

    • 性质:完备(若分支因子$b$有限);最优(若步长代价相等);时间/空间复杂度均为 $O(b^{d+1})$。

    • 缺点:空间(内存)需求巨大。

    1. 一致代价搜索 (Uniform-Cost Search) 13
    • 策略:扩展$g(n)$(路径代价)最小的节点(优先队列)。

    • 性质:完备;最优;类似于BFS但按代价扩展。

    1. 深度优先搜索 (DFS) 14
    • 策略:优先扩展最深的节点(LIFO队列)。

    • 性质:不完备(可能陷入死循环);不最优;时间 $O(b^m)$;空间 $O(bm)$(线性空间,内存消耗小)。

    1. 深度受限搜索 (DLS) 15
    • 策略:DFS加上深度界限 $L$。
    1. 迭代加深搜索 (IDS) 16
    • 策略:反复调用DLS,界限 $L=0, 1, 2, \dots$。

    • 性质:完备;最优(若步长代价=1);时间 $O(b^d)$;空间 $O(bd)$。

    • 评价:结合了BFS的完备性/最优性和DFS的空间优势,是首选的无信息搜索策略。

  • 定义:利用启发式函数 $h(n)$ 提供目标位置线索 17。

  • 评估函数 $f(n)$

    • $g(n)$:从初始状态到 $n$ 的实际代价。

    • $h(n)$:从 $n$ 到目标的估计代价。

    1. 贪心最佳优先搜索 (Greedy Best-First Search) 18
    • 策略:扩展 $h(n)$ 最小的节点(看起来离目标最近)。

    • 性质:不完备(可能死循环);不最优;时间/空间 $O(b^m)$。

    1. A 搜索 (A Search)** 19
    • 策略:扩展 $f(n) = g(n) + h(n)$ 最小的节点。

    • 性质

      • 完备性:是(除非有无穷多节点 $f \le f(G)$)。

      • 最优性:是(前提是 $h(n)$ 是可采纳的/一致的) 20202020。

    • 应用案例:八数码、修道士和野人、游戏寻路 21。

3.6 启发式函数 (Heuristic Functions)

  • 可采纳性 (Admissibility):$h(n) \le h^*(n)$,即从不高估到达目标的代价 22222222。

  • 一致性 (Consistency/Monotonicity):满足三角不等式 $h(n) \le c(n, a, n’) + h(n’)$ 23。

  • 典型例子 (8数码问题) 24:

    • $h_1$:错位滑块的数量。

    • $h_2$:曼哈顿距离(所有滑块到目标位置的距离之和)。

    • 比较:$h_2 \ge h_1$,故 $h_2$ 优于(支配)$h_1$,搜索节点更少 25。

  • 构造方法:从松弛问题(Relaxed Problem,减少限制条件)的精确解推导 26。

    • 例如:TSP问题的松弛版本是最小生成树 27。 这是根据您提供的第四章PPT内容整理的复习提纲,专为开卷考试快速检索设计。

第四章 复杂环境中的搜索 复习提纲

4.1 局部搜索和优化问题

  • 基本概念

    • 适用场景:路径无关,目标状态即是解(优化问题)1。

    • 特点:迭代改进,只保持当前状态,内存占用少 2。

    • 状态空间地形:全局最大值、局部最大值、山肩、平坦最大值 3。

  • 爬山法 (Hill Climbing)

    • 定义:贪心局部搜索,向最陡上升方向移动 4。

    • 缺陷:易陷入局部极大值、平台区(山肩)5。

    • 变体:随机爬山法、随机重启爬山法 6。

  • 模拟退火 (Simulated Annealing)

    • 原理:结合爬山法和随机游走,允许以一定概率接受“坏”移动 7。

    • 机制:概率随 $\Delta E$ 和温度 $T$ 变化 8。

    • 性质:$T$ 下降足够慢时,能找到全局最优解(玻尔兹曼分布)9。

  • 局部束搜索 (Local Beam Search)

    • 原理:保留 $k$ 个状态,并行搜索 10。

    • 变体:随机束搜索(增加多样性)。

  • 进化算法 (Evolutionary Algorithms)

    • 原理:随机局部束搜索 + 后代生成(自然选择隐喻) 11。

    • 关键步骤:选择 (Selection)、杂交 (Crossover)、突变 (Mutation) 12。

  • 连续状态空间搜索

    • 方法:梯度上升/下降 ($\nabla f$) 13。

    • 迭代求根:Newton-Raphson 方法 14。

4.2 非确定性与部分可观测环境搜索

  • 非确定性动作 (Nondeterministic Actions)

    • 概念:信念状态 (Belief State),结果是条件规划 (Contingency Plan) 15。

    • 模型:与或搜索树 (AND-OR Search Trees) 16。

      • “或”节点:智能体的选择。

      • “与”节点:环境的选择(分支)。

    • 实例:不稳定的真空吸尘器世界 17。

    • 策略:反复尝试 (Try-Again) 18。

  • 部分可观测环境 (Partially Observable)

    • 基本流程:预测 (Prediction) $\rightarrow$ 可能感知 (Possible Percepts) $\rightarrow$ 更新 (Update) 19。

    • PERCEPT(s) 函数。

4.3 博弈搜索 (Game Theory)

  • 基本概念

    • 类型:双人完备信息博弈 (Zero-sum)、机遇性博弈 20。

    • 博弈树:MAX节点(我方)与 MIN节点(对手)交替 21。

  • 极大极小过程 (Minimax)

    • 原理:MAX选择最大估值,MIN选择最小估值 22。

    • 估价函数:对叶节点进行静态估值 23。

  • $\alpha-\beta$ 剪枝 (Alpha-Beta Pruning)

    • 目的:减少搜索节点,提高效率 24。

    • $\alpha$ 值:MAX节点当前最大下界。

    • $\beta$ 值:MIN节点当前最小上界。

    • 规则:

      • $\beta$ 剪枝:MAX节点 $\alpha \ge$ 先辈 $\beta$。

      • $\alpha$ 剪枝:MIN节点 $\beta \le$ 先辈 $\alpha$。

4.4 案例分析:AI围棋 (AlphaGo)

  • 发展历程

    • AlphaGo Fan (2015) $\rightarrow$ AlphaGo Lee (2016) $\rightarrow$ Master (2017) $\rightarrow$ Zero (2017) 25。
  • 核心技术体系

    1. 蒙特卡罗模拟 (Monte Carlo Simulation):随机对弈评估盘面 26。

    2. 多臂老虎机问题 (Multi-armed Bandit):UCB/UCT 算法平衡探索与利用 27。

    3. 蒙特卡罗树搜索 (MCTS) 28:

      • 四个步骤:选择、扩展、模拟、更新。

      • 结合离线知识:Elo Rating 排序、剪枝 29。

    4. 深度神经网络 30303030:

      • 策略网络 (Policy Network):减少搜索宽度(选点)。

      • 值网络 (Value Network):减少搜索深度(局面评估)。

  • AlphaGo Zero 的改进 31

    • 自对弈强化学习 (无人类棋谱)。

    • 策略与价值网络合二为一。

    • 不再使用随机模拟 (Rollout)。

    • 使用残差网络 (ResNet)。

4.5 AI 前沿应用

  • 化学/生物领域

    • AlphaFold:蛋白质结构预测 (2024诺贝尔化学奖相关) 32。

    • 逆向合成分析:化学界的 “AlphaGo”,利用 MCTS 和深度学习规划合成路径 33。

  • AutoML (自动机器学习)

    • 目标:自动化模型设计、超参数优化 34。

    • NAS (神经架构搜索):搜索最优网络结构 35。

    • ENAS (高效神经架构搜索):通过参数共享 (Parameter Sharing) 提高效率 36。 这是根据您提供的第六章PPT内容整理的复习提纲,专为开卷考试快速检索设计。

第六章 智能体与多智能体系统 复习提纲

6.1 概述

  • 智能体 (Agent) 定义:驻留在某一环境下,能够自主 (Autonomous)、灵活 (Flexible) 地执行动作以满足设计目标的行为实体 1。

  • 特征

    • 驻留性:驻留在环境中,通过感知输入和动作输出与环境交互 2。

    • 自主性:无外部干涉下自主运行,控制自身行为 3。

    • 灵活性

      • 反应性 (Reactive):感知环境并适时反应 4。

      • 自发性 (Pro-active):主动产生目标并实施行为 5。

      • 社会性 (Social):与其他智能体交互、合作、协商 6。

  • Agent要素 (BDI模型):认知 (信念)、情感 (愿望)、意向 (意图) 7。

6.2 Agent及其结构

  • 计算机系统中的地位:独立的功能模块/应用系统,含决策生成器(核心主控)8。

  • 结构分类

    1. 反应式 Agent:基于简单的“感知-动作”规则 (if-then),无复杂推理 9。

    2. 慎思式 Agent:基于知识库的逻辑推理 (如 BDI模型),行为决策是定理证明过程 10。

    3. 跟踪式 Agent:维护内部状态,跟踪世界变化和自身影响 11。

    4. 基于目标的 Agent:结合目标信息与动作结果进行决策 12。

    5. 基于效果 (Utility) 的 Agent:使用效用函数衡量状态满意度,追求高质量结果 13。

    6. 复合式 Agent:集成多种结构层次 14。

  • 软件 Agent:后台进程 (Demon),如杀毒软件监控模块 15。

  • 人工生命 Agent:具有自我成长、繁殖能力的动态实体 16。

6.3 多智能体系统 (MAS)

  • 定义:多个相对独立又相互作用的智能体构成的系统 17。

  • 特点

    • 智能体间交互与协同:通过通信语言 (ACL) 交互,无全局控制 18。

    • 无全局观点:各智能体信息不完整 19。

    • 不可预测性:环境开放、动态 20。

  • 应用示例

    • 物理MAS:恒温调控系统 21。

    • 软件MAS:病毒防护系统 22。

    • 场景:低空经济多无人机配送 23、火星探矿机器人 24。

6.4 Agent通信

  • 通信方式

    • 消息传递 (需通道,如TCP/IP)。

    • 黑板系统 (共享存储区)。

    • 邮箱 (暂存) 25。

  • 言语行为理论 (Speech Act Theory):断言型、指示型、承诺型等 26。

  • 通信语言 (ACL)

    • 功能:表达交互意图 (语用) 和内容 (语义) 27。

    • 代表语言:KQML (知识查询与操纵语言)、FIPA ACL 28。

    • FIPA ACL通信行为:Inform (通知), Request (请求), Agree (同意), Refuse (拒绝), Propose (提议), CFP (招标) 等 29。

    • 消息结构:包含 sender, receiver, content, ontology, protocol 等 30。

6.5 协调与协作

  • 协调 (Coordination):解决冲突 (死锁/活锁),调整意图以适应环境和其他Agent 3131。

    • 方法:组织结构化、合同、多Agent规划、协商 32。
  • 协作 (Cooperation):非对抗Agent间为共同目标工作 33。

    • 类型:协作型、自私型、混合型 34。

    • 过程:产生需求 $\rightarrow$ 协作规划 $\rightarrow$ 寻求伙伴 $\rightarrow$ 选择方案 $\rightarrow$ 实现目标 $\rightarrow$ 评估 35。

  • 交互协议与模型

    • 合同网协议 (Contract Net Protocol, CNP):管理器 (Manager) 发布任务 (招标) $\rightarrow$ 参与者 (Bidder) 投标 $\rightarrow$ 管理器中标 $\rightarrow$ 签订合同 36。

      • 适用场景:任务分配、负载均衡。
    • 协商机制:投票、拍卖、谈判 37。

  • 案例 (EINSTein):基于多Agent的作战仿真,研究高层涌现行为 38。

6.6 移动Agent (Mobile Agent)

  • 定义:能自主在网络主机间移动的Agent,支持“代码移向数据” 39393939。

  • 状态:程序状态 (代码)、数据状态 (变量)、执行状态 (线程) 40。

    • 强移动:携带全部三种状态。

    • 弱移动:仅携带程序和数据状态。

  • 关键技术

    • 通信:移动Agent与服务Agent (C/S)、Agent间 (P2P)、组通信 41。

    • 安全性:主机保护 (防恶意Agent)、Agent保护 (防恶意主机) 42。

    • 容错与管理 43。

  • 应用:移动计算、网络管理、分布式信息检索 44。

6.7 多Agent系统开发框架 JADE

  • 简介:Java Agent DEvelopment Framework,遵循FIPA规范的开源中间件 45。

  • 组成

    • 软件开发包:封装Agent通信等功能。

    • 运行环境:主容器 (Main Container) + 普通容器,提供AMS (管理系统) 和 DF (目录服务/黄页) 46。

    • 图形化工具:调试与管理工具。

  • 通信机制:容器内 (Java事件)、容器间 (RMI)、平台间 (IIOP) 47。

  • 编程模型setup() 初始化,addBehaviour() 添加行为 (如 CyclicBehaviour, OneShotBehaviour) 48。

6.8 案例:火星探矿机器人

  • 场景设计:M×M网格环境,包含矿产、障碍物、能量站 49。

  • Agent能力:移动、探测、采集、卸载、交互 50。

  • 多Agent模式

    • 场景二:同构Agent合作 (信息共享)。

    • 场景三:异构Agent合作 (多角色:采矿Agent + 探测Agent) 51。

  • JADE实现:定义不同类型的Agent类,通过ACL消息进行坐标和矿产信息的交互 52。 这是根据您提供的第七章PPT内容整理的复习提纲,专为开卷考试快速检索设计。

第七章 机器人 复习提纲

7.1 机器人基本概念

  • 定义:通过操纵真实世界去完成任务的实体智能体 1。

  • 组成

    • 实体效应器 (Effectors):腿、轮子、关节、夹具(如平行钳、三指夹具、Shadow灵巧手)2。

    • 传感器 (Sensors)

      • 被动式:摄像头(立体视觉)、麦克风、GPS。

      • 主动式:声纳、雷达、扫描激光雷达(LiDAR)3。

      • 内部测量:陀螺仪、加速度计、力矩传感器。

    • 执行器 (Actuators):电动、液压、气动;驱动关节(旋转、平移、球形)运动 4。

  • 类型

    • 机械手 (Manipulators):固定基座,如工业机械臂。

    • 移动机器人 (Mobile Robots):UAV(无人机)、AUV(水下)、自主无人车、腿式机器人。

    • 其他:假体、外骨骼、具身智能机器人。

7.2 机器人学解决的问题

  • 三级层次结构 5:

    1. 任务规划 (Task Planning):高层级动作策略(如“移动到门口”)。

    2. 运动规划 (Motion Planning):从点到点的路径规划。

    3. 控制 (Control):驱动执行器完成运动。

  • 核心特性:连续状态/动作空间、非确定性、部分可观测。

7.3 机器人感知 (Perception)

  • 任务:将传感器测量值映射到环境的内部表示。

  • 定位 (Localization):确定机器人在哪。

    • 蒙特卡罗定位 (MCL):基于粒子滤波 6。

    • 卡尔曼滤波 (Kalman Filter):高斯分布后验概率;EKF(扩展卡尔曼滤波)用于非线性模型 7777。

  • SLAM (同时定位与地图构建):在未知环境中同时构建地图和定位 8。

  • 机器学习应用:自监督学习、无监督学习(低维嵌入)。

7.4 规划及控制

  • 基本概念

    • 工作空间 (Workspace):机器人移动的物理空间。

    • 构形空间 (Configuration Space, C-space):所有构成机器人的点的抽象多维空间 9。

  • 运动规划方法 10:

    • 沃罗诺伊图 (Voronoi Diagram):基于障碍物距离划分区域,路径远离障碍物 11。

    • 概率路线图 (PRM):采样无碰撞里程碑并连接。

    • 快速探索随机树 (RRT):双向生长树结构,概率完备 12。

    • 轨迹优化:利用势场法使路径远离碰撞 13。

  • 轨迹跟踪控制

    • P控制器 (比例):反比于误差的力,不严格稳定(易抖动)。

    • PD控制器 (比例微分):增加微分项,严格稳定 14。

    • PID控制器:比例积分微分。

    • 计算扭矩控制:结合逆动力学模型和反馈误差补偿。

7.5 规划不确定的行动

  • 问题:动作执行有误差(如速度不确定性圆锥)15。

  • 策略

    • 精细运动规划 (Fine-motion planning):设计一系列保护移动(如沿着墙滑入孔洞)。

    • 在线重规划

    • 信息收集动作:如海岸导航启发式(靠近地标以减少不确定性)。

7.6 强化学习与具身智能

  • 强化学习 (RL)

    • 挑战:连续状态空间、样本复杂性(Sim-to-Real迁移)。

    • 方法:端对端学习、元学习。

  • 具身智能 (Embodied AI) 16:

    • 定义:基于物理身体进行感知和行动的智能系统。

    • 核心要素:本体、智能体、数据、学习进化框架。

    • 关键技术:芯片(GPGPU/FPGA/ASIC)、传感器、伺服电机(直驱)、AI算法、云服务。

    • 趋势:跨模态交互、自适应学习、人机共栖 17。

7.7 人类和机器人协作

  • 博弈模型:将人机交互建模为不完全信息博弈。

  • 预测与协调

    • 预测人类动作(由于人类不是完美理性的)。

    • 协作目标:联合优化代价函数 ($J_H = J_R$)。

  • 学习人类意图

    • 逆强化学习 (Inverse RL):从人类演示中推断代价函数(偏好学习)。

    • 模仿学习:行为克隆。

7.8 应用领域

  • 工业:装配、搬运。

  • 医疗:手术机器人(达芬奇)、康复外骨骼。

  • 服务:扫地机器人 (Roomba)、配送无人机。

  • 自动驾驶:特斯拉、Waymo。

  • 探索:火星车 (Curiosity)。 这是根据您提供的第八章PPT内容整理的复习提纲,专为开卷考试快速检索设计。

第八章 自然语言处理技术 复习提纲

8.1 自然语言理解的一般问题

  • 基本概念

    • 语言智能:基于人类自然语言属性,探索语言活动运作机理,赋予机器类人语言活动功能 1。

    • 自然语言特点:多义性、上下文相关性、模糊性、非系统性、环境相关性 2。

    • 自然语言理解 (NLU) 定义

      • 微观:从自然语言到机器内部的一个映射 3。

      • 宏观:机器能够执行人类期望的语言功能(如回答问题、文摘生成、翻译等)4。

  • 发展阶段

    1. 理性主义 (符号逻辑):萌芽期至90年代初,以规则、词典、模板为主 55。

    2. 经验主义 (统计学习):90年代初至2013年,以语料、特征、统计模型(N-Gram, HMM, SVM)为主 66。

    3. 连结主义 (深度学习):2013年至今,多层神经网络(Deep Learning, LSTM, Transformer, BERT, LLM) 777。

  • 理解的层次

    1. 韵律学 (Prosody):节奏和语调 8。

    2. 音韵学 (Phonology):声音的形成(语音识别基础) 9。

    3. 词态学 (Morphology):单词的构成(词素、前缀、后缀) 10。

    4. 语法/句法 (Syntax):单词组合成短语/句子的规律 11。

    5. 语义学 (Semantics):单词、短语和句子的意思 12。

    6. 语用学 (Pragmatics):语言的使用方法及对听众的效果(环境知识) 13。

    7. 世界知识 (World Knowledge):通用背景知识 14。

8.2 词法分析

  • 任务:单词切分、找出词素、确定词义 15。

  • 英语词法分析

    • 特点:有词性、数、时态、派生、变形;词根只有一个 16。

    • 算法:查词典 -> 若未找到则修改单词 (去掉后缀等) -> 重复 17。

    • 难点:词义判断(需依赖上下文) 18。

  • 汉语分词

    • 难点

      1. 切分歧义

        • 交集歧义:如“地面积” (地面/积 vs 地/面积) 19。

        • 组合歧义:如“把手” (动词+名词 vs 名词) 20。

      2. 未登录词 (OOV):新词、网络流行语 (如“给力”) 21。

8.3 句法分析

  • 短语结构文法

    • 定义:$G=(T, N, S, P)$,其中 $T$为终结符,$N$为非终结符,$S$为起始符,$P$为产生式规则 22。

    • 推导:利用产生式规则将符号串重写,直到生成句子 23。

  • Chomsky 文法体系 (四种形式) 24

    • 0型文法:无约束短语结构文法 (能力最强,很少用于NLP) 25。

    • 1型文法:上下文有关文法 (Context-Sensitive),自然语言属于此类 26。

    • 2型文法:上下文无关文法 (Context-Free),规则 $A \rightarrow x$ 27。

    • 3型文法:正则文法 (Regular),包括左/右线性文法 28。

  • 分析方法

    • 句法分析树:树根为初始符号,叶子为终结符 29。

    • 转移网络 (Transition Networks):结点表示状态,弧表示符号匹配与转移 30。

      • 扩充转移网络 (ATN):用于处理上下文有关语言 31。

8.4 语义分析

  • 语义文法:将文法知识和语义知识组合,以统一方式定义规则(如直接用“SHIP”、“ATTRIBUTE”等语义类别代替语法类别) 32。

  • 格文法 (Case Grammar)

    • 核心:以动词为中心构造 33。

    • 结构:名词/介词短语以与动词的关系(格)来表示,如 Agent (施事), Dative (与格/接受者) 34。

    • 特点:深层结构表示,主动句与被动句的格表示相同 35。

8.5 大规模真实文本处理 (语料库)

  • 语料库语言学

    • 特点:规模大、处理真实文本、结合规则与统计方法 36。

    • 趋势:部分分析/理解/翻译代替全分析/理解/翻译 37。

    • 结构化语言模型:如 PCFG (概率上下文无关文法) 38。

  • 汉语语料库加工技术

    1. 自动分词 39:

      • 最大匹配法 (MM):正向,按定长截取匹配。

      • 逆向最大匹配法 (RMM):从右到左匹配,正确率通常高于MM。

      • 逐词遍历匹配法

    2. 词性标注 40:

      • 难点:兼类词的歧义排除。

      • 方法:基于规则、基于概率统计 (HMM等)。

    3. 词义标注 41:

      • 难点:多义词的歧义排除 (WSD)。

      • 方法:利用上下文环境,基于词典或语料库统计。

  • 语义资源

    • WordNet:基于认知语言学的英语词典,按语义组织 (同义词集),名词组成继承关系,动词组成语义网 42424242。

    • 知网 (HowNet):中英文语义资源,定义万物、时间、空间等7大类别 43。

    • 北大语料库:完成词语切分和词性标注 44。

8.6 典型对话系统与模型发展

  • 早期系统

    • ELIZA (1966):模拟心理治疗医生 45。

    • SHRDLU (1970s):积木世界对话系统 46。

    • LUNAR:月球标本数据查询 47。

  • 现代系统

    • IBM Watson:问答系统,战胜人类选手 48。

    • 微软小冰:强调情商 (EQ) 和闲聊 49。

    • 对话系统分类:任务导向型 (解决具体需求) vs 开放域 (闲聊/情感陪伴) 50。

    • 神经机器翻译 (NMT):Encoder-Decoder框架 -> Transformer -> BERT 51。

8.7 预训练模型 (2025年视角)

  • 发展趋势:参数规模指数级增长 (GPT-3 达 1750亿参数),无需微调即可完成任务 52525252。

  • 主流模型 (2025)

    • 闭源通用

      • GPT-5 (OpenAI):多模态、深度推理、实时路由 53。

      • Claude-3.5-Sonnet (Anthropic):长文档理解 (200k tokens),低幻觉率 54。

    • 开源模型

      • Qwen2.5 (阿里巴巴):中文处理精度高,MoE架构 55。

      • Llama-Nemotron (英伟达+Qwen):推理效率优化 56。

      • 英伟达开源代码模型:代码生成与调试 57。

    • 专项任务

      • Stream-Omni (中科院):多模态实时交互 58。

      • ERNIE 4.0 (百度):中文知识增强,融合知识图谱 59。

8.8 总结与展望

  • 当前问题:缺乏知识表示、缺乏未知语言处理能力、缺乏解释性、单模态局限 60。

  • 未来方向:与神经科学结合、构建高质量资源、多模态信息融合 61。 这是根据您提供的《大模型技术》(2025年10月27日)PPT内容整理的复习提纲,专为开卷考试快速检索设计。

大模型技术 复习提纲

1. 大模型简介

  • 1.1 定义与核心概念

    • 大模型 (Large Model):具有大规模参数和复杂计算结构的机器学习模型 (数十亿至数千亿参数)。

    • 别名:基础模型 (Foundation Model)。

    • 核心特性:通过训练海量数据学习复杂模式,实现智能的涌现 (Emergence),具备更强大泛化能力。

    • 大语言模型 (LLM):大模型在自然语言处理领域的应用。

  • 1.2 发展历程

    • Pre-GPT 时代:N-Gram, HMM, RNN, LSTM, CNN。

    • GPT/BERT 时代 (2018-2020):Transformer 架构的引入。

    • Scaling Law 时代 (2020-):DeepMind 提出大模型训练的缩放法则。

    • ChatGPT 时代 (2022-):标志性事件,推动 LLM 商业化。

2. 大模型的基本结构与特点

  • 2.1 基本结构 (以 LLM 为例)

    • 主要架构:Encoder-Decoder (如 T5/BART), Decoder-Only (如 GPT/Llama), Encoder-Only (如 BERT)。

    • 核心组件 (Transformer)

      • 多头自注意力机制 (Multi-Head Attention):并行处理,捕获长距离依赖。

      • 前馈网络 (Feed-Forward Networks):非线性变换。

      • 残差连接 (Residual Connections):解决梯度消失。

      • 层归一化 (Layer Normalization):加速训练。

  • 2.2 大模型的特点

    1. 大规模参数:实现复杂的特征表示和模式学习。

    2. 大规模数据:从海量数据中学习知识。

    3. 智能涌现:具备零样本/少样本学习 (Zero/Few-Shot Learning) 和推理能力。

    4. 通用性:适应广泛的下游任务。

    5. 可迁移性:预训练 + 微调/提示学习。

3. 大模型的应用场景

  • 自然语言处理 (NLP):文本生成 (诗歌/代码)、机器翻译、摘要、问答系统、情感分析。

  • 代码生成与开发:Copilot, Debugging, 代码审查。

  • 多模态:图像生成 (DALL-E)、语音识别、视频理解。

  • 具身智能 (Embodied AI):机器人控制、人机协作。

  • 科学研究:辅助药物发现、材料科学。

4. 大模型的训练

  • 4.1 预训练 (Pre-training)

    • 目标:在大规模数据上学习通用语言表示。

    • 任务

      • 掩码语言模型 (MLM):如 BERT,预测被遮盖的单词。

      • 因果语言模型 (CLM):如 GPT,预测下一个词。

      • 去噪自编码 (Denoising Autoencoding):如 T5,重建损坏文本。

  • 4.2 后续优化 (对齐)

    • 指令微调 (Instruction Tuning):使模型理解并遵循人类指令。

    • 人类反馈强化学习 (RLHF)

      1. 收集人类偏好数据。

      2. 训练奖励模型 (Reward Model, RM)。

      3. 使用 PPO 等算法优化 LLM,使其输出与 RM 奖励一致。

5. 大模型的优化方法

  • 5.1 推理优化

    • 硬件加速:使用 A100/H100/昇腾等芯片。

    • 模型剪枝 (Pruning):去除不重要的连接。

    • 知识蒸馏 (Knowledge Distillation):用大模型指导小模型训练。

    • 量化 (Quantization):降低浮点精度 (如 FP16 $\rightarrow$ Int8/Int4) 以减少计算和内存。

  • 5.2 高效微调 (PEFT)

    • 全参数微调 (Full Fine-Tuning):计算开销大。

    • 参数高效微调 (PEFT):只训练少数参数。

      • LoRA (Low-Rank Adaptation):在原始权重旁插入低秩矩阵 $A, B$,仅训练 $A, B$。

      • P-Tuning/Prompt Tuning:只训练 Soft Prompt Tokens。

  • 5.3 Agent 增强

    • ReAct:Reasoning (推理) + Action (行动) 框架,使 LLM 能规划和使用工具。

    • MoE (Mixture of Experts):混合专家模型,并行激活稀疏专家,提高参数效率。

6. 大模型的常见问题和挑战

  • 6.1 准确性问题

    • 事实性错误 (Hallucination):模型生成与事实不符的内容(“一本正经地胡说八道”)。

    • 知识盲区:对最新信息或特定领域知识缺乏了解。

  • 6.2 可靠性问题 (安全与伦理)

    • 安全风险:训练数据合规性、数据偏见、对抗性攻击。

    • 安全伦理:政治敏感、犯罪违法、歧视/偏见、仇恨言论等风险对话场景。

  • 6.3 成本与效率

    • 高昂的训练成本:需要大量计算资源和时间。

    • 部署成本:推理耗时和内存占用大。

7. 未来发展方向和趋势

  • 更大规模的模型:参数级别持续增长,如超大规模模型。

  • 更高效的训练方法:研究更智能的参数初始化、优化算法等。

  • 融合多模态信息:结合文本、图像、语音的多模态模型将是重点。

  • Agent 智能体的突破:具备高级推理、多步规划和工具调用能力的自主智能体。

  • 可信赖 AI:解决可解释性 (XAI)、可验证性、公平性等问题。 这是根据您提供的《AGI发展新范式-多智能体Manus技术解析》(2025年秋季)PPT内容整理的复习提纲,专为开卷考试快速检索设计。

AGI发展新范式-多智能体Manus技术解析 复习提纲

1. 简要概述

  • 1.1 Manus 的诞生与定位

    • 发布时间:2025年3月6日(中国AI团队 Monica)。

    • 核心哲学“Mens et Manus”(手脑并用)——实现从“思考者”到“执行者”的质变。

    • 定位:全球首款通用 Agent 产品(通用智能体),具备自主决策与多场景适应能力。

  • 1.2 主要功能

    1. 智能决策中枢:通过强化学习和多模态感知实现自主决策,适用于动态复杂场景。

    2. 多模态交互:支持语音、图像、文本,实现无障碍沟通。

    3. 跨领域适配:通过迁移学习和微调快速部署。

    4. 自主任务执行:结合知识图谱和工具调用,自动规划并执行复杂任务。

2. 工作原理

  • 2.1 基础架构 (4层结构)

    1. 感知层 (Perception Layer):多模态传感器/数据接入,完成环境感知和数据预处理。

    2. 认知层 (Cognition Layer)

      • 大语言模型 (LLM):推理与泛化能力。

      • 知识图谱 (KG):领域知识存储与检索。

      • 强化学习 (RL):决策与优化能力。

    3. 规划与执行层 (Planning & Execution Layer)

      • 任务分解:将复杂任务拆解为子任务。

      • 工具调用 (Tool Call):利用外部 API 或工具。

      • 多 Agent 协同:管理和协调子智能体。

    4. 环境层 (Environment Layer):实际操作环境(虚拟或现实)。

  • 2.2 工作机制

    • 决策链路:感知输入 $\rightarrow$ 认知推理 $\rightarrow$ 任务规划 $\rightarrow$ 执行反馈 $\rightarrow$ 自我修正。

3. 核心技术

  • 3.1 多 Agent 协同框架

    • 架构:由中央协调 Agent (Central Agent) 和多个功能性 Agent 构成。

    • Central Agent:负责任务分解、资源分配、冲突协调。

    • 功能 Agent:专注于特定任务,如数据分析 Agent、代码生成 Agent。

    • 通信协议:基于 FIPA ACL 标准,确保 Agent 间的可理解通信。

  • 3.2 深度强化学习

    • 算法:基于 PPO (Proximal Policy Optimization) 改进的在线学习框架。

    • 特点:结合人类反馈 (RLHF),加速模型在特定场景下的收敛速度。

  • 3.3 实时知识图谱融合

    • 功能:通过 Neo4j/JanusGraph 存储实时知识,解决大模型的事实性错误 (Hallucination) 和知识时效性问题。

4. 创新之处

  • 创新点

    1. 通用 Agent 架构:统一了 LLM、KG 和 RL 三种核心范式。

    2. 自适应工具调用:智能选择并组合工具链。

    3. 跨任务零样本迁移:快速适应新任务。

    4. 可解释性与可控性:任务规划过程透明化。

5. 应用场景

  • 智能办公:公文起草、会议记录、跨部门协作。

  • 金融服务:量化交易策略生成、智能投顾、风险评估。

  • 智能制造:生产流程优化、故障预测与诊断。

  • 低空经济:无人机群调度、复杂环境路径规划。

6. 当前缺陷与挑战

  • 缺陷/挑战

    • 算力与能耗矛盾:高精度感知和持续学习消耗大量算力。

    • 跨领域迁移挑战:缺乏通用的框架支持快速跨行业适配。

    • 实时决策延迟:在复杂场景中,决策生成速度仍需优化。

7. 发展趋势

  • 未来方向

    1. AGI 市场规模:预计到2030年全球市场规模将达4710亿美元。

    2. Agent 协作深化:向更复杂、更去中心化的 Agent 协作网络发展。

    3. 多模态升级:实现图像、语音、视频的深度理解与生成。

    4. 合规与安全:加强数据隐私保护和伦理对齐,确保可信赖。

This post is licensed under CC BY 4.0 by the author.