LMCC-T 备考笔记

· · 科技·工程

本文总结自 LMCC 大纲,不包含成年组。

一、人工智能基础概念

1. 人工智能相关概念定义

核心知识点

关键分类:有监督学习 & 无监督学习

类型 定义 典型任务 示例
有监督学习 用标注好答案的数据训练(如图 1 是猫) 分类、回归 垃圾邮件识别(分类)、房价预测(回归)
无监督学习 用无标注数据自动发现规律 聚类、降维 用户分群(聚类)、高维词向量可视化(降维)

考核方式:概念

2. 机器学习流程及经典模型

核心流程

  1. 数据预处理:解决数据脏乱差问题,包括: ::::info[1) 数据清洗]{open} 删除异常值(如年龄 =200 岁)、填补缺失值(如用平均年龄补全)。 :::: ::::info[2) 数据变换]{open} 归一化(如将像素值 0 ~ 255 缩放到 0 ~ 1)、独热编码(如红 =[1,0,0])。 :::: ::::info[3) 数据工程]{open} 构造新特征(如从点击日志提取 7 天高频商品)。 ::::
  2. 模型训练:用处理后的数据调整参数;
  3. 验证与测试:用新数据评估模型性能(避免背答案);
  4. 经典模型:神经网络(深度学习的基础,由多层神经元组成)。

考核方式:概念

3. 验证及评测

核心指标

关键问题:过拟合

考核方式:概念

4. 人工智能常见应用领域

考核方式:概念

二、大模型基础概念

1. 自然语言的基础概念

考核方式:概念、简答题

2. 基本定义:大语言模型(LLM)

考核方式:概念、简答题

3. 发展历程与现状

四代语言模型

  1. 统计语言模型:基于概率统计(如 n-gram),无法理解语义;
  2. 神经网络语言模型:用 RNN 或 CNN 建模,处理短文本;
  3. 预训练语言模型:BERT 或 GPT-1,首次实现预训练+微调
  4. 大语言模型:GPT-2 及以后,参数超百亿,涌现复杂能力(如推理)。

关键里程碑

考核方式:概念、简答题

4. 扩展法则

核心法则对比

法则 核心思想 工程意义
KM 法则(2020 固定计算下,提升性能更依赖增大模型规模 早期大模型(如 GPT-3)侧重扩参数
Chinchilla 法则(2022 最优策略是参数与数据同步扩大(如参数翻倍,数据也翻倍) 用700亿参数 +1.4 万亿词,效果超 GPT-3(1750 亿参数 +3000 亿词)

考核方式:概念、计算题(如给定计算资源,分配参数与数据量)

5. 大模型代表能力(涌现能力)

考核方式:概念、案例分析、API 调用

三、模型架构

1. 注意力机制

核心原理:Query-Key-Value(QKV)

关键类型

考核方式:概念、计算(如简单 QKV 相似度计算)

2. 主流架构与任务适配

架构类型 特点 适配任务 示例模型
因果解码器 只能看当前词之前的内容(单向) 生成类(写文章、聊天) GPT 系列
编码器 能看整个序列(双向) 理解类(分类、问答) BERT 系列
编码器-解码器 双向理解+单向生成 转换类(翻译、摘要) T5 系列

考核方式:概念、架构对比分析

3. Transformer 模型的基本结构组成

核心组件

  1. 输入编码:将词转化为向量(词嵌入);
  2. 位置编码:解决 Transformer不懂词序的问题,如区分猫追狗狗追猫
    • 变体:绝对位置编码(固定标签)、相对位置编码(关注词间距)、旋转位置编码(RoPE,支持长文本);
  3. 多头自注意力:多个注意力头并行关注不同维度(如一个头关注语法,一个关注语义);
  4. 前馈网络(FFN):对每个词的向量单独处理,增强表达能力;
  5. 编码器或解码器:堆叠多层上述组件(如 GPT-3 有 96 层)。

考核方式:概念、公式、代码实现(基础理解)

四、预训练技术

1. 核心学习范式

自监督学习

监督学习 & 自监督学习

考核方式:概念、公式、简答

2. 预训练任务

考核方式:概念、公式、实现(基础)

3. 优化设置

批次数据训练

学习率

优化器

考核方式:概念、实现

4. 计算与资源估算

参数量计算

训练运算量(FLOPs)

考核方式:计算题

五、指令微调

1. 基础概念

考核方式:概念

2. 指令数据集构建

六、人类对齐

1. 背景与标准

考核方式:概念

2. 关键问题:幻觉

七、解码与部署

1. 解码方法

基础方法

随机采样策略

策略 原理 应用场景
温度采样 调节温度 TT→0 选高概率词,T>1 增加多样性 创意写作(T=1.2)、客服(T=0.7
Top-k 采样 从概率 Top-K 个词中随机选 排除低概率荒谬词(如儿童故事)
Top-p 采样 选累积概率达 p(如 0.9)的最小词集 平衡质量与多样性(GPT 默认 p=0.9

考核方式:概念、公式

2. 低资源部署

考核方式:概念、实现(基础)

八、提示学习

1. 提示工程基础

考核方式:概念、简答

2. 上下文学习(ICL)

考核方式:概念、实现(基础)

3. 思维链提示(CoT)

考核方式:概念、实现(基础)

九、复杂推理

1. 认知推理基础

考核方式:概念、实现(基础)

2. 基于搜索的推理

考核方式:概念、实现(基础)

十、智能体(Agent)

1. 基础组件

考核方式:概念、实现(基础)

2. 工具使用与多智能体

考核方式:概念、实现(基础)

十一、模型评测

1. 核心流程与指标

考核方式:概念、公式、实现(基础)

2. 公开评测集

考核方式:概念

十二、模型伦理与安全

1. 核心问题与解决

考核方式:概念、案例分析