概述
AI,中文名叫 人工智能 ,是让机器模拟、延伸甚至超越人类的感知、推理、学习、创造、决策等智能行为的技术与学科。
AI概念
AI概念图谱
plaintext
人工智能(AI)【总领域,所有相关概念均从属于此】
├── 机器学习(ML)【AI核心方法】
│ └── 深度学习(DL)【技术底座,所有大模型的底层支撑】
│ └── 大模型(Large Model)【AI核心引擎,总称】
│ ├── 大语言模型(LLM)→ 专注语言理解、对话生成(例:字节跳动自研大模型,支撑豆包应用)
│ ├── 多模态AI(Multimodal AI)→ 处理文+图+音+视频(例:文生图、图生视频)
│ ├── 视觉大模型(Visual Large Model)→ 专注图像/视频处理(例:人脸识别)
│ ├── 语音大模型(Speech Large Model)→ 专注语音交互(例:智能音箱)
│ └── 行业大模型(Industry Large Model)→ 行业定制(例:医疗、金融大模型)
├── 【大模型的核心能力/技术(非大模型本身,AI领域延伸)】
│ ├── 语言交互:NLP(语言理解)、ASR(语音转文字)、TTS(文字转语音)、文本生成
│ ├── 视觉处理:CV(看懂图文)、OCR(图像转文字)、目标检测、图像生成
│ └── 生成创作:AIGC(自主生成文图音视频,适配所有大模型)
├── 【大模型优化技术(服务大模型,非大模型本身,AI领域延伸)】
│ ├── RAG(检索增强生成)→ 提升回答准确性
│ ├── Fine-tuning(微调)→ 适配特定行业
│ ├── Prompt Engineering(提示工程)→ 优化指令输出
│ └── Model Compression(模型压缩)→ 适配手机等设备
└── 【应用落地&未来探索(基于大模型,非大模型本身,AI领域延伸)】
├── 应用落地:AI Agent(自主完成任务)、RL(强化决策)、知识图谱(辅助逻辑)
└── 未来探索:AGI(人类水平AI,未实现)、ASI(超人类智能,仅理论)一、基础类(AI技术底座)
核心:所有AI技术的底层支撑,无大模型
| 中文名称 | 专业术语 | 专业解释 | 小白举例 |
|---|---|---|---|
| 人工智能 | AI | 机器模拟人类智能的技术总称 | AI聊天、刷脸 |
| 机器学习 | ML | AI核心,机器从数据中自动学规律 | APP推送喜欢的视频 |
| 深度学习 | DL | ML分支,大模型的核心底层技术 | 手机美颜、语音转文字底座 |
二、大模型类(AI核心引擎)
核心:AI的“大脑”,均为大模型,基于深度学习构建
| 中文名称 | 专业术语 | 专业解释 | 常用能力/技术 | 小白举例 |
|---|---|---|---|---|
| 大模型(总称) | Large Model | 超大规模AI模型的统称 | 适配各类AI技术,可优化 | LLM、多模态AI等均属于此类 |
| 大语言模型 | LLM (Large Language Model) | 主流,专注语言理解、对话生成 | NLP、文本生成、提示工程、RAG | 豆包、ChatGPT |
| 多模态AI | Multimodal AI | 主流,可处理文+图+音+视频 | NLP、CV、ASR、TTS、图像生成 | 发图让AI描述、文生视频 |
| 视觉大模型 | Visual Large Model | 专注图像、视频处理 | CV、OCR、目标检测、图像生成 | 人脸识别、医疗影像分析 |
| 语音大模型 | Speech Large Model | 专注语音识别、合成、交互 | ASR、TTS、NLP(语音理解) | 智能音箱、实时语音翻译 |
| 行业大模型 | Industry Large Model | 适配特定行业的定制化大模型 | 微调、RAG、行业知识图谱 | 医疗、金融、教育大模型 |
未来迭代方向:多模态融合、自主进化、低功耗轻量化(适配穿戴设备的微型大模型)
三、大模型的能力&技术类(大模型的“技能”)
核心:大模型不同场景的专属能力,非大模型本身
1. 语言交互
| 中文名称 | 专业术语 | 专业解释 | 适配大模型类型 |
|---|---|---|---|
| 自然语言处理 | NLP | 大模型理解、处理人类语言 | LLM、多模态AI、语音大模型 |
| 语音识别 | ASR | 语音转文字 | 多模态AI、语音大模型 |
| 语音合成 | TTS | 文字转自然语音 | 多模态AI、语音大模型、LLM |
| 文本生成 | Text Generation | 按指令生成文本 | LLM、多模态AI、行业大模型 |
2. 视觉处理
| 中文名称 | 专业术语 | 专业解释 | 适配大模型类型 |
|---|---|---|---|
| 计算机视觉 | CV | 大模型“看懂”图像、视频 | 多模态AI、视觉大模型、行业大模型 |
| 光学字符识别 | OCR | 图像文字转可编辑文字 | 多模态AI、视觉大模型 |
| 目标检测 | Object Detection | 识别目标位置和类别 | 多模态AI、视觉大模型、行业大模型 |
| 图像生成 | Image Generation | 生成全新图像(AIGC分支) | 多模态AI、视觉大模型、行业大模型 |
3. 生成创作
| 中文名称 | 专业术语 | 专业解释 | 适配大模型类型 |
|---|---|---|---|
| 生成式AI | AIGC | 大模型自主生成各类新内容 | 所有大模型 |
四、模型优化类(服务大模型)
核心:让大模型更精准、更实用、更易部署,非大模型本身
| 中文名称 | 专业术语 | 专业解释 | 适配大模型类型 |
|---|---|---|---|
| 检索增强生成 | RAG | 先查资料再回答,提升准确性 | 所有大模型(重点LLM、行业大模型) |
| 微调 | Fine-tuning | 专属数据训练,适配行业 | 所有大模型(重点行业大模型) |
| 提示工程 | Prompt Engineering | 优化指令,输出更精准 | 所有大模型(重点LLM、多模态AI) |
| 模型压缩 | Model Compression | 缩小体积,适配手机等设备 | 所有大模型(重点语音、轻量化模型) |
五、应用落地&未来探索类
核心:基于大模型及底层技术实现,落地是应用,探索是方向,均非大模型
| 中文名称 | 专业术语 | 专业解释+与大模型关系 | 小白举例 |
|---|---|---|---|
| AI智能体 | AI Agent | 自主完成复杂任务;大模型的应用载体,整合各类能力 | 自动整理邮件、安排日程 |
| 强化学习 | RL | 机器试错优化;支撑大模型迭代,提升决策能力 | AI下棋、自动驾驶 |
| 知识图谱 | Knowledge Graph | 结构化呈现知识;辅助大模型理解逻辑,配合RAG使用 | 百度百科关联词条 |
| 通用人工智能 | AGI | 人类水平AI(未实现);大模型的终极目标 | 仅在研究中 |
| 超级人工智能 | ASI | 远超人类智能(理论);AGI之后的终极形态 | 仅存在于科幻电影 |
AI 在编程中的应用
略,以后再增加
