概述

AI，中文名叫 人工智能 ，是让机器模拟、延伸甚至超越人类的感知、推理、学习、创造、决策等智能行为的技术与学科。

AI概念

AI概念图谱

plaintext

人工智能（AI）【总领域，所有相关概念均从属于此】
├── 机器学习（ML）【AI核心方法】
│   └── 深度学习（DL）【技术底座，所有大模型的底层支撑】
│       └── 大模型（Large Model）【AI核心引擎，总称】
│           ├── 大语言模型（LLM）→ 专注语言理解、对话生成（例：字节跳动自研大模型，支撑豆包应用）
│           ├── 多模态AI（Multimodal AI）→ 处理文+图+音+视频（例：文生图、图生视频）
│           ├── 视觉大模型（Visual Large Model）→ 专注图像/视频处理（例：人脸识别）
│           ├── 语音大模型（Speech Large Model）→ 专注语音交互（例：智能音箱）
│           └── 行业大模型（Industry Large Model）→ 行业定制（例：医疗、金融大模型）
├── 【大模型的核心能力/技术（非大模型本身，AI领域延伸）】
│   ├── 语言交互：NLP（语言理解）、ASR（语音转文字）、TTS（文字转语音）、文本生成
│   ├── 视觉处理：CV（看懂图文）、OCR（图像转文字）、目标检测、图像生成
│   └── 生成创作：AIGC（自主生成文图音视频，适配所有大模型）
├── 【大模型优化技术（服务大模型，非大模型本身，AI领域延伸）】
│   ├── RAG（检索增强生成）→ 提升回答准确性
│   ├── Fine-tuning（微调）→ 适配特定行业
│   ├── Prompt Engineering（提示工程）→ 优化指令输出
│   └── Model Compression（模型压缩）→ 适配手机等设备
└── 【应用落地&未来探索（基于大模型，非大模型本身，AI领域延伸）】
    ├── 应用落地：AI Agent（自主完成任务）、RL（强化决策）、知识图谱（辅助逻辑）
    └── 未来探索：AGI（人类水平AI，未实现）、ASI（超人类智能，仅理论）

一、基础类（AI技术底座）

核心：所有AI技术的底层支撑，无大模型

中文名称	专业术语	专业解释	小白举例
人工智能	AI	机器模拟人类智能的技术总称	AI聊天、刷脸
机器学习	ML	AI核心，机器从数据中自动学规律	APP推送喜欢的视频
深度学习	DL	ML分支，大模型的核心底层技术	手机美颜、语音转文字底座

二、大模型类（AI核心引擎）

核心：AI的“大脑”，均为大模型，基于深度学习构建

中文名称	专业术语	专业解释	常用能力/技术	小白举例
大模型（总称）	Large Model	超大规模AI模型的统称	适配各类AI技术，可优化	LLM、多模态AI等均属于此类
大语言模型	LLM （Large Language Model）	主流，专注语言理解、对话生成	NLP、文本生成、提示工程、RAG	豆包、ChatGPT
多模态AI	Multimodal AI	主流，可处理文+图+音+视频	NLP、CV、ASR、TTS、图像生成	发图让AI描述、文生视频
视觉大模型	Visual Large Model	专注图像、视频处理	CV、OCR、目标检测、图像生成	人脸识别、医疗影像分析
语音大模型	Speech Large Model	专注语音识别、合成、交互	ASR、TTS、NLP（语音理解）	智能音箱、实时语音翻译
行业大模型	Industry Large Model	适配特定行业的定制化大模型	微调、RAG、行业知识图谱	医疗、金融、教育大模型

未来迭代方向：多模态融合、自主进化、低功耗轻量化（适配穿戴设备的微型大模型）

三、大模型的能力&技术类（大模型的“技能”）

核心：大模型不同场景的专属能力，非大模型本身

1. 语言交互

中文名称	专业术语	专业解释	适配大模型类型
自然语言处理	NLP	大模型理解、处理人类语言	LLM、多模态AI、语音大模型
语音识别	ASR	语音转文字	多模态AI、语音大模型
语音合成	TTS	文字转自然语音	多模态AI、语音大模型、LLM
文本生成	Text Generation	按指令生成文本	LLM、多模态AI、行业大模型

2. 视觉处理

中文名称	专业术语	专业解释	适配大模型类型
计算机视觉	CV	大模型“看懂”图像、视频	多模态AI、视觉大模型、行业大模型
光学字符识别	OCR	图像文字转可编辑文字	多模态AI、视觉大模型
目标检测	Object Detection	识别目标位置和类别	多模态AI、视觉大模型、行业大模型
图像生成	Image Generation	生成全新图像（AIGC分支）	多模态AI、视觉大模型、行业大模型

3. 生成创作

中文名称	专业术语	专业解释	适配大模型类型
生成式AI	AIGC	大模型自主生成各类新内容	所有大模型

四、模型优化类（服务大模型）

核心：让大模型更精准、更实用、更易部署，非大模型本身

中文名称	专业术语	专业解释	适配大模型类型
检索增强生成	RAG	先查资料再回答，提升准确性	所有大模型（重点LLM、行业大模型）
微调	Fine-tuning	专属数据训练，适配行业	所有大模型（重点行业大模型）
提示工程	Prompt Engineering	优化指令，输出更精准	所有大模型（重点LLM、多模态AI）
模型压缩	Model Compression	缩小体积，适配手机等设备	所有大模型（重点语音、轻量化模型）

五、应用落地&未来探索类

核心：基于大模型及底层技术实现，落地是应用，探索是方向，均非大模型

中文名称	专业术语	专业解释+与大模型关系	小白举例
AI智能体	AI Agent	自主完成复杂任务；大模型的应用载体，整合各类能力	自动整理邮件、安排日程
强化学习	RL	机器试错优化；支撑大模型迭代，提升决策能力	AI下棋、自动驾驶
知识图谱	Knowledge Graph	结构化呈现知识；辅助大模型理解逻辑，配合RAG使用	百度百科关联词条
通用人工智能	AGI	人类水平AI（未实现）；大模型的终极目标	仅在研究中
超级人工智能	ASI	远超人类智能（理论）；AGI之后的终极形态	仅存在于科幻电影

AI 在编程中的应用

略，以后再增加

概述 ​

AI概念 ​

一、基础类（AI技术底座） ​

二、大模型类（AI核心引擎） ​

三、大模型的能力&技术类（大模型的“技能”） ​

1. 语言交互 ​

2. 视觉处理 ​

3. 生成创作 ​

四、模型优化类（服务大模型） ​

五、应用落地&未来探索类 ​

AI 在编程中的应用 ​

概述