本文是 Andrej Karpathy 视频《Deep Dive into LLMs》的结构化笔记,从预训练、分词、训练与推理,到后训练(SFT、RLHF、DeepSeek-R1 等)系统梳理现代 LLM 训练管线,并讨论“LLM 心理学”、幻觉、工具使用和未来趋势。
本文是 Andrej Karpathy 视频《Deep Dive into LLMs》的结构化笔记,从预训练、分词、训练与推理,到后训练(SFT、RLHF、DeepSeek-R1 等)系统梳理现代 LLM 训练管线,并讨论“LLM 心理学”、幻觉、工具使用和未来趋势。