Transformer

理解自注意力、编码器/解码器与整体结构。

大模型基础:Transformer

理解自注意力、编码器/解码器与整体结构。

本页规划

  • 核心机制
  • 结构示意
  • 面试高频点