3D可视化展示GPT模型的工作方式
@BrendanBycroft 创建了一个网页来可视化大语言模型(LLM),类似ChatGPT 背后的那种Transformer模型的内部结构和运作方式。
这个网页以3D形式呈现,展示了像GPT这样的大语言模型在运行单个令牌推理的所有步骤及其工作原理。
Brendan Bycroft制作的这个项目可以用来展示不同大小的人工智能模型,比如GPT-2这种相对较小的模型。
但是因为更大的模型(比如GPT-3)需要处理和存储非常多的数据,所以这个项目没有包含这些大模型的全部数据。
🚪传送门:https://t.co/gj2tXMjDVk
左键拖动,右键旋转,滚动缩放。并将鼠标悬停在张量单元上。
蓝色单元格是权重/参数,绿色单元格是中间值。
每个单元格都是一个数字!
🔧而且他还开源了这个项目
GitHub:https://t.co/TFSZyGnFFW
这个项目还有个CPU模拟(CPU Simulation)展示。
它提供了一个2D环境,你可以在其中编辑和模拟CPU(中央处理单元)的工作原理。
你可以在这个编辑器中创建和修改数字电路,这些电路模拟了真实CPU的工作方式。