BERT只是一个文本扩散步骤AndrejKarpathy提到的一篇文章:

蚁工厂 2025-10-21 09:17:05

BERT 只是一个文本扩散步骤

Andrej Karpathy提到的一篇文章: nathan.rs/posts/roberta-diffusion/

文中认为,像 BERT 这样经典的编码器模型(Encoder-only models)可以被看作是一种特殊的、只执行一步的文本扩散模型。通过对训练方式进行微调,可以将其转变为一个能够生成文本的完整生成模型。 ​​​

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注