使用空模型实例调用辅助函数,确定在量化过程中哪些层会被跳过(43)
在Facebook的OPT-350M中,模型的头部(lm_head)与解码器的嵌入标记层(decoder.embed_tokens)共享其权重。
print(model.model.decoder.embed_tokens)
print(model.lm_head)
输出结果
Embedding(50272, 512
在Facebook的OPT-350M中,模型的头部(lm_head)与解码器的嵌入标记层(decoder.embed_tokens)共享其权重。
print(model.model.decoder.embed_tokens)
print(model.lm_head)
输出结果
Embedding(50272, 512