部分代码说明
| 文件名称 | 实现功能 | 文件地址 |
|---|---|---|
MHA | 多头注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T) | 🔗 |
GQA | 分组注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T) | 🔗 |
MQA | 多查询注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T) | 🔗 |
SWA | 滑动窗口注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T) | 🔗 |
MoBA | Kimi MoBA论文稀疏注意力计算,输入数据格式为:x:(B,T,C),atten_mask:(B,T) | 🔗 |
PosEncoding | 位置编码,RotaryPositionalEncoding,AbsolutePositionEmbedding,LearnedPositionEmbedding。输入:x:(B,T,C) | 🔗 |
Norm | 归一化操作,LayerNorm,BatchNorm,RMSNorm,InstanceNorm,GlobalResponseNorm。输入:(B,T,C) 或者 (B,C,H,W) | 🔗 |
ResNet | 视觉编码器,ResNet50, ResNet101, ResNet152系列 | 🔗 |
ConvNeXt | 视觉编码器,ConvNeXt v1系列 | 🔗 |
Vit | 视觉编码器,Vit | 🔗 |
SwinTransformer | 视觉编码器,SwinTransformer | 🔗 |