Link CardFavicon

部分代码说明

文件名称实现功能文件地址
MHA多头注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T)🔗
GQA分组注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T)🔗
MQA多查询注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T)🔗
SWA滑动窗口注意力模块,支持 flash_attn,输入数据格式为:x:(B,T,C),atten_mask:(B,T)🔗
MoBAKimi MoBA论文稀疏注意力计算,输入数据格式为:x:(B,T,C),atten_mask:(B,T)🔗
PosEncoding位置编码,RotaryPositionalEncoding,AbsolutePositionEmbedding,LearnedPositionEmbedding。输入:x:(B,T,C)🔗
Norm归一化操作,LayerNorm,BatchNorm,RMSNorm,InstanceNorm,GlobalResponseNorm。输入:(B,T,C) 或者 (B,C,H,W)🔗
ResNet视觉编码器,ResNet50, ResNet101, ResNet152系列🔗
ConvNeXt视觉编码器,ConvNeXt v1系列🔗
Vit视觉编码器,Vit🔗
SwinTransformer视觉编码器,SwinTransformer🔗