Code

Link Card

部分代码说明

文件名称	实现功能	文件地址
`MHA`	多头注意力模块,支持 `flash_attn`,输入数据格式为：`x:(B,T,C),atten_mask:(B,T)`	🔗
`GQA`	分组注意力模块,支持 `flash_attn`,输入数据格式为：`x:(B,T,C),atten_mask:(B,T)`	🔗
`MQA`	多查询注意力模块,支持 `flash_attn`,输入数据格式为：`x:(B,T,C),atten_mask:(B,T)`	🔗
`SWA`	滑动窗口注意力模块,支持 `flash_attn`,输入数据格式为：`x:(B,T,C),atten_mask:(B,T)`	🔗
`MoBA`	Kimi MoBA论文稀疏注意力计算,输入数据格式为：`x:(B,T,C),atten_mask:(B,T)`	🔗
`PosEncoding`	位置编码,`RotaryPositionalEncoding`,`AbsolutePositionEmbedding`,`LearnedPositionEmbedding`。输入：`x:(B,T,C)`	🔗
`Norm`	归一化操作,`LayerNorm`,`BatchNorm`,`RMSNorm`,`InstanceNorm`,`GlobalResponseNorm`。输入：`(B,T,C)` 或者 `(B,C,H,W)`	🔗
`ResNet`	视觉编码器,`ResNet50`, `ResNet101`, `ResNet152`系列	🔗
`ConvNeXt`	视觉编码器,`ConvNeXt v1`系列	🔗
`Vit`	视觉编码器,`Vit`	🔗
`SwinTransformer`	视觉编码器,`SwinTransformer`	🔗