🎆
首页
🗂️
归类
🏷️
标签
🗓️
归档
🦄
生活
🔍
搜索
文章分类
共 20 个分类 · 68 篇文章
双栏
Jupyter
3
2024-01-01
视觉模型————AlexNet原理以及代码
2024-01-01
视觉模型————LeNet原理以及代码
2024-01-01
视觉模型————GoogleNet原理以及代码
机器学习
5
2024-01-06
机器学习基础原理————数据预处理原理及代码
2024-01-05
机器学习基础原理————集成学习算法
2024-01-04
机器学习基础原理————可解释性Shap Value原理及代码
2024-01-03
机器学习基础原理————可解释性LIME原理
2024-01-02
机器学习基础原理————贝叶斯优化原理及代码实现
深度学习基础理论
12
2026-02-20
模型训练分析-1:Loss以及Grad Norm分析
2025-08-15
常见的各类LLM基座模型(GPT、DeepSeek、Qwen等)模型解析以及对比
2025-06-05
深度学习学习率优化方法——pytorch中各类warm up策略
2025-05-28
多模态算法Clip、Albef、Blip等算法原理
2025-02-23
从梯度消失到模型过拟合:归一化、Dropout 和梯度裁剪的深度解析
2025-02-12
深度学习中常见的LLM微调技术及其代码
2025-02-03
LLM中常用的位置编码原理及其代码
2025-01-27
深度学习混合专家模型(MoE)/KV-cache原理及其代码
2025-01-06
深度学习Word Embedding原理及其代码
2025-01-04
深度学习中各类学习率优化方法(AdaGrad/RMSprop/Adam/Warm-UP)原理及其代码
2025-01-01
通过单/半/混合精度加速训练以及显存优化(gradient-checkpoint)操作
2025-01-01
深度学习基础理论————常见评价指标以及Loss Function
Backbone
4
2025-06-28
CV中常用Backbone-4:目标检查算法原理以及代码操作
2025-05-18
CV中常用Backbone-3:Clip/SAM原理以及代码操作
2025-04-30
CV中常用Backbone-2:ConvNeXt模型详解
2025-01-18
CV中常用Backbone(Resnet/Unet/Vit系列/多模态系列等)以及代码
Attention优化
1
2025-02-17
深入探讨Attention变种与内存优化:从MHA到Flash/Page Attention
paper
7
2026-03-21
残差连接————Kimi注意力残差/字节混合注意力
2025-04-28
Qwen多模态系列论文
2025-04-19
多视觉编码器协同与高低分辨率特征融合技术综述
2025-03-10
数据蒸馏(Data Distillation)操作原理
2025-03-04
Kimi论文——Muon优化器原理/torch优化器
2025-02-21
Kimi/DeepSeek最新论文MoBA与NSA阅读
2025-02-19
Docunmen AI 中图像高分辨率处理思路汇总
DeepSpeed框架
1
2025-02-24
DeepSpeed基本原理
LLM应用
1
2025-02-27
LLM 生成策略全解析-1:llm模型输出控制
编程
1
2025-03-22
Python进阶知识:多进程/多线程/装饰器
OpenRLHF框架解读
2
2025-04-24
强化学习框架:OpenRLHF源码解读,模型训练-1
2025-04-22
强化学习框架:OpenRLHF源码解读,模型处理
生成模型
11
2026-02-23
深入浅出了解生成模型-11:Flow Matching基本原理
2026-02-15
深入浅出了解生成模型-10:模型蒸馏与剪枝
2026-01-28
深入浅出了解生成模型-9:扩散模型微调框架ai-toolkit介绍
2025-12-29
深入浅出了解生成模型-8:生成加速策略概述
2025-07-06
深入浅出了解生成模型-7:调度器(scheduler)原理
2025-07-06
深入浅出了解生成模型-6:常用图像生成基座模型与 Adapters等解析
2025-06-25
深入浅出了解生成模型-5:diffuser/accelerate库学习及其数据合成
2025-06-17
深入浅出了解生成模型-4:一致性模型(consistency model)
2025-05-19
深入浅出了解生成模型-3:Diffusion模型原理以及代码
2025-05-11
深入浅出了解生成模型-2:VAE模型原理以及代码实战
2025-05-08
深入浅出了解生成模型-1:GAN模型原理以及代码实战
图像消除
3
2025-07-25
图像消除论文-2:RORem、ObjectClear
2025-06-26
图像消除论文-2:SmartEraser、Erase Diffusion、OmniEraser
2025-06-11
图像消除论文-1:PixelHacker、PowerPanint、Attentive Eraser
多模态
4
2026-03-09
开源模型技术总结-3————FireRed(小红书)开源模型
2025-08-29
多模态模型——QwenVL2.5的微调以及强化学习代码操作
2025-08-28
开源模型技术总结-1————Qwen系列模型
2025-08-28
开源模型技术总结-2————DeepSeek系列模型
量化部署
1
2025-10-11
模型量化操作————GPTQ和AWQ量化
life
1
2025-12-01
从南京到北京
AIGC工具使用
1
2025-12-12
Stable Diffusion WebUI和Comfui基础使用
推理部署框架vllm
3
2026-03-15
模型推理框架vllm-3——KVCache管理器
2026-03-15
模型推理框架vllm-2——生成以及调度过程
2025-12-27
模型推理框架vllm-1——整体框架及使用
强化学习
3
2026-03-26
强化学习算法-3:GSPO、SAPO及KL散度改进
2026-03-01
强化学习算法-2:熵坍缩以及奖励坍缩问题机制分析及解决措施
2026-02-26
强化学习算法-1:GRPO、DPO与PPO解析
pytorch
3
2026-04-20
🔥Pytorch使用-3:常见的分布式训练及其实现
2026-04-10
🔥Pytorch使用-1:Pytorch计算图等概念
2026-03-31
🔥Pytorch使用-2:dataloader处理过程及模型训练性能分析
agent
1
2026-05-17
Claude Code安装使用及Agent相关架构问题分析