2025

深入浅出了解生成模型-2:VAE模型原理以及代码实战

本文详细介绍变分自编码器(VAE)的基本原理、数学框架及代码实战,并对比自编码器(AE)与VAE的差异。AE作为无监督学习模型,通过编码-解码学习数据特征表示,但因潜在空间缺乏明确结构不适合生成任务;而VAE结合概率模型与深度学习,将输入映射为概率分布(如高斯分布),通过变...

2025-05-11生成模型生成模型VAE

深入浅出了解生成模型-1:GAN模型原理以及代码实战

本文主要介绍生成对抗网络(GAN)作为图像生成基础模型的核心原理、数学推导及训练过程。GAN由生成模型G和判别模型D构成,二者形成零和博弈:生成器通过映射随机噪声生成图像以拟合真实数据分布,判别器则判断样本来自真实数据还是生成模型。其训练目标是最小化JS散度以缩小生成分布与...

2025-05-08生成模型生成模型GANWGANWGAN_GP

Qwen多模态系列论文

Qwen-vl系列模型包括Qwen2-vl与Qwen2.5-vl,在多模态处理领域持续优化。Qwen2-vl核心改进为动态分辨率技术,输入图像无需固定尺寸,通过2x2相邻visual-token拼接后经MLP处理减少token数量,并采用多模态旋转位置编码(M-RoPE),...

2025-04-28paperQwen-vl多模态ropeattention

多视觉编码器协同与高低分辨率特征融合技术综述

本文主要介绍多模态中多视觉编码器的特征融合方法及高低分辨率图像信息融合策略。针对多视觉编码器处理同一张图像的特征融合,常见策略包括纵向拼接、横向拼接、融合拼接及注意力拼接,相关研究如LEO模型采用动态分辨率划分图像块,通过Intern-Vit和SAM-L编码器处理后,使用S...

2025-04-19paper多模态paper

Python进阶知识:多进程/多线程/装饰器

本文详细解释了Python中多进程、多线程、装饰器的核心概念、应用场景及使用方法。多进程拥有独立内存空间,适用于CPU密集型任务;多线程共享内存资源,适合I/O密集型任务;装饰器则能在不修改原函数代码的情况下添加额外功能,常用@语法实现。文章还介绍了全局解释器锁(GIL)的...

2025-03-22编程python多进程多线程装饰器

数据蒸馏(Data Distillation)操作原理

数据蒸馏(DD)是一种从大量数据中提取关键信息,生成小规模高质量合成数据集的技术,旨在替代原始数据集用于模型训练、验证等任务,以提高效率、降低成本或保护隐私,其核心是保留原始数据的关键特征与分布信息并去除冗余噪声。数据蒸馏的目标是优化合成数据集与原始数据集的差异,使合成数据...

2025-03-10paper深度学习基础理论cv数据蒸馏