BEN2 背景擦除模型详解 引言 想象一下,你是一位专业的摄影师,需要将拍摄的人物照片进行背景替换。传统的抠图工具可能会说:"这个边缘处理得不够精细,头发丝都模糊了。"但你作为专业摄影师会说:"我需要一个能够精确处理每一根发丝、每一个细节的工具。" BEN2 (Background Erase Ne
DJL 与引擎无关的深度学习 Java 框架 引言 想象一下,你要在 Java 项目中集成深度学习模型: 方法1:为每个框架(PyTorch、TensorFlow、MXNet)分别写代码,维护多套代码(工作量大、维护困难) 方法2:使用统一的 API,一套代码支持所有框架,轻松切换和部署 DJL(D
ONNX Runtime 跨平台模型推理引擎 引言 想象一下,你要在不同平台上部署机器学习模型: 方法1:为每个平台(Python、Java、C#、移动端)分别实现模型(工作量大、维护困难) 方法2:使用统一的格式和运行时,一次训练,到处运行 ONNX Runtime 就像方法2——它是一个跨平台的
DreamSim 模型:学习人类视觉相似性的新维度 引言 想象一下,你是一位专业的艺术品鉴定师,需要判断两幅画作的相似程度。传统的计算机可能会说:"这两幅画的像素值差异很大,所以它们完全不同。"但你作为人类专家会说:"虽然像素不同,但它们在风格、主题和情感表达上非常相似。" DreamSim 就是这
ICT&HP提升高质量图像生成的奖励模型 概述 在高质量图像生成领域,现有的奖励模型存在一个关键问题:它们会不恰当地给具有丰富细节和高美学价值的图像分配低分,这与人类实际的美学偏好存在显著差异。为了解决这一问题,ICTHP 项目提出了一个双组件框架,通过两个互补的奖励模型来全面评估生成图像的质量:
通过 HF-Mirror 镜像访问 Hugging Face 引言 对于国内 AI 开发者来说,访问 Hugging Face 下载模型和数据集时经常会遇到网络不稳定、下载速度慢甚至无法访问的问题。HF-Mirror 是一个公益项目,专门为国内开发者提供稳定、快速的 Hugging Face 镜像服
ImageReward 文本到图像生成中的人类偏好预测 ImageReward是第一个通用的文本到图像人类偏好RM,它总共经过137k对专家比较的训练,在理解文本到图像合成中的人类偏好方面优于现有的文本图像评分方法,如CLIP(38.6%)、Aesthetic(39.6%)和BLIP(31.6%)。
机器学习算法常见距离计算 引言 想象一下,你要判断一个新来的同学和谁最相似: 方法1:看直线距离有多远(欧式距离) 方法2:看需要走多少条街才能到达(曼哈顿距离) 方法3:看最远的那一维差距有多大(切比雪夫距离) 方法4:根据情况灵活选择距离计算方式(闵可夫斯基距离) 在 KNN(K-Nearest
交叉验证与网格搜索详解 引言 想象一下两种不同的考试方式: 传统方式:只用一套题训练,用同一套题测试,容易"死记硬背" 交叉验证:用多套题训练和测试,轮流使用,更真实地评估能力 想象一下两种不同的调参方式: 手动调参:一个一个试,费时费力,容易遗漏最优解 网格搜索:系统性地尝试所有组合,自动找到最优