程序员行莫

数据清理概述

数据清理是机器学习 (ML)流程中的重要步骤,因为它涉及识别和删除任何缺失、重复或不相关的数据。数据清理的目标是确保数据准确、一致且无错误,因为原始数据通常包含噪声、不完整和不一致,这可能会对模型的准确性及其从中得出的见解的可靠性产生负面影响。专业的数据科学家通常会在这一步骤上投入大量时间,因为他们

行莫 发布于 2025-06-26

机器学习生命周期

机器学习生命周期是一个以结构化方式指导机器学习模型开发和部署的过程。它包含多个步骤。每个步骤在确保机器学习模型的成功和有效性方面都起着至关重要的作用。遵循机器学习生命周期,我们可以解决复杂的问题,获得数据驱动的洞察力,并创建可扩展且可持续的模型。步骤如下: 问题定义 数据收集 数据清理和预处理 探索

行莫 发布于 2025-06-19

强化学习

强化学习 (Reinforcement Learning)是机器学习的一个分支,专注于研究代理如何通过反复试验来学习决策,从而最大化累积奖励。RL 允许机器通过与环境交互并根据其行为接收反馈来进行学习。这种反馈以奖励或惩罚的形式出现。

行莫 发布于 2025-06-19

半监督学习

当今的机器学习算法大致可分为三类:监督学习、无监督学习和强化学习。撇开强化学习不谈,机器学习问题主要分为两类:监督学习和无监督学习。两者之间的基本区别在于,监督学习数据集的每个元组都有一个关联的输出标签,而无监督学习数据集则没有。

行莫 发布于 2025-06-19

无监督学习

无监督学习是机器学习的一个分支,用于处理未标记的数据。与监督学习(数据被标记为特定类别或结果)不同,无监督学习算法的任务是在不了解数据含义的情况下,从数据中发现模式和关系。无监督机器学习算法无需任何人工干预(即,我们不向模型提供输出)即可发现隐藏的模式和数据。训练模型仅输入参数值,并自行发现组或模式

行莫 发布于 2025-06-19

监督式机器学习

监督式机器学习是机器学习和人工智能的一种基本方法。它使用标记数据训练模型,每个输入都有相应的正确输出。这个过程就像老师指导学生一样——因此被称为“监督式”学习。在本文中,我们将探讨监督式学习的关键组成部分、所使用的不同类型的监督式机器学习算法,以及一些实际案例。

行莫 发布于 2025-06-19

4.多变量线性回归(Linear Regression with Multiple Variables)

4.1 多维特征 参考视频: 4 - 1 - Multiple Features (8 min).mkv 目前为止,我们探讨了单变量/特征的回归模型,现在我们对房价模型增加更多的特征,例如房间数楼层等,构成一个含有多个变量的模型,模型中的特征为$\left( {x_{1}},{x_{2}},...,

行莫 发布于 2025-06-13

3.线性代数回顾(Linear Algebra Review)

3.1 矩阵和向量 参考视频: 3 - 1 - Matrices and Vectors (9 min).mkv 如图:这个是4×2矩阵,即4行2列,如$m$为行,$n$为列,那么$m×n$即4×2 矩阵的维数即行数×列数 矩阵元素(矩阵项):$A=\left[ \begin{matrix} 140

行莫 发布于 2025-06-12

AI 智能体项目整理

不太好给这些项目一个统一的归类或定义毕竟都还在发展阶段目前只能抽象的成为智能体项目,都是集成了 AI 的能力去完成特定目标。 n8n 官网:https://n8n.io/ dify 官网:https://dify.ai/ coze 官网:https://www.coze.cn/

行莫 发布于 2025-06-11

2.单变量线性回归(Linear Regression with One Variable)

2.1 模型表示 参考视频: 2 - 1 - Model Representation (8 min).mkv 我们的第一个学习算法是线性回归算法。在这段视频中,你会看到这个算法的概况,更重要的是你将会了解监督学习过程完整的流程。 让我们通过一个例子来开始:这个例子是预测住房价格的,我们要使用一个数

行莫 发布于 2025-06-11