在今天的版本中,作者将带领大家一块去了解线性回归。本博客的目的是通过使用python实现快速概述线性回归的基本原理,让我们一块深入其中。
什么是线性回归?
线性回归是一种监督学习算法,用于预测问题。
这是一种通过在独立变量和因变量之间找到最佳拟合线来预测目标变量的方法,最佳拟合是所有点的最小误差线。
什么是最小二乘法?
最佳拟合度的计算方法是确保形状与每个点的实际观测值之间的所有距离之和尽可能小。
步骤1:计算x值和y值的平均值。
步骤2:计算线的斜率。即
步骤3:计算直线的y轴截距。即
例如,考虑以下数据:
绘制点数:
现在通过计算平均值:
x̄ = 5.86
ȳ = 6
计算线的斜率:
计算y轴截距:
c= 6 -(-0.83 * 5.86)
c= 10.86
该方程式为:
y = mx + c
y = -0.83x + 10.86
因此,我们从上面的例子中找到了最合适的线,在这条线的帮助下,我们可以预测这些值。
线性回归的优缺点:
优点:
易于实施
用于预测数值
缺点:
当独立变量和因变量之间的关系是非线性时,不能使用。
现在让我们使用python的动手示例练习线性回归:
数据集的功能:
父亲 – 父亲的身高以英寸为单位。
儿子 – 以英寸为单位的儿子的高度。
鉴于父亲的身高,我们需要预测儿子的身高。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。