在我们学习如何表演之前 Excel中的多元回归,对整个回归(尤其是多元回归)进行复习非常重要。
人工智能的标志之一是我们能够识别周围的模式。这就是使我们认识到何时似乎有两个或多个事物联系在一起,以及何时一件事物很可能是另一事物的原因或结果的原因。
Excel 中的多元回归
举例来说,假设您决定收集特定位置整整一年的平均温度和平均降雨量的数据,每天收集一次数据。然后,您可以在一张方格纸上绘制温度和平均降雨量的数据。您可以在 x 轴上绘制平均温度数据,在 y 轴上绘制平均降雨量数据。散点图上的每个点都将具有坐标:x坐标和y坐标。这些坐标会将其定位在图形上的特殊位置。
在绘制点时,您可能会开始看到图案出现。随着平均气温的升高,您收集数据的地点的平均降雨量似乎有所增加。您一直在收集的两条数据在技术上称为 变量. 在这种情况下,平均温度是自变量,而平均降雨量是因变量。
当你注意到这两个变量是连通的时,我们说它们是 相关的。 相关可以采用多种形式。如果一个变量上升而另一个变量下降,那就是负相关. 如果一个变量与另一个变量同时上升,则为正相关. 如果变量中似乎没有任何明显的趋势,那么我们说没有相关性。
数据和相关性
完美正相关的值为 +1 而完全负相关的值为 -1. 0, 位于这两个值的中间,表示根本没有相关性。因此,数据可以在该范围内的任何地方采用相关值。该相关性的确切值称为相关系数,它是使用Excel函数列表中存在的特殊统计公式计算得出的。
请注意,统计学家喜欢区分相关性和因果关系。仅仅因为两件事相关并不意味着它们有因果关系。在我们上面的例子中,平均温度的增加对应于平均降雨量的增加这一事实并不意味着一个会导致另一个。可能只是第三个隐藏因素导致了两者。
在这种情况下,气象学家们众所周知,湿度的增加会导致感知的温度和降雨的增加。这就是为什么理解区别很重要的原因。映射相关性向您显示模式存在的位置;可以说,它向您显示了导致超出其简要内容的原因。
您可能对散点图感到不高兴。也许在数据中划一条线来显示关系的外观会更容易理解。您正在寻找的是回归线或最适合您面前数据的线。这涉及采用回归公式,该公式使用相关系数来找到最佳回归线。
单变量和多变量
乐趣不止于此。上面的公式适用于单个自变量和单个因变量。然而,正如我们上面所讨论的,有时方程中可能有多个自变量。
例如,我们指出,仅将平均温度与平均降雨量作图并不能给出完整的图景。平均湿度是另一个影响平均温度和平均降雨量的独立变量。如果有一种方法可以将平均降雨量作为因变量与平均降雨量和平均湿度这两个自变量作图,那会不会很好?
事实证明,这正是多元回归的全部含义。它使您可以将单个因变量与已测量和收集数据的多个自变量相关联。
多元回归分析
多元回归是数据分析的一种非常强大的形式,应用于现实世界时,它的准确性更高。特别是在商业世界中,情况很少受到单一因素的影响。通常,有很多因素协同作用才能产生结果。当您收集某些条件组的数据时,这种数据分析将允许您预测相关条件下的数据。
借助多元回归的力量,您将能够更好地了解您的市场以及其中存在的客户。
Excel中的回归分析
在您急于购买市场上最先进的统计软件之前,您会很高兴听到您可以执行 Excel中的回归分析。
启动Excel
开始你的 Excel中的多元分析, 启动 Microsoft Excel。 点击 在标签上 “文件” 然后 点击 在标有按钮的按钮上 “选项。” 将打开一个对话框。
点击选项
对话框的左侧是一个带有选项的列表。 点击 在标记的选项上 “插件。” 您将能够看到应用程序加载项。在非活动加载项列表中,您应该看到一个标签为 “分析工具库。”点击 在那上面 点击 下拉菜单 “ Excel加载项。”点击 在标有按钮的按钮上 “去” 在底部,另一个对话框标记为 “插件”会出现。
选中该框
在标有选项的选项前面 “ Analysis ToolPak” 是一个复选框。 点击 在它上面然后 点击 在对话框右侧标记为的按钮上 “好的。” 这将打开您刚刚检查的选项。
执行回归
现在是执行回归的时候了。您的列将需要标题,您可以在第1行中输入。数据位于标题下。有专门针对您的因变量的列。它应该是第一列或最后一列。自变量可以填充其他列,并且应该是连续的。
数据选项卡
在功能区上 点击 在标有标签的标签上 “数据。” 在标有标签的组中 “分析,” 点击 在标有标签的项目上 “数据分析。” 将启动一个对话框。
回归
在里面 分析工具 在对话框中,寻找“回归”并单击它,然后 点击 上 “好的。”
因变量
现在,在标有字段的字段中键入具有因变量的单元格范围的位置 “输入Y范围。”
自变量
现在将具有自变量的单元格范围的位置输入到标记的字段中 “输入 X 范围。”
勾选方块
为了确保 电子表格 知道第一行只剩下labels_,单击标记为复选框的_ “标签。”
单击输出范围
在标有 输出选项,有一个单选按钮标记为 “输出范围”。点击 在其上输入第一个数据范围,以确定回归分析的输出将出现在何处。如果您希望结果出现在单独的工作表中, 点击 在标记的单选按钮上 “工作表层。” 如果您希望它们完全放在一个新文件中, 点击 在标有单选按钮的按钮上 “新工作簿。”
残差
回归对话框的一部分标记为 “残留物。” 这些是分析输出的摘要,会逐个考虑结果。他们将预测与实际结果进行比较。标准化残差将采用残差的标准偏差并将其更正为 1。
点击 在标记为选项的复选框上 “阴谋,” 您的结果将以图形显示。如果你选择 “残差图” 那么只有残差会被绘制出来。如果你选择 “线拟合图,” 然后将根据实际结果绘制预测。 点击 上 “好的,” 然后您的回归将开始处理。您可以稍后在之前指定的位置查看结果。