Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读
#仿真数据集(预测股票指数)
这里的目标是根据两个宏观经济变量:利率和失业率来预测/估计股票指数价格。
我们将使用pandas DataFrame在Python中捕获上述数据。在深入研究Python代码之前,请确保安装了statsmodels和pandas包。您可以使用PIP方法来安装这些软件包。
pip install pandas
pip install statsmodels
#验证特征和目标的线性关系
#利率和股票指数的关系;
#利率上升股票指数上升;
import pandas as pdimport matplotlib.pyplot as pltStock_Market = {Year: [,,,,,,,,,,,,,,,,,,,,,,,],Month: [12, 11,10,9,8,7,6,5,4,3,2,1,12,11,10,9,8,7,6,5,4,3,2,1],Interest_Rate: [2.7