• Regress

2020-12-07
• REGRESS

2016-01-27
REGRESS Multiple linear regression using least squares.​ 使用最小二乘法多元线性回归。 1. B = REGRESS(Y,X)  returns the vector B of regression coefficients in the linear model Y = X*B. X is an n...
 REGRESS Multiple linear regression using least squares.​

使用最小二乘法多元线性回归。

1.  B = REGRESS(Y,X)

returns the vector B of regression coefficients in the    linear model Y = X*B.  X is an n-by-p design matrix, with rows corresponding to observations and columns to predictor variables.  Y is an n-by-1 vector of response observations.     ​

返回返回线性模型Y=X*B的拟合系数矢量B。X是一个设计的 n x p 的矩阵，它的行对应观测值，列对应预测值。Y是一个n x 1的观测的响应向量。

2. [B,BINT] = REGRESS(Y,X)

returns a matrix BINT of 95% confidence    intervals for B.

返回一个矩阵BINT，代表着矩阵B 95%的置信区间。

3. [B,BINT,R] = REGRESS(Y,X)

returns a vector R of residuals.   ​

返回残差矢量R

4. [B,BINT,R,RINT] = REGRESS(Y,X)

returns a matrix RINT of intervals that can be used to diagnose outliers.  If RINT(i,:) does not contain zero,    then the i-th residual is larger than would be expected, at the 5%    significance level.  This is evidence that the I-th observation is an    outlier.    ​

返回一个可以诊断异常值的区间--矩阵RINT，如果RINT的第 i 行没有0，那么第 i 行的残差比预期的5%的显著水品大。这证明 I 行观测值是离群的。

5. [B,BINT,R,RINT,STATS] = REGRESS(Y,X)

returns a vector STATS containing, in the following order, the R-square statistic, the F statistic and p value    for the full model, and an estimate of the error variance.     ​

返回一个矢量STATS依次包含：​

6. [...] = REGRESS(Y,X,ALPHA)

uses a 100*(1-ALPHA)% confidence level to    compute BINT, and a (100*ALPHA)% significance level to compute RINT.

使用100*（1-α）%的置信水平来计算BINT,使用100α%的

X should include a column of ones so that the model contains a constant    term.  The F statistic and p value are computed under the assumption    that the model contains a constant term, and they are not correct for    models without a constant.  The R-square value is one minus the ratio of    the error sum of squares to the total sum of squares.  This value can    be negative for models without a constant, which indicates that the    model is not appropriate for the data.

If columns of X are linearly dependent, REGRESS sets the maximum    possible number of elements of B to zero to obtain a "basic solution",    and returns zeros in elements of BINT corresponding to the zero    elements of B.​​

如果X的列都线性相关，REGRESS 将

REGRESS treats NaNs(Not a Number) in X or Y as missing values, and removes them.​

拟合函数对于X或者Y里面的非数值的元素，认为他们是缺失的，并删除他们。


• regress

spool invalid_obj_before_regress.lst select owner,object_name,object_type,last_ddl_time from dba_objects where status='INVALID'; spool off EOF   ############################################ ...
#! /bin/ksh
############### ###   UAT   ### ###############
export ENVS=/test/change/env/env_test.sql
export SCHEMA_HOME=/test/change/schema/test/2015_11_20_test_1.1
export SCHEMA_HOME_test=${SCHEMA_HOME}/2015_11_20_test ################ ### PROD ### ################ #export ENVS= #export SCHEMA_HOME= #export SCHEMA_HOME_test= ##################################### # Check DB connection is correct ##################################### sqlplus /nolog <<EOF set pagesize 500 set linesize 200 @${ENVS}
connect &v_system_un/&v_system_pw@&v_conn_str
show user prompt &v_conn_str
select * from v\$instance; EOF echo Press any key to continue read ANS ############################################ # Check invalid objects (before) ############################################cd$SCHEMA_HOMEsqlplus /nolog << EOF@${ENVS}connect &v_system_un/&v_system_pw@&v_conn_strset pages 1000set lines 150col owner for a15col object_name for a35col object_type for a20col last_ddl_time for a20alter session set nls_date_format = 'YYYY-MON-DD HH24:MI:SS';spool invalid_obj_before_regress.lstselect owner,object_name,object_type,last_ddl_time from dba_objects where status='INVALID';spool offEOF ############################################ banner 'SMAS' ############################################ date echo Press any key to continue read ANS cd$SCHEMA_HOME_SMAS/
sqlplus /nolog << EOF
set pagesize 500
set linesize 200
@${ENVS} connect &v_system_un/&v_system_pw@&v_conn_str show user select * from v\$instance;
select to_char(sysdate,'YYYY-MON-DD HH24:MI:SS')  from dual;
@01_change_regress.sql
EOF
date
echo Press any key to continue
############################################ # Check invalid objects (after) ############################################
cd $SCHEMA_HOME sqlplus /nolog << EOF @${ENVS}
connect &v_system_un/&v_system_pw@&v_conn_str
set pages 1000
set lines 150
col owner for a15
col object_name for a35
col last_ddl_time for a20alter session set nls_date_format = 'YYYY-MON-DD HH24:MI:SS';spool invalid_obj_after_regress.lst select owner,object_name,object_type,last_ddl_time from dba_objects where status='INVALID';spool offEOF

• MATLAB regress命令

调用格式：B = regress(Y,X)[B,BINT] = regress(Y,X)[B,BINT,R] = regress(Y,X)[B,BINT,R,RINT] = regress(Y,X)B,BINT,...
1 regress命令

用于一元及多元线性回归，本质上是最小二乘法。在Matlab 命令行窗口输入help regress ，会弹出和regress的相关信息，一一整理。

调用格式：

B = regress(Y,X)
[B,BINT] = regress(Y,X)
[B,BINT,R] = regress(Y,X)
[B,BINT,R,RINT] = regress(Y,X)
B,BINT,R,RINT,STATS] = regress(Y,X)
[...] = regress(Y,X,ALPHA)

参数解释：

B：回归系数，是个向量（“the vector B of regression coefficients in the  linear model Y = X*B”）。
BINT：回归系数的区间估计（“a matrix BINT of 95% confidence intervals for B”）。
R：残差（ “a vector R of residuals”）。
RINT：置信区间（“a matrix RINT of intervals that can be used to diagnose outliers”）。
STATS：用于检验回归模型的统计量。有4个数值：判定系数R^2，F统计量观测值，检验的p的值，误差方差的估计。
ALPHA：显著性水平（缺少时为默认值0.05）。

2 regress函数例程

目标函数：y=Ax1^2+Bx2^2+Cx1+Dx2+Ex1*x2+F  （这是一个二次函数，两个变量，大写的字母是常数）

应用实例：

%导入数据
x1=[7666 7704 8148 8571 8679 7704 6471 5870 5289 3815 3335 2927 2758 2591]';
x2=[16.22 16.85 17.93 17.28 17.23 17 19 18.22 16.3 13.37 11.62 10.36 9.83 9.25]';
y=[7613.51  7850.91  8381.86  9142.81 10813.6 8631.43 8124.94 9429.79 10230.81 10163.61 9737.56 8561.06 7781.82 7110.97]';
X=[ones(size(y)) x1.^2 x2.^2 x1 x2 x1.*x2];

%开始分析
[b,bint,r,rint,stats] = regress(y,X);

其中， b(1)=F(最后那个常数项)

b(2)=A，b(3)=B，b(4)=C，b(5)=D，b(6)=E。bint为b的95%置信区间。

比较重要的stats分析：stats的第三个参数为F检测的P值，p值很小（P<0.001）,说明拟合模型有效。

可视化操作：

figure,scatter3(x1,x2,y,'filled') %scatter可用于画散点图
%拟合，三维视图显示
hold on  %在刚刚那副散点图上接着画
x1fit = min(x1):100:max(x1);   %设置x1的数据间隔
x2fit = min(x2):1:max(x2);     %设置x2的数据间隔
[X1FIT,X2FIT] = meshgrid(x1fit,x2fit);    %生成一个二维网格平面，也可以说生成X1FIT,X2FIT的坐标
YFIT=b(1)+b(2)*X1FIT.^2+b(3)*X2FIT.^2+b(4)*X1FIT +b(5)*X2FIT+b(6)*X1FIT.*X2FIT;    %代入已经求得的参数，拟合函数式
mesh(X1FIT,X2FIT,YFIT)    %X1FIT，X2FIT是网格坐标矩阵，YFIT是网格点上的高度矩阵
view(10,10)  %改变角度观看已存在的三维图，第一个10表示方位角，第二个表示俯视角。
%方位角相当于球坐标中的经度，俯视角相当于球坐标中的纬度
xlabel('x1') %设置x轴的名称
ylabel('x2') %设置y轴的名称
zlabel('y')  %设置z轴的名称

下面来用一组数据对上面的效果进行检测，自己建立一个方程：

目标函数：y=5x1^2+7x2^2+2x1+3x2+8x1*x2+10

%测试数据
x1_test = [-1, 0, 1, -1, 0, 1]';  %
x2_test = [-1, -1, 0, 1, 0, 1]'; %
y_test = [25, 14, 17, 15, 10, 35]'; %

X_test=[ones(size(y_test)) x1_test.^2 x2_test.^2 x1_test x2_test x1_test.*x2_test];

%开始分析
[b_test,bint_test,r,rint_test,stats_test] = regress(y_test,X_test);

figure,
scatter3(x1_test,x2_test,y_test,'filled') %scatter可用于画散点图
%拟合，三维视图显示
hold on  %在刚刚那副散点图上接着画
x1fit = min(x1_test):0.1:max(x1_test);   %设置x1的数据间隔
x2fit = min(x2_test):0.1:max(x2_test);     %设置x2的数据间隔
[X1FIT,X2FIT] = meshgrid(x1fit,x2fit);    %生成一个二维网格平面，也可以说生成X1FIT,X2FIT的坐标
YFIT=b_test(1)+b_test(2)*X1FIT.^2+b_test(3)*X2FIT.^2+b_test(4)*X1FIT +b_test(5)*X2FIT+b_test(6)*X1FIT.*X2FIT;    %代入已经求得的参数，拟合函数式
mesh(X1FIT,X2FIT,YFIT)    %X1FIT，X2FIT是网格坐标矩阵，YFIT是网格点上的高度矩阵
view(10,10)  %改变角度观看已存在的三维图，第一个10表示方位角，第二个表示俯视角。
%方位角相当于球坐标中的经度，俯视角相当于球坐标中的纬度
xlabel('x1') %设置x轴的名称
ylabel('x2') %设置y轴的名称
zlabel('y')  %设置z轴的名称

• python_regress
• GDT regress test

PostgresSQL regress test 最近看了下pg中的回归测试相关内容，现在将看到的内容记录下来。 1. 先来一个例子 [postgres@gorilla1 regress]$make check make -C ../../../src/port all make[1]: Entering ...
• MATLAB 多元线性回归（regress） 语法 b = regress(y,X) [b,bint] = regress(y,X) [b,bint,r] = regress(y,X) [b,bint,r,rint] = regress(y,X) [b,bint,r,rint,stats] = regress(y,X) [___] = regress(y,X,alpha) ...
• regress 顾名思义，就是一元多元方程的的拟合，y=c1*x1+c2*x2....或者y=c1*x1^2+c2*x2^2+c3*x1*x2....等等形式 [b,BINT] = regress(Y,X) [b,BINT,R] = regress(Y,X) [b,BINT,R,RINT] = regress(Y,X) [b,BINT,R,...
