Deeplearning Algorithms tutorial

局部加权回归(LWR)是非参数学习方法。 首先参数学习方法是这样一种方法:在训练完成所有数据后得到一系列训练参数,然后根据训练参数来预测新样本的值,这时不再依赖之前的训练数据了,参数值是确定的。而非参数学习方法是这样一种算法:在预测新样本值时候每次都会重新训练数据得到新的参数值,也就是说每次预测新样本都会依赖训练数据集合,所以每次得到的参数值是不确定的。 局部加权回归(LWR)是我们遇到的第一个non-parametric(非参数)学习算法,而线性回归则是我们遇到的以一个parametric(参数)学习算法。因为参数学习算法它有固定的明确的参数,所以参数一旦确定,就不会改变了,我们不需要在保留训练集中的训练样本。而非参数学习算法,每进行一次预测,就需要重新学习一组,是变化的,所以需要一直保留训练样本。因而,当训练集的容量较大时,非参数学习算法需要占用更多的存储空间,计算速度也较慢。所以有得必有失,效果好了,计算速度却降下来了。


  1. # coding: utf-8
  2. # linear_regression/
  3. def JLwr(theta, X, y, x, c):
  4. """局部加权线性回归的代价函数计算式
  5. Args:
  6. theta: 相关系数矩阵
  7. X: 样本集矩阵
  8. y: 标签集矩阵
  9. x: 待预测输入
  10. c: tau
  11. Returns:
  12. 预测代价
  13. """
  14. m,n = X.shape
  15. summerize = 0
  16. for i in range(m):
  17. diff = (X[i]-x)*(X[i]-x).T
  18. w = np.exp(-diff/(2*c*c))
  19. predictDiff = np.power(y[i] - X[i]*theta,2)
  20. summerize = summerize + w*predictDiff
  21. return summerize
  22. @exeTime
  23. def lwr(rate, maxLoop, epsilon, X, y, x, c=1):
  24. """局部加权线性回归
  25. Args:
  26. rate: 学习率
  27. maxLoop: 最大迭代次数
  28. epsilon: 预测精度
  29. X: 输入样本
  30. y: 标签向量
  31. x: 待预测向量
  32. c: tau
  33. """
  34. m,n = X.shape
  35. # 初始化theta
  36. theta = np.zeros((n,1))
  37. count = 0
  38. converged = False
  39. error = float('inf')
  40. errors = []
  41. thetas = {}
  42. for j in range(n):
  43. thetas[j] = [theta[j,0]]
  44. # 执行批量梯度下降
  45. while count<=maxLoop:
  46. if(converged):
  47. break
  48. count = count + 1
  49. for j in range(n):
  50. deriv = (y-X*theta).T*X[:, j]/m
  51. theta[j,0] = theta[j,0]+rate*deriv
  52. thetas[j].append(theta[j,0])
  53. error = JLwr(theta, X, y, x, c)
  54. errors.append(error[0,0])
  55. # 如果已经收敛
  56. if(error < epsilon):
  57. converged = True
  58. return theta,errors,thetas


  1. # coding: utf-8
  2. # linear_regression/
  3. import regression
  4. import matplotlib.pyplot as plt
  5. import matplotlib.ticker as mtick
  6. import numpy as np
  7. if __name__ == "__main__":
  8. srcX, y = regression.loadDataSet('data/lwr.txt');
  9. m,n = srcX.shape
  10. srcX = np.concatenate((srcX[:, 0], np.power(srcX[:, 0],2)), axis=1)
  11. # 特征缩放
  12. X = regression.standardize(srcX.copy())
  13. X = np.concatenate((np.ones((m,1)), X), axis=1)
  14. rate = 0.1
  15. maxLoop = 1000
  16. epsilon = 0.01
  17. predicateX = regression.standardize(np.matrix([[8, 64]]))
  18. predicateX = np.concatenate((np.ones((1,1)), predicateX), axis=1)
  19. result, t = regression.lwr(rate, maxLoop, epsilon, X, y, predicateX, 1)
  20. theta, errors, thetas = result
  21. result2, t = regression.lwr(rate, maxLoop, epsilon, X, y, predicateX, 0.1)
  22. theta2, errors2, thetas2 = result2
  23. # 打印特征点
  24. fittingFig = plt.figure()
  25. title = 'polynomial with bgd: rate=%.2f, maxLoop=%d, epsilon=%.3f'%(rate,maxLoop,epsilon)
  26. ax = fittingFig.add_subplot(111, title=title)
  27. trainingSet = ax.scatter(srcX[:, 0].flatten().A[0], y[:,0].flatten().A[0])
  28. print theta
  29. print theta2
  30. # 打印拟合曲线
  31. xx = np.linspace(1, 7, 50)
  32. xx2 = np.power(xx,2)
  33. yHat1 = []
  34. yHat2 = []
  35. for i in range(50):
  36. normalizedSize = (xx[i]-xx.mean())/xx.std(0)
  37. normalizedSize2 = (xx2[i]-xx2.mean())/xx2.std(0)
  38. x = np.matrix([[1,normalizedSize, normalizedSize2]])
  39. yHat1.append(regression.h(theta, x.T))
  40. yHat2.append(regression.h(theta2, x.T))
  41. fittingLine1, = ax.plot(xx, yHat1, color='g')
  42. fittingLine2, = ax.plot(xx, yHat2, color='r')
  43. ax.set_xlabel('temperature')
  44. ax.set_ylabel('yield')
  45. plt.legend([trainingSet, fittingLine1, fittingLine2], ['Training Set', r'LWR with $\tau$=1', r'LWR with $\tau$=0.1'])
  47. # 打印误差曲线
  48. errorsFig = plt.figure()
  49. ax = errorsFig.add_subplot(111)
  50. ax.yaxis.set_major_formatter(mtick.FormatStrFormatter('%.2e'))
  51. ax.plot(range(len(errors)), errors)
  52. ax.set_xlabel('Number of iterations')
  53. ax.set_ylabel('Cost J')

最后,我们分别对ττ取值 0.10.1 和 11 ,得到了不同的拟合曲线:

局部加权学习算法(LWR) - 图1