比较两个样本
接下来,我们有两个分布,其可以判定为相同或者来自不同的分布,以及我们希望测试是否这些
样本有相同的统计特征。
均值
以相同的均值产生的样本进行检验:
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500)
>>> rvs2 = stats.norm.rvs(loc=5, scale=10, size=500)
>>> stats.ttest_ind(rvs1, rvs2)
(-0.54890361750888583, 0.5831943748663857)
以不同的均值产生的样本进行检验:
>>> rvs3 = stats.norm.rvs(loc=8, scale=10, size=500)
>>> stats.ttest_ind(rvs1, rvs3)
(-4.5334142901750321, 6.507128186505895e-006)
对于两个不同的样本进行的KS检验
在这个例子中我们使用两个同分布的样本进行检验.设因为P值很高,毫不奇怪我们不能拒绝原假设。
>>> stats.ks_2samp(rvs1, rvs2)
(0.025999999999999995, 0.99541195173064878)
在第二个例子中,由于均值不同,所以我们可以拒绝空假设,由P值小于1%。
>>> stats.ks_2samp(rvs1, rvs3)
(0.11399999999999999, 0.0027132103661283141)