资料分析公式

描述统计学:

平均数:$\bar{x}=\frac{\sum_{i=1}^n x_i}{n}$

中位数:$\tilde{x}$

众数:出现次数最多的数

方差:$s^2=\frac{\sum_{i=1}^n (x_i-\bar{x})^2}{n-1}$

标准差:$s=\sqrt{\frac{\sum_{i=1}^n (x_i-\bar{x})^2}{n-1}}$

变异系数:$CV=\frac{s}{\bar{x}}\times 100%$

四分位数:Q1,Q2,Q3

离散系数:$DS=\frac{s}{\bar{x}}$

推断统计学:

样本均值:$\bar{x}=\frac{\sum_{i=1}^n x_i}{n}$

样本标准差:$s=\sqrt{\frac{\sum_{i=1}^n (x_i-\bar{x})^2}{n-1}}$

样本比例:$p=\frac{x}{n}$

样本方差:$s^2=\frac{\sum_{i=1}^n (x_i-\bar{x})^2}{n-1}$

标准误:$SE=\frac{s}{\sqrt{n}}$

正态分布的置信区间:$\bar{x}\pm z\frac{s}{\sqrt{n}}$

t分布的置信区间:$\bar{x}\pm t_{\alpha/2}\frac{s}{\sqrt{n}}$

卡方分布的置信区间:$\frac{(n-1)s^2}{\chi^2_{\alpha/2}}<\sigma^2<\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}}$

t检验:$t=\frac{\bar{x}-\mu_0}{s/\sqrt{n}}$

方差分析的F检验:$F=\frac{MS_{\text{between}}}{MS_{\text{within}}}$

相关系数:$r=\frac{\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^n (x_i-\bar{x})^2}\sqrt{\sum_{i=1}^n (y_i-\bar{y})^2}}$

线性回归:$y=\beta_0+\beta_1 x+\epsilon$