目录
多元正态分布
多变量正态分布亦称为多变量高斯分布。它是单维正态分布向多维的推广。它同矩阵正态分布有紧密的联系。.
查看 费雪变换和多元正态分布
统计学
统计学是在資料分析的基础上,研究测定、收集、整理、归纳和分析反映數據資料,以便给出正确訊息的科學。這一门学科自17世纪中叶产生并逐步发展起来,它廣泛地應用在各門學科,從自然科学、社會科學到人文學科,甚至被用於工商業及政府的情報決策。隨著大数据(Big Data)時代來臨,統計的面貌也逐漸改變,與資訊、計算等領域密切結合,是資料科學(Data Science)中的重要主軸之一。 譬如自一組數據中,可以摘要並且描述這份數據的集中和離散情形,這個用法稱作為描述統計學。另外,觀察者以數據的形態,建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。數理統計學则是討論背後的理論基礎的學科。.
查看 费雪变换和统计学
置信区间
在统计学中,一个概率样本的置信区间(Confidence interval),是对这个样本的某个总体参数的区间估计。置信区间展现的是,这个总体参数的真实值有一定概率落在與該测量结果有關的某對應區間。置信区间给出的是,聲稱总体参数的真實值在测量值的區間所具有的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率落在50%和60%之区间的机率為95%,因此他的真实支持率不足50%的可能性小于2.5%(假设分布是对称的)。 如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信区间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。 对置信区间的计算通常要求对估计过程的假设(因此属于参数统计),比如说假设估计的误差是成正态分布的。 置信区间只在频率统计中使用。在中的对应概念是可信区间。但是可信区间和置信区间是建立在不同的概念基础上的,因此一般上说取值不会一样。置信空间表示通过计算估计值所在的区间。置信水平表示准确值落在这个区间的概率。置信区间表示具体值范围,置信水平是个概率值。例如:估计某件事件完成会在10~12日之间,但这个估计准确性大约只有80%:表示置信区间(10,12,置信水平80%。要想提高置信水平,就要放宽信賴區間。.
查看 费雪变换和置信区间
相关
在概率论和统计学中,相关(Correlation,或称相关系数或关联系数),显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许多根据数据特点而定义的用来衡量数据相关的系数。.
查看 费雪变换和相关
標準差
標準差(又稱标准偏差、--,,缩写SD),数学符号σ(sigma),在概率統計中最常使用作為測量一組數值的離散程度之用。標準差定義:為方差開算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率。測量到分佈程度的結果,原則上具有兩種性質:.
查看 费雪变换和標準差
正态分布
常態分布(normal distribution)又名高斯分布(Gaussian distribution),是一個非常常見的連續機率分布。常態分布在统计学上十分重要,經常用在自然和社会科学來代表一個不明的隨機變量。 若隨機變量X服從一個位置參數為\mu、尺度參數為\sigma的常態分布,記為: 則其機率密度函數為 常態分布的數學期望值或期望值\mu等於位置參數,決定了分布的位置;其方差\sigma^2的開平方或標準差\sigma等於尺度參數,決定了分布的幅度。 常態分布的機率密度函數曲線呈鐘形,因此人們又經常稱之為鐘形曲線(类似于寺庙里的大钟,因此得名)。我們通常所說的標準常態分布是位置參數\mu.
查看 费雪变换和正态分布