徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
安装
比浏览器更快的访问!
 

统计学

指数 统计学

统计学是在資料分析的基础上,研究测定、收集、整理、归纳和分析反映數據資料,以便给出正确訊息的科學。這一门学科自17世纪中叶产生并逐步发展起来,它廣泛地應用在各門學科,從自然科学、社會科學到人文學科,甚至被用於工商業及政府的情報決策。隨著大数据(Big Data)時代來臨,統計的面貌也逐漸改變,與資訊、計算等領域密切結合,是資料科學(Data Science)中的重要主軸之一。 譬如自一組數據中,可以摘要並且描述這份數據的集中和離散情形,這個用法稱作為描述統計學。另外,觀察者以數據的形態,建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。數理統計學则是討論背後的理論基礎的學科。.

81 关系: 偏差假設檢定假说卡爾·弗里德里希·高斯卡方分佈大数据天文學學科列表學生t檢驗密码学工商业中央政府主成分分析布莱兹·帕斯卡廣義線性模式代表估计理论心理学医疗卫生哲学商业前5世纪因果皮埃爾·德·費馬皮尔逊积矩相关系数社会科学神经网络第一型及第二型錯誤等级线性模型统计学家列表统计图形置信区间病例對照研究生产率生物統計學相关随机变量隨機聚类分析非线性频率分析高階管理人員议会误差试验设计谎言,该死的谎言,统计数字資料資料科學贝叶斯概率輕率概化...迴歸分析霍桑效应蒙提霍爾問題肯迪自助法自然科学英語零假设雙盲推論統計學条形统计图概率概率分布概率论概率模型樣本標準差最小二乘法显著性差异斯皮尔曼等级相关系数方差分析时间序列分析政府政治家数学数理统计学数据数据挖掘教育学拉丁语時間序列 扩展索引 (31 更多) »

偏差

在统计学中,偏差可以用于两个不同的概念。与。.

新!!: 统计学和偏差 · 查看更多 »

假設檢定

假設檢定是推論統計中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估計未知參數,就會希望根據結果對未知的真正參數值做出適當的推論。 統計上對參數的假設,就是對一個或多個參數的論述。而其中欲檢驗其正確性的為零假設(null hypothesis),零假設通常由研究者決定,反應研究者對未知參數的看法。相對於零假設的其他有關參數之論述是(alternative hypothesis),它通常反應了執行檢定的研究者對參數可能數值的另一種(對立的)看法(換句話說,對立假設通常才是研究者最想知道的)。 假设检验的种类包括:t检验,Z检验,卡方检验,F检验等等。.

新!!: 统计学和假設檢定 · 查看更多 »

假说

假说(Hypothesis),即指按照预先设定,对某种现象进行的解释,即根据已知的科学事实和科学原理,对所研究的自然现象及其规律性提出的推测和说明,而且數據經過詳細的分類、歸納與分析,得到一個暫時性但是可以被接受的解釋。任何一种科学理论在未得到实验确证之前表现为假设学说或假说。 有的假设还没有完全被科学方法所证明,也没有被任何一种科学方法所否定,但能够产生深远的影响。如1900年德国物理学家马克斯·普朗克为解决黑体辐射谱而首先提出量子论(量子假说),1913年丹麦物理学家尼尔斯·玻尔提出的玻尔原子理论大大推进了现代物理学发展进程。.

新!!: 统计学和假说 · 查看更多 »

卡爾·弗里德里希·高斯

约翰·卡爾·弗里德里希·高斯(Johann Karl Friedrich Gauß;), 德国数学家、物理学家、天文学家、大地测量学家,生于布伦瑞克,卒于哥廷根。高斯被认为是历史上最重要的数学家之一Dunnington, G. Waldo.

新!!: 统计学和卡爾·弗里德里希·高斯 · 查看更多 »

卡方分佈

没有描述。

新!!: 统计学和卡方分佈 · 查看更多 »

大数据

#重定向 大數據.

新!!: 统计学和大数据 · 查看更多 »

天文學

天文學是一門自然科學,它運用數學、物理和化學等方法來解釋宇宙間的天體,包括行星、衛星、彗星、恆星、星系等等,以及各種現象,如超新星爆炸、伽瑪射線暴、宇宙微波背景輻射等等。廣義地來說,任何源自地球大氣層以外的現象都屬於天文學的研究範圍。物理宇宙學與天文學密切相關,但它把宇宙視為一個整體來研究。 天文學有著遠古的歷史。自有文字記載起,巴比倫、古希臘、印度、古埃及、努比亞、伊朗、中國、瑪雅以及許多古代美洲文明就有對夜空做詳盡的觀測記錄。天文學在歷史上還涉及到天體測量學、天文航海、觀測天文學和曆法的制訂,今天則一般與天體物理學同義。 到了20世紀,天文學逐漸分為觀測天文學與理論天文學兩個分支。觀測天文學以取得天體的觀測數據為主,再以基本物理原理加以分析;理論天文學則開發用於分析天體現象的電腦模型和分析模型。兩者相輔相成,理論可解釋觀測結果,觀測結果可證實理論。 與不少現代科學範疇不同的是,天文學仍舊有比較活躍的業餘社群。業餘天文學家對天文學的發展有著重要的作用,特別是在發現和觀察彗星等短暫的天文現象上。 http://www.sydneyobservatory.com.au/ Official Web Site of the Sydney Observatory Astronomy (from the Greek ἀστρονομία from ἄστρον astron, "star" and -νομία -nomia from νόμος nomos, "law" or "culture") means "law of the stars" (or "culture of the stars" depending on the translation).

新!!: 统计学和天文學 · 查看更多 »

學科列表

這是一個學科的列表。學科是在大學教學(教育)與研究的知識分科。學科是被發表研究和學術雜誌、學會和系所所定義及承認的。 領域通常有子領域或分科,而其之間的分界是隨便且模糊的。 在中世紀的歐洲,大學裡只有四個學系:神學、醫學、法學和藝術,而最後一個的地位稍微低於另外三個的地位。在中世紀至十九世紀晚期的大學世俗化過程中,傳統的課程開始增輔進了非古典的語言及文學、物理、化學、生物和工程等學科,現今的學科起源便源自於此。到了二十世紀初期,教育學、社會學及心理學也開始出現在大學的課程裡了。 以下簡表展示出各大類科目,以及各大類科目中的主要科目。 "*"記號表示此一領域的學術地位是有爭議的。注意有些學科的分類也是有爭議的,如人類學和語言學究竟屬於社會科學亦或是人文學科,以及计算机技术是工程学科亦或是形式科学。.

新!!: 统计学和學科列表 · 查看更多 »

學生t檢驗

學生t檢驗(Student's t-test)是指虛無假设成立時的任一檢定統計有學生t-分佈的統計假說檢定,屬於母數統計。學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本之期望值的是否為某一實數,或是二群來自常態分配母體的獨立樣本之期望值的差是否為某一實數。舉個簡單的例子,也就是說我們可以在抓取一個班級的男生,去比較該班與全校男生之身高差異程度是不是推測的那樣,或是不同年級班上的男生身高的差異的場合是否一如預期使用此檢驗法。.

新!!: 统计学和學生t檢驗 · 查看更多 »

密码学

密碼學(Cryptography)可分为古典密码学和现代密码学。在西欧語文中,密码学一词源於希臘語kryptós“隱藏的”,和gráphein“書寫”。古典密码学主要关注信息的保密书写和传递,以及与其相对应的破译方法。而现代密码学不只关注信息保密问题,还同时涉及信息完整性验证(消息验证码)、信息发布的不可抵赖性(数字签名)、以及在分布式计算中产生的来源于内部和外部的攻击的所有信息安全问题。古典密码学与现代密码学的重要区别在于,古典密码学的编码和破译通常依赖于设计者和敌手的创造力与技巧,作为一种实用性艺术存在,并没有对于密码学原件的清晰定义。而现代密码学则起源于20世纪末出现的大量相关理论,这些理论使得现代密码学成为了一种可以系统而严格地学习的科学。 密码学是数学和计算机科学的分支,同时其原理大量涉及信息论。著名的密碼學者罗纳德·李维斯特解釋道:「密碼學是關於如何在敵人存在的環境中通訊」,自工程學的角度,這相當于密碼學與純數學的差异。密碼學的发展促進了计算机科学,特別是在於電腦與網路安全所使用的技術,如存取控制與資訊的機密性。密碼學已被應用在日常生活:包括自动柜员机的晶片卡、電腦使用者存取密碼、電子商務等等。.

新!!: 统计学和密码学 · 查看更多 »

工商业

工商业包括工业和商业两大部分。.

新!!: 统计学和工商业 · 查看更多 »

中央政府

中央政府或國家政府是管理一个国家全国事务的国家机构总称,联邦制国家的中央政府,即称“联邦政府”。中央政府通常的作用负责全国事务,如起草国家宪法和适用全国的法律、负责国防、外交以及代表本国和其他国家签署条约等。汉语中,中央政府常簡稱為「中央」,相对中央政府而言即有地方政府,简称“地方”。.

新!!: 统计学和中央政府 · 查看更多 »

主成分分析

在多元统计分析中,主成分分析(Principal components analysis,PCA)是一種分析、簡化數據集的技術。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。由于主成分分析依赖所给数据,所以数据的准确性对分析结果影响很大。 主成分分析由卡爾·皮爾遜於1901年發明,用於分析數據及建立數理模型。其方法主要是通過對共變異數矩陣進行特征分解,以得出數據的主成分(即特征向量)與它們的權值(即特征值)。PCA是最簡單的以特征量分析多元統計分布的方法。其結果可以理解為對原數據中的方差做出解釋:哪一個方向上的數據值對方差的影響最大?換而言之,PCA提供了一種降低數據維度的有效辦法;如果分析者在原數據中除掉最小的特征值所對應的成分,那麼所得的低維度數據必定是最優化的(也即,這樣降低維度必定是失去訊息最少的方法)。主成分分析在分析複雜數據時尤為有用,比如人臉識別。 PCA是最简单的以特征量分析多元统计分布的方法。通常情况下,这种运算可以被看作是揭露数据的内部结构,从而更好的解释数据的变量的方法。如果一个多元数据集能够在一个高维数据空间坐标系中被显现出来,那么PCA就能够提供一幅比较低维度的图像,这幅图像即为在讯息最多的点上原对象的一个‘投影’。这样就可以利用少量的主成分使得数据的维度降低了。 PCA跟因子分析密切相关,并且已经有很多混合这两种分析的统计包。而真实要素分析则是假定底层结构,求得微小差异矩阵的特征向量。.

新!!: 统计学和主成分分析 · 查看更多 »

布莱兹·帕斯卡

布莱兹‧帕斯卡(Blaise Pascal,),法国神學家、哲学家、数学家、物理学家、化學家、音樂家、教育家、氣象學家。帕斯卡早期进行自然和应用科学的研究,对机械计算器的制造和流体的研究作出重要贡献,扩展托里切利的工作,澄清了压强和真空的概念。帕斯卡还有力地为科学方法辩护。数学上,帕斯卡促成了两个重要的新研究领域。他16岁写出一篇题为射影几何的论文,1654年开始与皮埃尔·德·费马通信,討論概率论,深刻影响了现代经济学和社会科学的发展。 1654年末一次信仰上的神秘经历后,他离开数学和物理学,专注于沉思和神学与哲学写作。他是堅定的詹森教派信徒,人文思想大受蒙田影響。宗教論戰之作《》(Lettres provinciales)被奉為法文寫作的典範,身後其筆記本被編為《思想錄》。.

新!!: 统计学和布莱兹·帕斯卡 · 查看更多 »

廣義線性模式

#重定向 廣義線性模型.

新!!: 统计学和廣義線性模式 · 查看更多 »

代表

代表可以指:;名詞.

新!!: 统计学和代表 · 查看更多 »

估计理论

估计理论是统计学和信号处理中的一个分支,主要是通过测量或经验数据来估计概率分布参数的数值。这些参数描述了实质情况或实际对象,它们能够回答估计函数提出的问题。 例如,估计投票人总体中,给特定候选人投票的人的比例。这个比例是一个不可观测的参数,因为投票人总体很大;估计值建立在投票者的一个小的随机采样上。 又如,雷达的目的是物体(飞机、船等)的定位。这种定位是通过分析收到的回声(回波)来实现的,定位提出的问题是“飞机在哪里?”为了回答这个问题,必须估计飞机到雷达之间的距离。如果雷达的绝对位置是已知的,那么飞机的绝对位置也是可以确定的。 在估计理论中,通常假定信息隐藏在包含雜訊的信号中。噪声增加了不确定性,如果没有不确定性,那么也就没有必要估计了。.

新!!: 统计学和估计理论 · 查看更多 »

心理学

-- 心理学是一门研究人類以及其他动物的內在心理歷程、精神功能和外在行为的科学,既是一门理论学科,也是一门应用学科。包括理论心理学与应用心理学两大领域。 心理學研究涉及意識、感覺、知覺、認知、動機、情绪、人格、行為和人際關係等眾多領域,影響其他學科的發展,例如:教育學、管理學、傳播學、社會學、經濟學、精神病學、統計學、計算機科學以及文學等等。心理學一方面嘗試用大腦運作來解釋個体基本的行為與心理機能,同時,心理學也嘗試解釋個體心理機能在社會行為與社會動力中的角色。心理學家從事基礎研究的目的是描述、解釋、預測和控制行為。應用心理學家還有第五個目的——提高人類生活的質量。這些目標構成了心理學事業的基礎。.

新!!: 统计学和心理学 · 查看更多 »

医疗卫生

一个国家的医疗卫生包括该国家内所有保障和提高国家人民的健康、治疗疾病和受伤的人员、组织、系统、规则和过程。.

新!!: 统计学和医疗卫生 · 查看更多 »

哲学

哲學(philosophy)是研究普遍的、根本的问题的学科,包括存在、知识、价值、理智、心灵、语言等领域。哲学与其他学科的不同是其批判的方式、通常是系统化的方法,并以理性论证為基礎。在日常用语中,其也可被引申为个人或团体的最基本信仰、概念或态度。.

新!!: 统计学和哲学 · 查看更多 »

商业

商业(Commerce),是一种有组织的提供顾客所需的商品与服务的一种行为。中文之“商业”含义指社会分工出现的有组织的贸易行为,现代概念指流通领域的所有产业,多与贸易合称“商业贸易”。大多数的商业行为是通过以成本以上的价格卖出商品或服务来營利,如微软、索尼、IBM、联想、通用都是營利性的商业组织典型的代表。然而某些商业行为只是为了提供运营商业所需的基本资金,一般称这种商业行为为非營利性的,如各种基金会,以及红十字会等。 一般認為商業行為成立的條件有以下幾點:.

新!!: 统计学和商业 · 查看更多 »

前5世纪

前500年至前401年的这一段期间被称为前5世纪。按史记,在前476年,春秋时代结束,战国时代开始。.

新!!: 统计学和前5世纪 · 查看更多 »

因果

因果可以指:.

新!!: 统计学和因果 · 查看更多 »

皮埃爾·德·費馬

埃爾·德·費馬(姓氏依發音亦作費爾瑪。Pierre de Fermat,,法語發音),法國律師、業餘數學家(也被称为数学大师、业余数学家之王)。他在數學上的成就不低于職業數學家,似乎對數論最有興趣,亦對現代微積分的建立有所貢獻。.

新!!: 统计学和皮埃爾·德·費馬 · 查看更多 »

皮尔逊积矩相关系数

在统计学中,皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,又称作 PPMCC或PCCs, 文章中常用r或Pearson's r表示)用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。在自然科学领域中,该系数广泛用于度量两个变量之间的相关程度。它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来。J.

新!!: 统计学和皮尔逊积矩相关系数 · 查看更多 »

社会科学

会科学是用科学的方法,研究人类社会的種種现象。如社會學研究人類社會(主要是當代),政治學研究政治、政策和有關的活動,經濟學研究資源分配。广义的“社会科学”,是人文学科和社会科学的统称。 社會科學起源於西元1930年出版的《社會科學百科全書》(Encyclopaedia of the Social Sciences),其內容包含了社會學、人類學、經濟學、政治學、犯罪學、生物學、地理學、醫學、教育學、心理學、語言學、倫理學、藝術、社會工作學及法律學等與社會科學概論相關的一門學科。.

新!!: 统计学和社会科学 · 查看更多 »

神经网络

经网络可以指:.

新!!: 统计学和神经网络 · 查看更多 »

第一型及第二型錯誤

一型及第二型错误(Type I error & Type II error)或型一錯誤及型二錯誤為统计学中推論統計學的名詞。 在假設检验中,有一種假設稱為“零假设(虛無假設)”。假設檢定的目的就是利用統計的方式,推測零假设是否成立。若零假设(虛無假設)事實上成立,但統計檢驗的結果不支持零假设(拒絕零假设),這種錯誤稱為第一型錯誤。若零假设事實上不成立,但統計檢驗的結果支持零假设(接受零假设),這種錯誤稱為第二型錯誤。 以利用驗孕棒驗孕為例,此時未懷孕為零假设。若用驗孕棒為一位未懷孕的女士驗孕,結果是已懷孕,這是第一型錯誤。若用驗孕棒為一位孕婦驗孕,結果是未懷孕,這是第二型錯誤。.

新!!: 统计学和第一型及第二型錯誤 · 查看更多 »

等级线性模型

等级线性模型(Hierarchical Linear Model、简称 HLM)也称为mixed-effect model,random-effect models或者multilevel linear models,是一种复杂的统计模型。在计量经济学文献中也常常被称为Random-coefficient regression models(Rosenberg, 1973; Longford, 1993)。在某些统计学文献种也被称为Covariance components models(Dempster, Rubin, & Tsutakawa, 1981; Longford, 1987)。现在广泛被使用的名称Hierarchical Linear Model最早出现于1972年Lindley and Smith的论文以及1973年Smith的论文。 HLM的大量使用出现于80年代后半,一直至今。最典型的应用在于美国的教育研究领域。因为教育数据被认为具有最典型的层次结构(Nested Structure),通常是学生置身于教室,教室置身于学校(students nested in classrooms, or classrooms nested in schools, etc)。这种数据结构导致了经典回归分析的独立性假设遭到违反。.

新!!: 统计学和等级线性模型 · 查看更多 »

统计学家列表

以下列出了统计学家,或对统计学理论、概率论或机器学习相关领域作出过突出贡献的人。.

新!!: 统计学和统计学家列表 · 查看更多 »

统计图形

统计图形,又称为统计图、统计学图形、图解方法、图解技术、图解分析方法或图解分析技术,是指统计学领域当中用于可视化定量数据的信息图形。有时,人们也把统计图形与各种统计学表格统称为统计图表或统计学图表。.

新!!: 统计学和统计图形 · 查看更多 »

置信区间

在统计学中,一个概率样本的置信区间(Confidence interval),是对这个样本的某个总体参数的区间估计。置信区间展现的是,这个总体参数的真实值有一定概率落在與該测量结果有關的某對應區間。置信区间给出的是,聲稱总体参数的真實值在测量值的區間所具有的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率落在50%和60%之区间的机率為95%,因此他的真实支持率不足50%的可能性小于2.5%(假设分布是对称的)。 如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信区间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。 对置信区间的计算通常要求对估计过程的假设(因此属于参数统计),比如说假设估计的误差是成正态分布的。 置信区间只在频率统计中使用。在中的对应概念是可信区间。但是可信区间和置信区间是建立在不同的概念基础上的,因此一般上说取值不会一样。置信空间表示通过计算估计值所在的区间。置信水平表示准确值落在这个区间的概率。置信区间表示具体值范围,置信水平是个概率值。例如:估计某件事件完成会在10~12日之间,但这个估计准确性大约只有80%:表示置信区间(10,12,置信水平80%。要想提高置信水平,就要放宽信賴區間。.

新!!: 统计学和置信区间 · 查看更多 »

病例對照研究

病例對照研究是流行病學的其中一種研究設計。它是一種較廉宜及慣常使用的流行病學研究,只需少數的研究人員(甚至只是一個)及單一的設備,且不涉及有結構的試驗。它的方法是指向一系列的重要發現及先例,其可信性卻有受質疑的地方,但因它過往的成功,現時廣泛被醫學界所接受。 病例對照研究的最大成功是由理查德·多尔爵士及其他科學家所發現吸煙與肺癌之間的關係。多爾在大量的病例中成功證明了兩者在統計上重要的關聯。但懷疑者(包括煙草業人士)爭辯病例對照研究根本不能證實成因,但在最近的雙盲的預測研究中已確定病例對照研究的結果,而現時已接受差不多所有因肺癌而死亡的人都是因吸煙所導致的。.

新!!: 统计学和病例對照研究 · 查看更多 »

生产率

生产率是一個經濟學术语,是指由原材料變成產品的過程中的效能和效率表現,是每单位投入的产出。生产率的提高是由于资本或劳动力效率的提高,但将资本生产率和劳动生产率分开计算常常不可能的,通常情况下,生产率这一概念一般限于劳动生产率。 生产率是有效運用創意和資源,提高產品和服務的附加價值,是某段時間內每一單位勞動投入所得的產量,以較少的資源投入生產出較多的產品即是生产率提高。今日人類工作時間並非比古代人更長,而是在工作上透過科技而更有效率因此獲得比古代人富足的生活,生产率提高是經濟成長的真正本源,能帶來長遠的經濟效益及提高生活水平。.

新!!: 统计学和生产率 · 查看更多 »

生物統計學

生物統計學(有时也称生物计量學)是统计学的原理和方法在生物学研究中的应用,是一门应用数学,最常见的是应用于医学。.

新!!: 统计学和生物統計學 · 查看更多 »

相关

在概率论和统计学中,相关(Correlation,或称相关系数或关联系数),显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许多根据数据特点而定义的用来衡量数据相关的系数。.

新!!: 统计学和相关 · 查看更多 »

随机变量

給定樣本空间(S, \mathbb),如果其上的實值函數 X:S \to \mathbb是\mathbb (實值)可測函數,则稱X為(實值)随机变量。初等概率論中通常不涉及到可測性的概念,而直接把任何X:S \to \mathbb的函數稱為随机变量。 如果X指定给概率空间S中每一个事件e有一个实数X(e),同时针对每一个实数r都有一个事件集合A_r与其相对应,其中A_r.

新!!: 统计学和随机变量 · 查看更多 »

隨機

#重定向 随机性.

新!!: 统计学和隨機 · 查看更多 »

聚类分析

聚类分析(Cluster analysis,亦称为群集分析)是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。 一般把数据聚类归纳为一种非監督式學習。.

新!!: 统计学和聚类分析 · 查看更多 »

非线性

#重定向 非線性系統.

新!!: 统计学和非线性 · 查看更多 »

频率分析

频率分析在数学、物理学和信号处理中是一种分解函数、波形、或者信号的频率组成,以获取频谱的方法。 在密码学中,频率分析是指研究字母或者字母组合在文本中出现的频率。应用频率分析可以破解古典密码。 频率分析基于如下原理:在任何一种书面语言中,不同的字母或字母组合出现的频率各不相同。而且,对于以这种语言书写的任意一段文本,都具有大致相同的特征字母分布。比如,在英语中,字母E出现的频率很高,而X则出现得较少。类似地,ST、NG、TH,以及QU等双字母组合出现的频率非常高,NZ、QJ组合则极少。英语中出现频率最高的12个字母可以简记为“ETAOIN SHRDLU”。.

新!!: 统计学和频率分析 · 查看更多 »

高階管理人員

階管理人員、高級管理人員、執行管理人員、行政管理人員和管理階層等皆指企業、組織內的高級經理人或高級管理團隊。一般而言,他們負起公司例行公務的種種責任,也擁有來自董事會或主要股東所授予之特定的執行權力。有部份企業為強化他們的職權等,會另外授予他們執行董事的職銜。而如果他們本身就是合夥人或股東,執行董事也是他們另一個重要的職稱。 雖然他們要負起例行公務的責任,然而主要職司實是行政管理或重大公司政策的執行等。在專案管理中,高階管理人員更須負責授權專案財務事宜。 高階管理人員可以是高級管理人、高階管理層、高層、較高層級,或是可簡稱為資深人員的泛稱。.

新!!: 统计学和高階管理人員 · 查看更多 »

议会

议会是立法机关的一種型態,由人民中選出一定數量的代表者組成以執行立法權;這些代表者稱為議員,可以透過直接选举或间接选举產生、也可能是委任的。議會常用來指稱民主國家的立法機關,由於其運作內容很大部分來自人民的意向,因此亦被稱為「民意機關」;而國家層級的議會,又稱為國家議會,簡稱「國會」。 現代民主国家的议会一般都以歷史最悠久的英国國會作为典範,英國是第一個君主立憲議會制國家,奉行兩院制。虽然议会普遍被視為民主國家體系的一環,但部分非民主国家也有形式上的议会。当今世界,议会承受着来自公众的前所未有的监察和压力,在国家政治生活中扮演越发重要的角色。 國會內一般分為執政黨及反對黨,在正常情況下,前者是輔助支持中央政府施政,所以中央政府推出的政策等,通常作出對中央政府有利的發言辯論及投贊成票,期望順利通過所有議/法案,而後者則反之亦然,甚至作出任何形式對抗;所以不論前或後者在議會內的議員人數非常重要。 國會的首長稱為「議長」,之下有「副議長」,再之下還有各事務「委員會主席」,他/她們都是由議員互選或內部進升;只有「秘書長」是政府委任的官員,所以秘書長沒有發言、投票或裁決權,只有審批文件的權利。 國會大廈的建築規模,通常代表著議會的權威和尊嚴,象徵主權在民和議會至上。.

新!!: 统计学和议会 · 查看更多 »

误差

误差(errors)是实验科学术语。指测量结果偏离真值的程度。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即使使用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。數值計算分为绝对误差和相对误差。也可以根据误差来源分为系统误差(又称可定誤差、已定誤差)、随机误差(又称机会误差、未定誤差)和毛誤差(又稱粗差)。.

新!!: 统计学和误差 · 查看更多 »

试验设计

试验设计(Design of experiments),又称實驗設計,是数理统计学的一个分支,科學探究的一部份,涉及「用何方法可更好的設計一個實驗」,屬於方法論的範疇。由於任何實驗都會受到外來環境影響,如何設計實驗,使外來環境的變化能夠對實驗造成最小的影響,就是實驗規劃的目的。實驗設計法廣泛用於自然科學及社會科學各學科的實驗設計裡。.

新!!: 统计学和试验设计 · 查看更多 »

谎言,该死的谎言,统计数字

谎言,该死的谎言,统计数字(英文:Lies, damned lies, and statistics),是一句著名的西方谚语。主要描述数字的说服能力,特别是用来讽刺一些使用统计数字支持、但毫无说服力的分析报告,以及人们倾向于贬低那些不支持其立场的统计结论。.

新!!: 统计学和谎言,该死的谎言,统计数字 · 查看更多 »

資料

#重定向 数据.

新!!: 统计学和資料 · 查看更多 »

資料科學

#重定向 数据科学.

新!!: 统计学和資料科學 · 查看更多 »

贝叶斯概率

贝叶斯概率(Bayesian probability)是由贝叶斯理论所提供的一种对概率的解释,它采用将概率定义为某人对一个命题信任的程度的概念。贝叶斯理论同时也建议贝叶斯定理可以用作根据新的信息导出或者更新现有的置信度的规则。.

新!!: 统计学和贝叶斯概率 · 查看更多 »

輕率概化

輕率概化(hasty generalization),又稱不當概化(inappropriate generalization)、錯誤概化(faulty generalization)、範例肯證(proof by example)等等,是一種非形式謬誤,係指未充分考慮一般性的情形,只憑不充足或不具代表性的實例或樣本就推論出歸納性的結論。與之相反的謬誤是拒絕承認一切一般性結論的懶於歸納。.

新!!: 统计学和輕率概化 · 查看更多 »

迴歸分析

迴歸分析()是一種統計學上分析數據的方法,目的在於了解兩個或多個變數間是否相關、相關方向與強度,並建立數學模型以便觀察特定變數來預測研究者感興趣的變數。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。 迴歸分析是建立因變數Y(或稱依變數,反應變數)與自變數X(或稱獨變數,解釋變數)之間關係的模型。簡單線性回歸使用一個自變量X,複迴歸使用超過一個自變量(X_1, X_2...

新!!: 统计学和迴歸分析 · 查看更多 »

霍桑效应

霍桑效应(Hawthorne effect),又称霍索恩效应,是心理学上的一种实验者效应,是指当被观察者知道自己成为被观察对象而改变行为倾向的反应。霍桑效应起源于1927年至1932年期间,美国哈佛大学心理学教授埃尔顿·梅奥带领学生和研究人员在西方電器公司()位于伊利诺伊州的霍桑工厂()进行的一系列心理学实验。.

新!!: 统计学和霍桑效应 · 查看更多 »

蒙提霍爾問題

蒙提霍爾問題,亦稱為蒙特霍問題或三門問題(英文:Monty Hall problem),是一個源自博弈論的數學遊戲問題,大致出自美國的電視遊戲節目。問題的名字來自該節目的主持人蒙蒂·霍尔。 這個遊戲的玩法是:參賽者會看見三扇關閉了的門,其中一扇的後面有一輛汽車或者是獎品,選中後面有車的那扇門就可以贏得該汽車或獎品,而另外兩扇門後面則各藏有一隻山羊。當參賽者選定了一扇門,但未去開啟它的時候,知道門后情形的節目主持人會開啟剩下兩扇門的其中一扇,露出其中一隻山羊。主持人其後會問參賽者要不要換另一扇仍然關上的門。問題是:換另一扇門會否增加參賽者贏得汽車的機會率?如果嚴格按照上述的條件的話,答案是會。—換門的話,贏得汽車的機率是2/3。 這條問題亦被叫做蒙提霍爾悖論:雖然該問題的答案在邏輯上並不自相矛盾,亦不違反直覺。這問題曾引起一陣熱烈的討論。.

新!!: 统计学和蒙提霍爾問題 · 查看更多 »

肯迪

肯迪(),全名艾布·优素福·叶尔孤白·本·伊斯哈格·本·萨巴赫·肯迪(أبو يوسف يعقوب إبن إسحاق الكندي,拉丁化:),中世纪阿拉伯的著名哲学家、自然科学家,亚里士多德学派的主要代表人物之一。 Category:阿拉伯数学家 Category:阿拉伯天文学家 Category:阿拉伯物理学家 Category:阿拉伯哲学家 Category:9世紀哲學家.

新!!: 统计学和肯迪 · 查看更多 »

自助法

在统计学中,自助法(Bootstrap Method,Bootstrapping或自助抽樣法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上發表。當樣本來自总體,能以正态分布來描述,其抽樣分布(Sampling Distribution)為正态分布(The Normal Distribution);但當樣本來自的总體無法以正态分布來描述,則以漸進分析法、自助法等來分析。採用隨機可置換抽樣(random sampling with replacement)。对于小数据集,自助法效果很好。.

新!!: 统计学和自助法 · 查看更多 »

自然科学

自然科学是研究大自然中有机或无机的事物和现象的科学。自然科学包括天文學、物理学、化学、地球科学、生物学等等。.

新!!: 统计学和自然科学 · 查看更多 »

英語

#重定向 英语.

新!!: 统计学和英語 · 查看更多 »

零假设

在推论统计学中,零假设(null hypothesis,又译--、原假设,符号:H0)是做统计检验时的一类假设。零假设的内容一般是希望能证明为错误的假设,或者是需要着重考虑的假设。 比如说,在相关性检验中,一般会取“两者之间无关联”作为零假设,而在独立性检验中,一般会取“两者之间非獨立”作为零假设。与零假设相对的是备择假设(对立假设,alternative hypothesis),即希望证明是正确的另一种可能。从数学上来看,零假设和备择假设的地位是相等的,但是在统计学的实际运用中,常常需要强调一类假设为应当或期望实现的假设。如果一个统计检验的结果拒绝零假设(结论不支持零假设),而实际上真实的情况属于零假设,那么称这个检验犯了第一类错误。反之,如果检验结果支持零假设,而实际上真实的情况属于备择假设,那么称这个检验犯了第二类错误。通常的做法是,在保持第一类错误出现的机会在某个特定水平上的时候(即显著性差异值或α值),尽量减少第二类错误出现的概率。.

新!!: 统计学和零假设 · 查看更多 »

雙盲

雙盲是科學方法的一種,目的是避免研究結果受安慰劑效應或觀察者偏向所影響。在各種科學研究領域中,從醫學、食品、心理到社會科學及法證都有使用雙盲方法進行實驗。.

新!!: 统计学和雙盲 · 查看更多 »

推論統計學

推断统计学(或称统计推断,statistical inference),指统计学中,研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。更概括地说,是在一段有限的时间内,通过对一个随机过程的观察来进行推断的。 统计学中,统计推断与描述统计相对应。 统计推断的結果常用來決定下一步的作法,可能是要做更深入的試驗或問卷,或是是決定是否要實行某項方案。.

新!!: 统计学和推論統計學 · 查看更多 »

条形统计图

长条图(德文: Säulendiagramm、英文:bar chart、西班牙文: diagrama de barras)亦称条图(德文: Stabdiagramm、英文:bar graph、西班牙文: diagrama de columnas)、条状图、棒形圖、柱状图,是一种以长方形的长度为变量的統計圖表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列,或用多维方式表达。 繪製長條圖時,長條柱或柱組中線須對齊項目刻度。相較之下,折線圖則是將數據代表之點對齊項目刻度。在數字大且接近時,兩者皆可使用波浪形省略符號,以擴大表現數據間的差距,增強理解和清晰度。 类似的图形表达为直方图,不过后者较长条图而言更复杂(直方图可以表达两个不同的变量)。.

新!!: 统计学和条形统计图 · 查看更多 »

概率

--率,舊稱--率,又称或然率、機會率或--、可能性,是数学概率论的基本概念,是一个在0到1之间的实数,是对随机事件发生之可能性的度量。 概率常用來量化對於某些不確定命題的想法"Kendall's Advanced Theory of Statistics, Volume 1: Distribution Theory", Alan Stuart and Keith Ord, 6th Ed, (2009), ISBN 978-0-534-24312-8,命題一般會是以下的形式:「某個特定事件會發生嗎?」,對應的想法則是:「我們可以多確定這個事件會發生?」。確定的程度可以用0到1之間的數值來表示,這個數值就是機率William Feller, "An Introduction to Probability Theory and Its Applications", (Vol 1), 3rd Ed, (1968),Wiley,ISBN 978-0-471-25708-0。因此若事件發生的機率越高,表示我們越認為這個事件可能發生。像丟銅板就是一個簡單的例子,正面朝上及背面朝上的兩種結果看來機率相同,每個的機率都是1/2,也就是正面朝上及背面朝上的機率各有50%。 這些概念可以形成機率論中的數學公理(參考概率公理),在像數學、統計學、金融、博弈論、科學(特別是物理)、人工智慧/機器學習、電腦科學及哲學等學科中都會用到。機率論也可以描述複雜系統中的內在機制及規律性。.

新!!: 统计学和概率 · 查看更多 »

概率分布

概率分布(Wahrscheinlichkeitsverteilung,probability distribution)或簡稱分布,是概率論的一個概念。使用時可以有以下兩種含義:.

新!!: 统计学和概率分布 · 查看更多 »

概率论

概率论(Probability theory)是集中研究概率及随机现象的数学分支,是研究隨機性或不確定性等現象的數學。概率论主要研究对象为随机事件、随机变量以及随机过程。对于随机事件是不可能准确预测其结果的,然而对于一系列的独立随机事件——例如掷骰子、扔硬币、抽扑克牌以及輪盤等,会呈现出一定的、可以被用于研究及预测的规律,两个用来描述这些规律的最具代表性的数学结论分别是大数定律和中心极限定理。 作为统计学的数学基础,概率论对诸多涉及大量数据定量分析的人类活动极为重要,概率论的方法同样适用于其他方面,例如是对只知道系统部分状态的复杂系统的描述——统计力学,而二十世纪物理学的重大发现是以量子力学所描述的原子尺度上物理现象的概率本质。 數學家和精算師認為概率是在0至1閉區間内的數字,指定給一發生與失敗是隨機的「事件」。概率P(A)根據概率公理來指定給事件A。 一事件A在一事件B確定發生後會發生的概率稱為B給之A的條件概率;其數值為。若B給之A的條件概率和A的概率相同時,則稱A和B為獨立事件。且A和B的此一關係為對稱的,這可以由一同價敘述:「當A和B為獨立事件時,P(A \cap B).

新!!: 统计学和概率论 · 查看更多 »

概率模型

概率模型(Statistical Model,也稱為Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的概率关系。从数学上讲,该模型通常被表达为(Y,P),其中Y是观测集合用来描述可能的观测结果,P是Y对应的概率分布函数集合。若使用概率模型,一般而言需假设存在一个确定的分布P生成观测数据Y。因此通常使用统计推断的办法确定集合P中谁是数据产生的原因。 大多数统计检验都可以被理解为一种概率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该概率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。.

新!!: 统计学和概率模型 · 查看更多 »

樣本

#重定向 样品.

新!!: 统计学和樣本 · 查看更多 »

標準差

標準差(又稱标准偏差、--,,缩写SD),数学符号σ(sigma),在概率統計中最常使用作為測量一組數值的離散程度之用。標準差定義:為方差開算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率。測量到分佈程度的結果,原則上具有兩種性質:.

新!!: 统计学和標準差 · 查看更多 »

最小二乘法

最小二乘法(又称--)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。 利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。 “最小平方法”是對過度確定系統,即其中存在比未知數更多的方程組,以迴歸分析求得近似解的標準方法。在這整個解決方案中,最小平方法演算為每一方程式的結果中,將殘差平方和的總和最小化。 最重要的應用是在曲線擬合上。最小平方所涵義的最佳擬合,即殘差(殘差為:觀測值與模型提供的擬合值之間的差距)平方總和的最小化。當問題在自變量(x變量)有重大不確定性時,那麼使用簡易迴歸和最小平方法會發生問題;在這種情況下,須另外考慮變量-誤差-擬合模型所需的方法,而不是最小平方法。 最小平方問題分為兩種:線性或普通的最小平方法,和非線性的最小平方法,取決於在所有未知數中的殘差是否為線性。線性的最小平方問題發生在統計迴歸分析中;它有一個封閉形式的解決方案。非線性的問題通常經由迭代細緻化來解決;在每次迭代中,系統由線性近似,因此在這兩種情況下核心演算是相同的。 最小平方法所得出的多項式,即以擬合曲線的函數來描述自變量與預計應變量的變異數關係。 當觀測值來自指數族且滿足輕度條件時,最小平方估計和最大似然估计是相同的。最小平方法也能從動差法得出。 以下討論大多是以線性函數形式來表示,但對於更廣泛的函數族,最小平方法也是有效和實用的。此外,迭代地將局部的二次近似應用於或然性(藉由費雪信息),最小平方法可用於擬合廣義線性模型。 其它依據平方距離的目標加總函數作為逼近函數的主題,請參見最小平方法(函數近似)。 最小平方法通常歸功於高斯(Carl Friedrich Gauss,1795),但最小平方法是由阿德里安-马里·勒让德(Adrien-Marie Legendre)首先發表的。.

新!!: 统计学和最小二乘法 · 查看更多 »

显著性差异

顯著性差異(ρ),是統計學上對數據差異性的評價。 當數據之間具有了顯著性差異,就說明參與比對的數據不是來自於同一總體(population),而是來自於具有差異的兩個不同總體。.

新!!: 统计学和显著性差异 · 查看更多 »

斯皮尔曼等级相关系数

在 统计学中, 以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数, 经常用希腊字母 \rho (rho) 或者 r_s表示。 它是衡量两个变量的依赖性的 非参数 指标。 它利用单调方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为 +1 或 −1 。.

新!!: 统计学和斯皮尔曼等级相关系数 · 查看更多 »

方差分析

變異數分析或變方分析(Analysis of variance,簡稱ANOVA)為資料分析中常見的統計模型,主要為探討連續型(Continuous)資料型態之因变量(Dependent variable)與類別型資料型態之自变量(Independent variable)的關係,當自變項的因子中包含等於或超過三個類別情況下,檢定其各類別間平均數是否相等的統計模式,廣義上可將T檢定中變異數相等(Equality of variance)的合併T檢定(Pooled T-test)視為是變異數分析的一種,基於T檢定為分析兩組平均數是否相等,並且採用相同的計算概念,而實際上當變異數分析套用在合併T檢定的分析上時,產生的F值則會等於T檢定的平方項。 變異數分析依靠F-分布為機率分布的依據,利用平方和(Sum of square)與自由度(Degree of freedom)所計算的組間與組內均方(Mean of square)估計出F值,若有顯著差異則考量進行或稱多重比較(Multiple comparison),較常見的為、與Bonferroni correction,用於探討其各組之間的差異為何。 在變異數分析的基本運算概念下,依照所感興趣的因子數量而可分為單因子變異數分析、雙因子變異數分析、多因子變異數分析三大類,依照因子的特性不同而有三種型態,固定效應變異數分析(fixed-effect analysis of variance)、隨機效應變異數分析(random-effect analysis of variance)與混合效應變異數分析(Mixed-effect analaysis of variance),然而第三種型態在後期發展上被認為是Mixed model的分支,關於更進一步的探討可參考Mixed model的部份。 變異數分析優於兩組比較的T檢定之處,在於後者會導致多重比較(multiple comparisons)的問題而致使第一型錯誤(Type one error)的機會增高,因此比較多組平均數是否有差異則是變異數分析的主要命題。 在统计学中,方差分析(ANOVA)是一系列统计模型及其相关的过程总称,其中某一变量的方差可以分解为归属于不同变量来源的部分。其中最简单的方式中,方差分析的统计测试能够说明几组数据的平均值是否相等,因此得到两组的T檢定。在做多组双变量T檢定的时候,错误的機率会越来越大,特别是第一型錯誤,因此方差分析只在二到四组平均值的时候比较有效。.

新!!: 统计学和方差分析 · 查看更多 »

时间序列分析

#重定向 時間序列.

新!!: 统计学和时间序列分析 · 查看更多 »

政府

政府是一个政治体系,於某个區域訂立、執行法律和管理的一套机构。广义的政府包括立法机关、行政机关、司法机关、军事机关,狭义的政府仅指行政机关;在内阁制国家,“政府”一词也用來指代表国家最高行政机构的核心,即“内阁”。 政府也是一种权力分配的格局。不仅是司法权、立法权和行政权之间的关系,也是中央政府与地方政府之间的关系,甚至也包括了政府各部门单位之间以及公务员之间的权力分配。 政府是组成国家整体的一个幫派,政府隶属于国家。因此执政政府的倒台或政权的更替并不意味着国家的灭亡,而如果国家灭亡了,政府也就不可能存在。公民对于国家的合法性存在认同性高于对政府的认同性。 政府也是一种组织,区别于一般的社会组织,政府权力的取得必须具有合法性,同时具有强制性和权威性。权力只为权力来源负责,政府也不例外。如果政府的权力来源恰好是国民或公民,政府就对国民公民负责,为公共利益服务。 政府依照法律行使执法权,如果超出法律赋予的权限范围,就是“滥用职权”;如果没有完全行使执法权,就是“不作为”。两者都是政府的错误。.

新!!: 统计学和政府 · 查看更多 »

政治家

政治家(statesman),在中文裡是一個正面的名詞,用於正面肯定的用法,與具有貶意的「政客」一詞的用法不同。「政治家」一般是指從事或积极投入政治的人,且其有理想,能為國家與人民著想,其動機著眼於民眾的福祉、世界的和平與發展。許多人確實在政治上相當有建樹,堪稱國之棟樑,或為後世之楷模。他们通常對政府管理事務非常熟練,或者在促進國民福祉及全體利益上有重大的影響力。.

新!!: 统计学和政治家 · 查看更多 »

数学

数学是利用符号语言研究數量、结构、变化以及空间等概念的一門学科,从某种角度看屬於形式科學的一種。數學透過抽象化和邏輯推理的使用,由計數、計算、量度和對物體形狀及運動的觀察而產生。數學家們拓展這些概念,為了公式化新的猜想以及從選定的公理及定義中建立起嚴謹推導出的定理。 基礎數學的知識與運用總是個人與團體生活中不可或缺的一環。對數學基本概念的完善,早在古埃及、美索不達米亞及古印度內的古代數學文本便可觀見,而在古希臘那裡有更為嚴謹的處理。從那時開始,數學的發展便持續不斷地小幅進展,至16世紀的文藝復興時期,因为新的科學發現和數學革新兩者的交互,致使數學的加速发展,直至今日。数学并成为許多國家及地區的教育範疇中的一部分。 今日,數學使用在不同的領域中,包括科學、工程、醫學和經濟學等。數學對這些領域的應用通常被稱為應用數學,有時亦會激起新的數學發現,並導致全新學科的發展,例如物理学的实质性发展中建立的某些理论激发数学家对于某些问题的不同角度的思考。數學家也研究純數學,就是數學本身的实质性內容,而不以任何實際應用為目標。雖然許多研究以純數學開始,但其过程中也發現許多應用之处。.

新!!: 统计学和数学 · 查看更多 »

数理统计学

数理统计(Mathematical statistics)是统计学的数学基础,从数学的角度去研究统计学,为各种应用统计学提供理论支持。.

新!!: 统计学和数理统计学 · 查看更多 »

数据

資料(data),是指未經過處理的原始記錄。一般而言,資料缺乏組織及分類,無法明確的表達事物代表的意義,它可能是一堆的雜誌、一大疊的報紙、數種的開會記錄或是整本病人的病歷紀錄。資料描述事物的符号记录,是可定义为意义的实体,涉及事物的存在形式。是关于事件之一组离散且客观的事实描述,是构成訊息和知识的原始材料。.

新!!: 统计学和数据 · 查看更多 »

数据挖掘

数据挖掘(data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。除了原始分析步骤,它还涉及到数据库和数据管理方面、、模型与推断方面考量、兴趣度度量、复杂度的考虑,以及发现结构、可视化及在线更新等后处理。数据挖掘是“資料庫知識發現”(KDD)的分析步骤。数据挖掘:实用机器学习技术及Java实现》一书大部分是机器学习的内容。这本书最初只叫做“实用机器学习”,“数据挖掘”一词是后来为了营销才加入的。通常情况下,使用更为正式的术语,(大规模)数据分析和分析学,或者指出实际的研究方法(例如人工智能和机器学习)会更准确一些。 数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息,例如数据的分组(通过聚类分析)、数据的异常记录(通过异常检测)和数据之间的关系(通过关联式规则挖掘)。这通常涉及到数据库技术,例如。这些潜在信息可通过对输入数据处理之后的总结来呈现,之后可以用于进一步分析,比如机器学习和预测分析。举个例子,进行数据挖掘操作时可能要把数据分成多组,然后可以使用决策支持系统以获得更加精确的预测结果。不过数据收集、数据预处理、结果解释和撰写报告都不算数据挖掘的步骤,但是它们确实属于“資料庫知識發現”(KDD)过程,只不过是一些额外的环节。 类似词语“”、“数据捕鱼”和“数据探测”指用数据挖掘方法来采样(可能)过小以致无法可靠地统计推断出所发现任何模式的有效性的更大总体数据集的部分。不过这些方法可以建立新的假设来检验更大数据总体。.

新!!: 统计学和数据挖掘 · 查看更多 »

教育学

教育学是研究教育现象和教育问题,揭示教育规律的一门学科,是一门研究如何培养人的科学。.

新!!: 统计学和教育学 · 查看更多 »

拉丁语

拉丁语(lingua latīna,),羅馬帝國的奧古斯都皇帝時期使用的書面語稱為「古典拉丁語」,屬於印欧语系意大利語族。是最早在拉提姆地区(今意大利的拉齐奥区)和罗马帝国使用。虽然现在拉丁语通常被认为是一种死语言,但仍有少数基督宗教神职人员及学者可以流利使用拉丁语。罗马天主教传统上用拉丁语作为正式會議的语言和礼拜仪式用的语言。此外,许多西方国家的大学仍然提供有关拉丁语的课程。 在英语和其他西方语言创造新词的过程中,拉丁语一直得以使用。拉丁语及其后代罗曼诸语是意大利语族中仅存的一支。通过对早期意大利遗留文献的研究,可以证实其他意大利语族分支的存在,之后这些分支在罗马共和国时期逐步被拉丁语同化。拉丁语的亲属语言包括法利斯克语、奥斯坎语和翁布里亚语。但是,威尼托语可能是一个例外。在罗马时代,作为威尼斯居民的语言,威尼托语得以和拉丁语并列使用。 拉丁语是一种高度屈折的语言。它有三种不同的性,名词有七格,动词有四种词性变化、六种时态、六种人称、三种语气、三种语态、两种体、两个数。七格当中有一格是方位格,通常只和方位名词一起使用。呼格与主格高度相似,因此拉丁语一般只有五个不同的格。不同的作者在行文中可能使用五到七种格。形容词与副词类似,按照格、性、数曲折变化。虽然拉丁语中有指示代词指代远近,它却没有冠词。后来拉丁语通过不同的方式简化词尾的曲折变化,形成了罗曼语族。 拉丁语與希腊语同為影響歐美學術與宗教最深的语言。在中世纪,拉丁语是当时欧洲不同国家交流的媒介语,也是研究科学、哲学和神學所必须的语言。直到近代,通晓拉丁语曾是研究任何人文学科教育的前提条件;直到20世纪,拉丁语的研究才逐渐衰落,重点转移到对當代语言的研究。.

新!!: 统计学和拉丁语 · 查看更多 »

時間序列

时间序列(time series)是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值(如1秒,5分钟,12小时,7天,1年),因此时间序列可以作为离散时间数据进行分析处理。时间序列广泛应用于数理统计、信号处理、模式识别、计量经济学、数学金融、天气预报、地震预测、脑电图、控制工程、航空学、通信工程以及绝大多数涉及到时间数据测量的应用科学与工程学。.

新!!: 统计学和時間序列 · 查看更多 »

重定向到这里:

概率与统计統計統計學统计统计学理论统计分析统计论金融统计

传出传入
嘿!我们在Facebook上吧! »