徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

决策树

指数 决策树

决策论中 (如风险管理),决策树(Decision tree)由一个决策图和可能的结果(包括资源成本和风险)组成, 用来创建到达目标的规划。决策树建立并用来辅助决策,是一种特殊的树结构。决策树是一个利用像树一样的图形或决策模型的决策支持工具,包括随机事件结果,资源代价和实用性。它是一个算法显示的方法。决策树经常在运筹学中使用,特别是在决策分析中,它帮助确定一个能最可能达到目标的策略。如果在实际中,决策不得不在没有完备知识的情况下被在线采用,一个决策树应该平行概率模型作为最佳的选择模型或在线选择模型算法。决策树的另一个使用是作为计算条件概率的描述性手段。.

15 关系: 专家系统决策论图论C4.5算法真值表随机森林運籌學风险管理马尔可夫链貝氏網路贝叶斯定理贝叶斯概率树结构方差分析数据挖掘

专家系统

专家系统是早期人工智能的一个重要分支,它可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。 一般来说,专家系统.

新!!: 决策树和专家系统 · 查看更多 »

决策论

决策论是一个交叉学科,和数学、统计、经济学、哲学、管理和心理学相关。它主要研究实际决策者如何进行决策,以及如何达到最优决策。.

新!!: 决策树和决策论 · 查看更多 »

图论

图论(Graph theory)是组合数学的一个分支,和其他数学分支,如群论、矩阵论、拓扑学有着密切关系。图是图论的主要研究对象。图是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系。 图论起源于著名的柯尼斯堡七桥问题。该问题于1736年被欧拉解决,因此普遍认为欧拉是图论的创始人。 图论的研究对象相当于一维的单纯复形。.

新!!: 决策树和图论 · 查看更多 »

C4.5算法

C4.5算法是由开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的,因此该算法也可以用于统计分类。 C4.5算法与ID3算法一样使用了信息熵的概念,并和ID3一样通过学习数据来建立决策树。.

新!!: 决策树和C4.5算法 · 查看更多 »

真值表

真值表是使用於邏輯中(特別是在連結邏輯代數、布爾函數和命題邏輯上)的一類數學用表,用來計算邏輯表示式在每種論證(即每種邏輯變數取值的組合)上的值。尤其是,真值表可以用來判斷一個命題表示式是否對所有允許的輸入值皆為真,亦即是否為邏輯有效的。 「用真值表製表的推理模式是由弗雷格、查尔斯·皮尔士和恩斯特·施羅德於1880年代所发明的。這種表格於1920年代之後廣泛地發現在許多文獻上頭(扬·武卡谢维奇、埃米爾·波斯特、维特根斯坦)”(蒯因, 39)。路易斯·卡罗早在1894年就公式化了真值表来解决特定问题,但是包含他这项工作的手稿直到1977年才被发现 。维特根斯坦的《逻辑哲学论》利用真值表把真值函数置于序列中。这个著作的广泛影响导致了真值表的传播。 真值表被用來計算以「決策程序」建構的命題表示式的值。命題表示式可以是一個原子公式(命題常數、命題變數或命題函數,如Px或P(x)),或以邏輯算子(如邏輯與(\land)、邏輯或(\lor)、邏輯非(\lnot))由原子公式建構出來的公式。舉例來說,Fx \land Gx即是個命題表示式。 真值表中的列标题展示了 (i)命题函数与/或变量,和 (ii)建造自这些命题函数或变量和运算符的真值泛函表达式。行展示对 (i)和 (ii)的T或F指派的每个可能的求值。换句话说,每行都是对 (i)和 (ii)的不同解释。 经典(就是说二值)逻辑的真值表限定于只有两个真值是可能的布尔逻辑系统,它们是“真”或“假”,通常在表中简单的表示为T和F。.

新!!: 决策树和真值表 · 查看更多 »

随机森林

在機器學習中,隨機森林是一個包含多個決策樹的分類器,並且其輸出的類別是由個別樹輸出的類別的眾數而定。 Leo Breiman和Adele Cutler發展出推論出隨機森林的演算法。而"Random Forests"是他們的商標。這個術語是1995年由貝爾實驗室的Tin Kam Ho所提出的隨機決策森林(random decision forests)而來的。這個方法則是結合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造決策樹的集合。.

新!!: 决策树和随机森林 · 查看更多 »

運籌學

运筹学(Operations Research,又被称作--),是一门應用數學学科,利用统计学和数学模型等方法,去尋找複雜問題中的最佳或近似最佳的解答。运筹学经常用于解决现实生活中的复杂问题,特别是改善或优化现有系统的效率。研究运筹学的基础知识包括矩阵论和离散数学,在应用方面多与仓储、物流等领域相关。因此运筹学与应用数学、工业工程专业密切相关。运筹学是一门研究怎么样处理事情更有效的学科,比如机械动作合理安排,计算机的多线程,高层建筑材料的合理分配,不同动植物的共同养殖等都是当今社会经济发展的热点。.

新!!: 决策树和運籌學 · 查看更多 »

风险管理

风险管理(risk management)是一个管理過程,包括對风险的定義、測量、评估和發展因應風險的策略。目的是將可避免的風險、成本及損失極小化。理想的风险管理,事先已排定优先次序,可以優先處理引發最大损失及發生機率最高的事件,其次再處理風險相對較低的事件。 實際狀況中,因為風險與發生機率通常不一致,所以難以決定處理順序。故須衡量兩者比重,做出最合适的决定。 因為牽涉到机会成本,风险管理同時也要面对如何運用有效资源的难题。把资源用于风险管理可能會減少運用在其他具有潛在報酬之活動的资源;理想的风险管理正是希望以最少的资源化解最大的危机。.

新!!: 决策树和风险管理 · 查看更多 »

马尔可夫链

尔可夫链(Markov chain),又稱離散時間馬可夫鏈(discrete-time Markov chain,縮寫為DTMC),因俄國數學家安德烈·马尔可夫(Андрей Андреевич Марков)得名,为狀態空間中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作馬可夫性質。马尔科夫链作为实际过程的统计模型具有许多应用。 在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。.

新!!: 决策树和马尔可夫链 · 查看更多 »

貝氏網路

貝氏網路(Bayesian network),又稱信念網絡(belief network)或是有向無環圖模型(directed acyclic graphical model),是一種機率圖型模型,藉由有向無環圖(directed acyclic graphs, or DAGs)中得知一組隨機變數及其n組條件機率分配(conditional probability distributions, or CPDs)的性質。舉例而言,貝氏網路可用來表示疾病和其相關症狀間的機率關係;倘若已知某種症狀下,貝氏網路就可用來計算各種可能罹患疾病之發生機率。 一般而言,貝氏網路的有向無環圖中的節點表示隨機變數,它們可以是可觀察到的變量,抑或是潛在變量、未知參數等。連接兩個節點的箭頭代表此兩個隨機變數是具有因果關係或是非條件獨立的;而两个節點間若沒有箭頭相互連接一起的情況就稱其隨機變數彼此間為條件獨立。若兩個節點間以一個單箭頭連接在一起,表示其中一個節點是「因(parents)」,另一個是「果(descendants or children)」,兩節點就會產生一個條件機率值。比方說,我們以X_i表示第i個節點,而X_i的「因」以P_i表示,X_i的「果」以C_i表示;圖一就是一種典型的貝氏網路結構圖,依照先前的定義,我們就可以輕易的從圖一可以得知: 大部分的情況下,貝氏網路適用在節點的性質是屬於離散型的情況下,且依照P(X_i|P_i)此條件機率寫出條件機率表(conditional probability table, or CPT),此條件機率表的每一--(row)列出所有可能發生的P_i,每一--(column)列出所有可能發生的X_i,且任一--的機率總和必為1。寫出條件機率表後就很容易將事情給條理化,且輕易地得知此貝氏網路結構圖中各節點間之因果關係;但是條件機率表也有其缺點:若是節點X_i是由很多的「因」所造成的「果」,如此條件機率表就會變得在計算上既複雜又使用不便。下圖為圖一貝氏網路中某部分結構圖之條件機率表。.

新!!: 决策树和貝氏網路 · 查看更多 »

贝叶斯定理

贝叶斯定理(Bayes' theorem)是概率论中的一个定理,它跟随机变量的条件概率以及边缘概率分布有关。在有些关于概率的解释中,贝叶斯定理(贝叶斯公式)能够告知我们如何利用新证据修改已有的看法。這個名稱來自於托马斯·贝叶斯。 通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A(发生)的条件下的概率是不一样的。然而,这两者是有确定的关系的,贝叶斯定理就是这种关系的陈述。贝叶斯公式的一个用途在于通过已知的三个概率函数推出第四个。 作为一个普遍的原理,贝叶斯定理对于所有概率的解释是有效的。然而,频率主义者和贝叶斯主义者对于“在应用中,某个随机事件的概率该如何被赋值?”这个问题有着不同的看法:频率主义者根据随机事件发生的频率,或者总体样本裡面的发生的个数来赋值概率;贝叶斯主义者则根据未知的命题来赋值概率。这样的理念导致贝叶斯主义者有更多的机会使用贝叶斯定理。.

新!!: 决策树和贝叶斯定理 · 查看更多 »

贝叶斯概率

贝叶斯概率(Bayesian probability)是由贝叶斯理论所提供的一种对概率的解释,它采用将概率定义为某人对一个命题信任的程度的概念。贝叶斯理论同时也建议贝叶斯定理可以用作根据新的信息导出或者更新现有的置信度的规则。.

新!!: 决策树和贝叶斯概率 · 查看更多 »

树结构

#重定向 樹狀結構.

新!!: 决策树和树结构 · 查看更多 »

方差分析

變異數分析或變方分析(Analysis of variance,簡稱ANOVA)為資料分析中常見的統計模型,主要為探討連續型(Continuous)資料型態之因变量(Dependent variable)與類別型資料型態之自变量(Independent variable)的關係,當自變項的因子中包含等於或超過三個類別情況下,檢定其各類別間平均數是否相等的統計模式,廣義上可將T檢定中變異數相等(Equality of variance)的合併T檢定(Pooled T-test)視為是變異數分析的一種,基於T檢定為分析兩組平均數是否相等,並且採用相同的計算概念,而實際上當變異數分析套用在合併T檢定的分析上時,產生的F值則會等於T檢定的平方項。 變異數分析依靠F-分布為機率分布的依據,利用平方和(Sum of square)與自由度(Degree of freedom)所計算的組間與組內均方(Mean of square)估計出F值,若有顯著差異則考量進行或稱多重比較(Multiple comparison),較常見的為、與Bonferroni correction,用於探討其各組之間的差異為何。 在變異數分析的基本運算概念下,依照所感興趣的因子數量而可分為單因子變異數分析、雙因子變異數分析、多因子變異數分析三大類,依照因子的特性不同而有三種型態,固定效應變異數分析(fixed-effect analysis of variance)、隨機效應變異數分析(random-effect analysis of variance)與混合效應變異數分析(Mixed-effect analaysis of variance),然而第三種型態在後期發展上被認為是Mixed model的分支,關於更進一步的探討可參考Mixed model的部份。 變異數分析優於兩組比較的T檢定之處,在於後者會導致多重比較(multiple comparisons)的問題而致使第一型錯誤(Type one error)的機會增高,因此比較多組平均數是否有差異則是變異數分析的主要命題。 在统计学中,方差分析(ANOVA)是一系列统计模型及其相关的过程总称,其中某一变量的方差可以分解为归属于不同变量来源的部分。其中最简单的方式中,方差分析的统计测试能够说明几组数据的平均值是否相等,因此得到两组的T檢定。在做多组双变量T檢定的时候,错误的機率会越来越大,特别是第一型錯誤,因此方差分析只在二到四组平均值的时候比较有效。.

新!!: 决策树和方差分析 · 查看更多 »

数据挖掘

数据挖掘(data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。除了原始分析步骤,它还涉及到数据库和数据管理方面、、模型与推断方面考量、兴趣度度量、复杂度的考虑,以及发现结构、可视化及在线更新等后处理。数据挖掘是“資料庫知識發現”(KDD)的分析步骤。数据挖掘:实用机器学习技术及Java实现》一书大部分是机器学习的内容。这本书最初只叫做“实用机器学习”,“数据挖掘”一词是后来为了营销才加入的。通常情况下,使用更为正式的术语,(大规模)数据分析和分析学,或者指出实际的研究方法(例如人工智能和机器学习)会更准确一些。 数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息,例如数据的分组(通过聚类分析)、数据的异常记录(通过异常检测)和数据之间的关系(通过关联式规则挖掘)。这通常涉及到数据库技术,例如。这些潜在信息可通过对输入数据处理之后的总结来呈现,之后可以用于进一步分析,比如机器学习和预测分析。举个例子,进行数据挖掘操作时可能要把数据分成多组,然后可以使用决策支持系统以获得更加精确的预测结果。不过数据收集、数据预处理、结果解释和撰写报告都不算数据挖掘的步骤,但是它们确实属于“資料庫知識發現”(KDD)过程,只不过是一些额外的环节。 类似词语“”、“数据捕鱼”和“数据探测”指用数据挖掘方法来采样(可能)过小以致无法可靠地统计推断出所发现任何模式的有效性的更大总体数据集的部分。不过这些方法可以建立新的假设来检验更大数据总体。.

新!!: 决策树和数据挖掘 · 查看更多 »

重定向到这里:

判定树

传出传入
嘿!我们在Facebook上吧! »