徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

生物信息学和脱氧核糖核酸

快捷方式: 差异相似杰卡德相似系数参考

生物信息学和脱氧核糖核酸之间的区别

生物信息学 vs. 脱氧核糖核酸

生物信息學(bioinformatics)利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。目前主要的研究方向有:序列比对、序列組裝、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。 生物学技术往往生成大量的嘈杂数据。与数据挖掘类似,生物信息学利用数学工具从大量数据中提取有用的生物学信息。生物信息学所要处理的典型问题包括:重新組裝在霰弹枪定序法测序过程中被打散的DNA序列,从蛋白质的氨基酸序列预测蛋白质结构,利用mRNA微阵列或质谱仪的数据检验基因调控的假说。 某些人将计算生物学作为生物信息学的同义词处理;但是另外一些人认为计算生物学和生物信息学应当被当作不同的条目处理,因为生物信息学更侧重於生物学领域中计算方法的使用和发展,而计算生物学强调应用信息学技术对生物学领域中的假说进行检验,并尝试发展新的理论。 生物信息学可以定义为对分子生物学中两类信息流的研究:. --氧核醣核酸(deoxyribonucleic acid,縮寫:DNA)又稱--氧核醣核酸,是一種生物大分子,可組成遺傳指令,引導生物發育與生命機能運作。主要功能是資訊儲存,可比喻為「藍圖」或「配方」。其中包含的指令,是建構細胞內其他的化合物,如蛋白質與核醣核酸所需。帶有蛋白質編碼的DNA片段稱為基因。其他的DNA序列,有些直接以本身構造發揮作用,有些則參與調控遺傳訊息的表現。 DNA是一種長鏈聚合物,組成單位稱為核苷酸,而糖類與磷酸藉由酯鍵相連,組成其長鏈骨架。每個糖單位都與四種鹼基裡的其中一種相接,這些鹼基沿著DNA長鏈所排列而成的序列,可組成遺傳密碼,是蛋白質氨基酸序列合成的依據。讀取密碼的過程稱為轉錄,是根據DNA序列複製出一段稱為RNA的核酸分子。多數RNA帶有合成蛋白質的訊息,另有一些本身就擁有特殊功能,例如核糖體RNA、小核RNA與小干擾RNA。 在細胞內,DNA能組織成染色體結構,整組染色體則統稱為基因組。染色體在細胞分裂之前會先行複製,此過程稱為DNA複製。對真核生物,如動物、植物及真菌而言,染色體是存放於細胞核內;對於原核生物而言,如細菌,則是存放在細胞質中的拟核裡。染色體上的染色質蛋白,如組織蛋白,能夠將DNA組織並壓縮,以幫助DNA與其他蛋白質進行交互作用,進而調節基因的轉錄。.

之间生物信息学和脱氧核糖核酸相似

生物信息学和脱氧核糖核酸有(在联盟百科)21共同点: 基因基因組同源中心法則分子生物学噬菌体突变系统发生学生物生物学生物化学DNA序列DNA微陣列DNA測序计算机科学蛋白质MRNA核苷酸氨基酸演化生物学数据挖掘

基因

基因一词来自希腊语,意思为“生”。是指控制生物性状的遗传信息,通常由DNA序列来承载。基因也可视作基本遗传单位,亦即一段具有功能性的DNA或RNA序列。弄清其序列本身的过程叫基因测序。基因的结构由增强子,启动子及蛋白编码序列组成:即基因产物可以是蛋白质(蛋白质编码基因)及RNA,从而控制生物个体的性状(差異)表现。在一个个体当中所有的基因总和叫基因组。在一个物种中所有等位基因的总合叫基因库。在大多数真核生物中,基因分为细胞核基因及线粒体基因,绿色植物的叶绿体也含有独立于细胞核的叶绿体基因组。人類約有一万九千至兩萬两千個基因。 在真核生物中,染色体在体细胞中是成对存在的。每条染色体上都带有一定数量的基因。一个基因在细胞有丝分裂时有两个对列的位点,称为等位基因,分别来自父与母。依所攜帶性状的表現,又可分为显性基因和隐性基因。 一般来说,同一生物体中的每个细胞體都含有相同的基因(除了已经分化的免疫细胞),但并不是每个细胞中的所有基因携带的遗传信息都会被表現出来。控制基因表达的因素分为传统的遗传学(增强子,启动子序列相关)因素及表观遗传学(DNA甲基化,组蛋白乙酰化和脱乙酰化及RNA干扰相关)因素。職司不同功能的細胞或不同的细胞类型中,活化而表現的基因也不同。在某一细胞类型当中所有被表达的基因叫转录组,所有编码蛋白质的基因叫蛋白质组。通过即时聚合酶链式反应或染色质免疫沉淀-测序可得到转录组及蛋白质组的信息。用电脑处理基因序列的学科叫生物信息学。 人类基因组计划(human genome project, HGP)是一项规模宏大,跨国跨学科的生物信息学项目。其宗旨在于测定组成人类染色体(指单倍体)的30亿个碱基对形成的核苷酸序列,从而繪製人类基因组圖譜,並且辨識其载有的基因,达到破译人类遗传信息的最终目的。该计划起始于1990年于2000年完成。.

基因和生物信息学 · 基因和脱氧核糖核酸 · 查看更多 »

基因組

在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部遗传信息,又稱基因體(genome)。基因组包括基因和非編碼DNA。1920年,德国汉堡大学植物学教授汉斯·温克勒(Hans Winkler)首次使用基因组这一名词。 更精确地讲,一个生物体的基因组是指一套染色体中的完整的DNA序列。例如,生物个体体细胞中的二倍体由两套染色体组成,其中一套DNA序列就是一个基因组。基因组一词可以特指整套核DNA(例如,核基因组),也可以用于包含自己DNA序列的细胞器基因组,如粒线体基因组或叶绿体基因组。当人们说一个有性生殖物种的基因组正在测序时,通常是指测定一套常染色体和两种性染色体的序列,这样来代表可能的两种性别。即使在只有一种性别的物种中,“一套基因组序列”可能也综合了来自不同个体的染色体。通常使用中,“遗传组成”一词有时在交流中即指某特定个体或物种的基因组。对相关物种全部基因组性质的研究通常被称为基因组学,该学科与遗传学不同,后者一般研究单个或一组基因的性质。.

基因組和生物信息学 · 基因組和脱氧核糖核酸 · 查看更多 »

同源

在生物学种系发生理论中,若两个或多个结构具有相同的祖先,则称它们同源(Homology)。这里相同的祖先既可以指演化意义上的祖先,即两个结构由一个共同的祖先演化而来(在这个意义上,蝙蝠的翅膀与人类的手臂是同源的),也可以指发育意义上的祖先,即两个结构由胚胎时期的同一组织发育而来(在这个意义上,人类女性的卵巢与男性的睾丸同源)。 同源这一概念需与相似区分开来。比如说,昆虫的翅膀、蝙蝠的翅膀和鸟类的翅膀是相似的,但却不同源,这种现象被称为非同源相似(或同形质,英文:Homoplasy)。这些相似的结构由不同的渠道演化而来,这种演化过程叫做趋同演化(Convergency)。.

同源和生物信息学 · 同源和脱氧核糖核酸 · 查看更多 »

中心法則

分子生物學的中心法则(The central dogma of molecular biology,又譯分子生物學的中心教條),首先由佛朗西斯·克里克於1958年Crick, F.H.C. (1958): Symp.

中心法則和生物信息学 · 中心法則和脱氧核糖核酸 · 查看更多 »

分子生物学

分子生物学(Molecular biology)是对生物在分子層次上的研究。这是一门生物学和化学之间跨学科的研究,其研究领域涵盖了遗传学、生物化学和生物物理学等学科。分子生物学主要致力于对细胞中不同系统之间相互作用的理解,包括DNA,RNA和蛋白质生物合成之间的关系以及了解它们之间的相互作用是如何被调控的。.

分子生物学和生物信息学 · 分子生物学和脱氧核糖核酸 · 查看更多 »

噬菌体

噬菌体(bacteriophage)是病毒的一種,其特別之處是專以細菌為宿主,較為熟知的噬菌體是以大腸桿菌為寄主的T2噬菌體。 跟別的病毒一樣,噬菌體只是一團由蛋白質外殼包裹的遺傳物質,大部分噬菌體還長有「尾巴」,用來將遺傳物質注入宿主體內。超過95%已知的噬菌體以雙螺旋結構的DNA為遺傳物質,長度由5,000個碱基对到5,000,000個碱基对不等;餘下的5%以RNA為遺傳物質。正是通過對噬菌體的研究,科學家證實基因以DNA為載體。(见赫希-蔡斯实验)整個噬菌體的長度由20納米到200納米不等。它們的基因組可含有少至四個、多至數百個基因。在注射其基因組進入細胞質後,噬菌體在細菌內複製。噬菌體是在生物圈中最常見的和多樣化的實體。 噬菌體是一種普遍存在的生物體,而且經常都伴隨着細菌。通常在一些充滿細菌群落的地方,如:泥土、動物的內臟裡,都可以找到噬菌體的蹤影。目前世上蘊含最豐富噬菌體的地方就是海水。在海平面,平均每毫升的海水即含有9×108個病毒粒子(virions),並使海水中70%的細菌受到噬菌體的感染。 噬菌体的命名是由希腊语词汇“吞噬”(φαγεῖν)的首字母Φ開始,然後加上一組序號。 在蘇聯、中歐和法國,噬菌體都曾用作抗生素的替代品,作為醫療用品的時間超過90年。英国广播公司 地平线系列(1997年):The Virus that Cures,一部关于噬菌体药物的纪录片。噬菌體治療已經被更多國家的醫師接受,它們被看作是對於許多細菌的菌株可能的治療。.

噬菌体和生物信息学 · 噬菌体和脱氧核糖核酸 · 查看更多 »

突变

突变(Mutation,即基因突变)在生物学上的含义,是指细胞中的遗传基因(通常指存在於細胞核中的去氧核糖核酸)发生的改变。它包括单个碱基改变所引起的点突变,或多个碱基的缺失、重复和插入。原因可以是细胞分裂时遗传基因的复制发生错误、或受化学物质、基因毒性、辐射或病毒的影响。 突变通常会导致细胞运作不正常或死亡,甚至可以在较高等生物中引发癌症。但同时,突变也被视为演化的“推动力”:不理想的突变会经天择过程被淘汰,而对物种有利的突变则会被累积下去。中性突變(neutral mutation)对物种沒有影响而逐渐累积,会导致间断平衡。.

生物信息学和突变 · 突变和脱氧核糖核酸 · 查看更多 »

系统发生学

系统发生学(φυλογένεση,φύλο,现代希腊语:fílo - 种系,性别和γεννήση,现代希腊语:jénnissi - 新生,诞生。英语:Phylogenetics,又稱系統發育學,简称为譜系學)是指在地球历史发展过程中生物种系的发生和发展。 这个概念不单止用于动物种系的发生與发展,还会用在系统学各个层面的分类单元上面。它也会被用到某一特征的在生物发育过程中的进化这一方面。 系统发生学的研究是通过以下的手段实现的:.

生物信息学和系统发生学 · 系统发生学和脱氧核糖核酸 · 查看更多 »

生物

生物(拉丁语,德语: Organismus, ,又称有機體)是指稱類生命的个体。在生物学和生态学中, 地球上约有870萬種物種(±130萬),其中650萬種物種在陆地上,220万种生活在水中。 生物最重要和基本的特徵在生物會進行新陳代謝及遺傳兩點,前者說明所有生物一定會具備合成代谢以及分解代谢(兩個是完全相反的兩個生理反應過程),並且可以將遺傳物質複製,透過自我分裂生殖(無性生殖)或有性生殖,交由下一代繁殖下去以避免滅絕,这是類生命现象的基础。 生命的起源和生命各个分支之间的关系一直存在争议,古早的生命分類已經過時,近代古典生物學的分類又受到分子生物學的挑戰。一般而言,我們將生物分為兩大類:原核生物和真核生物。原核生物分为兩大域:细菌(Bacteria)和古菌(Archaea),这两个域相互之间的关系并不比他们和真核生物的关系更为接近。在演化史的研究上,原核生物和真核生物之间一直缺乏联系。類似麻煩的還有病毒與內共生細菌等的分類,隨著現代生物化學的研究逐漸深入,出現了有如物理學中存在量子現象一般,在特定微觀世界下許多傳統認知出現錯誤,導致以往常理被顛覆的情況。 真核生物的特徵是有細胞核以及其他膜狀細胞器(例如動物和植物體內的粒線體粒線體也可以說是植物動物體的發電廠因為他可以製造很多的能量,以及植物及藻類中的葉綠素),一種假說是叶绿体和线粒体是由内共生细菌(endosymbiotic bacteria)演化而来T.Cavalier-Smith (1987) The origin of eukaryote and archaebacterial cells, Annals of the New York Academy of Sciences 503, 17–54 。多细胞生物(又稱至於生物實在30班一年且出來則指包含多于一个细胞的生物,在地質學上直到五億年前才出現大爆發。.

生物和生物信息学 · 生物和脱氧核糖核酸 · 查看更多 »

生物学

生物学研究各種生命(上图) 大肠杆菌、瞪羚、(下图)大角金龟甲虫 、蕨類植物 生物學(βιολογία;biologia;德語、法語:biologie;biology)或稱生物科學(biological sciences)、生命科學(life sciences),是自然科學的一大門類,由經驗主義出發,廣泛研究生命的所有方面,包括生命起源、演化、分佈、構造、發育、功能、行為、與環境的互動關系,以及生物分類學等。現代生物學是一個龐大而兼收並蓄的領域,由許多分支和分支學科組成。然而,盡管生物學的範圍很廣,在它裡面有某些一般和統一概念支配一切的學習和研究,把它整合成單一的,和連貫的領域。在總體上,生物以細胞作為生命的基本單位,基因作為遺傳的基本單元,和進化是推動新物種的合成和創建的引擎。今天人們還了解,所有生物體的生存以消耗和轉換能量,調節體內環境以維持穩定的和重要的生命條件。 生物學分支學科被研究生物體的規模所定義,和研究它們使用的方法所定義:生物化學考察生命的基本化學;分子生物學研究生物分子之間錯綜復雜的關系;植物學研究植物的生物學;細胞生物學檢查所有生命的基本組成單位,細胞;生理學檢查組織,器官,和生物體的器官系統的物理和化學的功能;進化生物學考察了生命的多樣性的產生過程;和生態學考察生物在其環境如何相互作用。最終能夠達到治療診斷遺傳病、提高農作物產量、改善人類生活、保護環境等目的。.

生物信息学和生物学 · 生物学和脱氧核糖核酸 · 查看更多 »

生物化学

生物化学(biochemistry,也作 biological chemistry),顾名思义是研究生物体中的化学进程的一门学科,常常被简称为生化。它主要用于研究细胞内各组分,如蛋白质、糖类、脂类、核酸等生物大分子的结构和功能。而对于化学生物学来说,则着重于利用化学合成中的方法来解答生物化学所发现的相关问题。 虽然存在着大量不同的生物分子,但实际上有很多大的复合物分子(称为“聚合物”)是由相似的亚基(称为“单体”)结合在一起形成的。每一类生物聚合物分子都有自己的一套亚基类型。例如,蛋白质是由20种氨基酸所组成,而脱氧核糖核酸(DNA)由4种核苷酸构成。生物化学研究集中于重要生物分子的化学性质,特别着重于酶促反应的化学机理。 在生物化学研究中,对细胞代谢和内分泌系统的研究进行得相当深入。生物化学的其他研究领域包括遗传密码(DNA和RNA)、 蛋白质生物合成、跨膜运输(membrane transport)以及细胞信号转导。.

生物信息学和生物化学 · 生物化学和脱氧核糖核酸 · 查看更多 »

DNA序列

#重定向 核酸序列.

DNA序列和生物信息学 · DNA序列和脱氧核糖核酸 · 查看更多 »

DNA微陣列

DNA微陣列(DNA microarray)又稱DNA陣列或DNA晶片,比較常用的名字是基因晶片(gene chip)。是一塊帶有DNA微阵列(microarray)的特殊玻璃片或矽晶元片,在數平方公分之面積上佈放數千或數萬個核酸探針;檢體中的DNA、cDNA、RNA等與探針結合後,藉由--或電流等方式偵測。經由一次測驗,即可提供大量基因序列相關資訊。它是基因组学和遗传学研究的工具。研究人員應用基因芯片就可以在同一時間定量的分析大量(成千上万个)的基因表現,具有快速、精確、低成本之生物分析檢驗能力。.

DNA微陣列和生物信息学 · DNA微陣列和脱氧核糖核酸 · 查看更多 »

DNA測序

DNA测序(DNA sequencing,或譯DNA定序)是指分析特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)與鳥嘌呤的(G)排列方式。快速的DNA测序方法的出现极大地推动了生物学和医学的研究和发现。 在基础生物学研究中,和在众多的应用领域,如诊断,生物技术,法医生物学,生物系统学中,DNA序列知识已成为不可缺少的知识。具有现代的DNA测序技术的快速测序速度已经有助于达到测序完整的DNA序列,或多种类型的基因组测序和生命物种,包括人类基因组和其他许多动物,植物和微生物物种的完整DNA序列。 RNA測序則通常将RNA提取后,反转录为DNA后使用DNA测序的方法进行测序。目前应用最广泛的是由弗雷德里克·桑格发明的Sanger双脱氧链终止法(Chain Termination Method)。新的测序方法,例如454生物科学的方法和焦磷酸测序法。.

DNA測序和生物信息学 · DNA測序和脱氧核糖核酸 · 查看更多 »

计算机科学

计算机科学用于解决信息与计算的理论基础,以及实现和应用它们的实用技术。 计算机科学(computer science,有时缩写为CS)是系统性研究信息与计算的理论基础以及它们在计算机系统中如何与应用的实用技术的学科。 它通常被形容为对那些创造、描述以及转换信息的算法处理的系统研究。计算机科学包含很多分支领域;有些强调特定结果的计算,比如计算机图形学;而有些是探討计算问题的性质,比如计算复杂性理论;还有一些领域專注于怎样实现计算,比如程式語言理論是研究描述计算的方法,而程式设计是应用特定的程式語言解决特定的计算问题,人机交互则是專注于怎样使计算机和计算变得有用、好用,以及随时随地为人所用。 有时公众会误以为计算机科学就是解决计算机问题的事业(比如信息技术),或者只是与使用计算机的经验有关,如玩游戏、上网或者文字处理。其实计算机科学所关注的,不仅仅是去理解实现类似游戏、浏览器这些软件的程序的性质,更要通过现有的知识创造新的程序或者改进已有的程序。 尽管计算机科学(computer science)的名字里包含计算机这几个字,但实际上计算机科学相当数量的领域都不涉及计算机本身的研究。因此,一些新的名字被提议出来。某些重点大学的院系倾向于术语计算科学(computing science),以精确强调两者之间的不同。丹麦科学家Peter Naur建议使用术语"datalogy",以反映这一事实,即科学学科是围绕着数据和数据处理,而不一定要涉及计算机。第一个使用这个术语的科学机构是哥本哈根大学Datalogy学院,该学院成立于1969年,Peter Naur便是第一任教授。这个术语主要被用于北欧国家。同时,在计算技术发展初期,《ACM通讯》建议了一些针对计算领域从业人员的术语:turingineer,turologist,flow-charts-man,applied meta-mathematician及applied epistemologist。 三个月后在同样的期刊上,comptologist被提出,第二年又变成了hypologist。 术语computics也曾经被提议过。在欧洲大陆,起源于信息(information)和数学或者自动(automatic)的名字比起源于计算机或者计算(computation)更常见,如informatique(法语),Informatik(德语),informatika(斯拉夫语族)。 著名计算机科学家Edsger Dijkstra曾经指出:“计算机科学并不只是关于计算机,就像天文学并不只是关于望远镜一样。”("Computer science is no more about computers than astronomy is about telescopes.")设计、部署计算机和计算机系统通常被认为是非计算机科学学科的领域。例如,研究计算机硬件被看作是计算机工程的一部分,而对于商业计算机系统的研究和部署被称为信息技术或者信息系统。然而,现如今也越来越多地融合了各类计算机相关学科的思想。计算机科学研究也经常与其它学科交叉,比如心理学,认知科学,语言学,数学,物理学,统计学和经济学。 计算机科学被认为比其它科学学科与数学的联系更加密切,一些观察者说计算就是一门数学科学。 早期计算机科学受数学研究成果的影响很大,如Kurt Gödel和Alan Turing,这两个领域在某些学科,例如数理逻辑、范畴论、域理论和代数,也不断有有益的思想交流。.

生物信息学和计算机科学 · 脱氧核糖核酸和计算机科学 · 查看更多 »

蛋白质

蛋白质(protein,旧称“朊”)是大型生物分子,或高分子,它由一个或多个由氨基酸残基组成的长链条组成。氨基酸分子呈线性排列,相邻氨基酸残基的羧基和氨基通过肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被改變原子的排序而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。 与其他生物大分子(如多糖和核酸)一样,蛋白质是地球上生物体中的必要组成成分,参与了细胞生命活动的每一个进程。酶是最常见的一类蛋白质,它们催化生物化学反应,尤其对于生物体的代谢至关重要。除了酶之外,还有许多结构性或机械性蛋白质,如肌肉中的肌动蛋白和肌球蛋白,以及细胞骨架中的微管蛋白(参与形成细胞内的支撑网络以维持细胞外形)。另外一些蛋白质则参与细胞信号传导、免疫反应、细胞黏附和细胞周期调控等。同时,蛋白质也是动物饮食中必需的营养物质,这是因为动物自身无法合成所有氨基酸,动物需要和必须从食物中获取必需氨基酸。通过消化过程将蛋白质降解为自由氨基酸,动物就可以将它们用于自身的代谢。.

生物信息学和蛋白质 · 脱氧核糖核酸和蛋白质 · 查看更多 »

MRNA

#重定向 信使核糖核酸.

MRNA和生物信息学 · MRNA和脱氧核糖核酸 · 查看更多 »

核苷酸

核苷酸(Nucleotide)为核酸的基本组成单位。核苷酸由一個含氮鹼基作為核心,加上一個五碳糖和一個或者多个磷酸基團組成。含氮碱基有五种可能,分别是腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶。五碳糖为脱氧核糖者称为脱氧核糖核苷酸(DNA的單體),五碳糖为核糖者称为核糖核苷酸(RNA的單體)。 根据构成核酸的核苷酸数量分为寡核苷酸(少于或等于15个核苷酸)和多核苷酸(15个核苷酸以上)。.

核苷酸和生物信息学 · 核苷酸和脱氧核糖核酸 · 查看更多 »

氨基酸

胺基酸是生物學上重要的有機化合物,它是由胺基(-NH2)和羧基(-COOH)的官能團組成的,以及一個側鏈连到每一個胺基酸。胺基酸是構成蛋白質的基本單位。賦予蛋白質特定的分子結構形態,使他的分子具有生化活性。蛋白質是生物体內重要的活性分子,包括催化新陳代謝的酶(又称“酵素”)。 不同的胺基酸脱水缩合形成肽(蛋白質的原始片段),是蛋白質生成的前.

氨基酸和生物信息学 · 氨基酸和脱氧核糖核酸 · 查看更多 »

演化生物学

演化生物学(evolutionary biology)是生物学的的一个分支,其关注的是所产生地球上生命多样性的演化的研究。研究演化生物学的人被称为一个演化生物学家。演化生物学家研究物种的起源和新物种的起源。.

演化生物学和生物信息学 · 演化生物学和脱氧核糖核酸 · 查看更多 »

数据挖掘

数据挖掘(data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。除了原始分析步骤,它还涉及到数据库和数据管理方面、、模型与推断方面考量、兴趣度度量、复杂度的考虑,以及发现结构、可视化及在线更新等后处理。数据挖掘是“資料庫知識發現”(KDD)的分析步骤。数据挖掘:实用机器学习技术及Java实现》一书大部分是机器学习的内容。这本书最初只叫做“实用机器学习”,“数据挖掘”一词是后来为了营销才加入的。通常情况下,使用更为正式的术语,(大规模)数据分析和分析学,或者指出实际的研究方法(例如人工智能和机器学习)会更准确一些。 数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息,例如数据的分组(通过聚类分析)、数据的异常记录(通过异常检测)和数据之间的关系(通过关联式规则挖掘)。这通常涉及到数据库技术,例如。这些潜在信息可通过对输入数据处理之后的总结来呈现,之后可以用于进一步分析,比如机器学习和预测分析。举个例子,进行数据挖掘操作时可能要把数据分成多组,然后可以使用决策支持系统以获得更加精确的预测结果。不过数据收集、数据预处理、结果解释和撰写报告都不算数据挖掘的步骤,但是它们确实属于“資料庫知識發現”(KDD)过程,只不过是一些额外的环节。 类似词语“”、“数据捕鱼”和“数据探测”指用数据挖掘方法来采样(可能)过小以致无法可靠地统计推断出所发现任何模式的有效性的更大总体数据集的部分。不过这些方法可以建立新的假设来检验更大数据总体。.

数据挖掘和生物信息学 · 数据挖掘和脱氧核糖核酸 · 查看更多 »

上面的列表回答下列问题

生物信息学和脱氧核糖核酸之间的比较

生物信息学有67个关系,而脱氧核糖核酸有279个。由于它们的共同之处21,杰卡德指数为6.07% = 21 / (67 + 279)。

参考

本文介绍生物信息学和脱氧核糖核酸之间的关系。要访问该信息提取每篇文章,请访问:

嘿!我们在Facebook上吧! »