徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

BLAST (生物資訊學)

指数 BLAST (生物資訊學)

生物信息學中,BLAST(Basic Local Alignment Search Tool)它是一個用來比對生物序列的一級結構(如不同蛋白質的氨基酸序列或不同基因的DNA序列)的算法。 已知一個包含若干序列的資料庫,BLAST可以讓研究者在其中尋找與其感興趣的序列相同或類似的序列。 例如如果某種非人動物的一個以前未知的基因被發現,研究者一般會在人類基因組中做一個BLAST搜索來確認人類是否包含類似的基因(通過序列的相似性)。BLAST演算法以及實現它的程序由美國國家生物技術信息中心(NCBI)的Eugene Myers、Stephen Altschul、Warren Gish、David J. Lipman及Webb Miller博士開發的。 研究者利用BLAST來解决的其他問题有:.

14 关系: 动态规划基因序列比對开放阅读框架细菌美国国家生物技术信息中心生物信息学物种轉譯脱氧核糖核酸蛋白質一級結構蛋白质氨基酸泊松分佈

动态规划

动态规划(Dynamic programming,简称DP)是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划常常适用于有重叠子问题和性质的问题,动态规划方法所耗时间往往远少于朴素解法。 动态规划背后的基本思想非常简单。大致上,若要解一个给定问题,我们需要解其不同部分(即子问题),再根据子问题的解以得出原问题的解。 通常许多子问题非常相似,为此动态规划法试图仅仅解决每个子问题一次,从而减少计算量:一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。这种做法在重复子问题的数目关于输入的规模呈指數增長时特别有用。.

新!!: BLAST (生物資訊學)和动态规划 · 查看更多 »

基因

基因一词来自希腊语,意思为“生”。是指控制生物性状的遗传信息,通常由DNA序列来承载。基因也可视作基本遗传单位,亦即一段具有功能性的DNA或RNA序列。弄清其序列本身的过程叫基因测序。基因的结构由增强子,启动子及蛋白编码序列组成:即基因产物可以是蛋白质(蛋白质编码基因)及RNA,从而控制生物个体的性状(差異)表现。在一个个体当中所有的基因总和叫基因组。在一个物种中所有等位基因的总合叫基因库。在大多数真核生物中,基因分为细胞核基因及线粒体基因,绿色植物的叶绿体也含有独立于细胞核的叶绿体基因组。人類約有一万九千至兩萬两千個基因。 在真核生物中,染色体在体细胞中是成对存在的。每条染色体上都带有一定数量的基因。一个基因在细胞有丝分裂时有两个对列的位点,称为等位基因,分别来自父与母。依所攜帶性状的表現,又可分为显性基因和隐性基因。 一般来说,同一生物体中的每个细胞體都含有相同的基因(除了已经分化的免疫细胞),但并不是每个细胞中的所有基因携带的遗传信息都会被表現出来。控制基因表达的因素分为传统的遗传学(增强子,启动子序列相关)因素及表观遗传学(DNA甲基化,组蛋白乙酰化和脱乙酰化及RNA干扰相关)因素。職司不同功能的細胞或不同的细胞类型中,活化而表現的基因也不同。在某一细胞类型当中所有被表达的基因叫转录组,所有编码蛋白质的基因叫蛋白质组。通过即时聚合酶链式反应或染色质免疫沉淀-测序可得到转录组及蛋白质组的信息。用电脑处理基因序列的学科叫生物信息学。 人类基因组计划(human genome project, HGP)是一项规模宏大,跨国跨学科的生物信息学项目。其宗旨在于测定组成人类染色体(指单倍体)的30亿个碱基对形成的核苷酸序列,从而繪製人类基因组圖譜,並且辨識其载有的基因,达到破译人类遗传信息的最终目的。该计划起始于1990年于2000年完成。.

新!!: BLAST (生物資訊學)和基因 · 查看更多 »

序列比對

序列比對指將兩個或多個序列排列在一起,標明其相似之處。序列中可以插入間隔(通常用短橫線“-”表示)。對應的相同或相似的符號(在核酸中是A, T(或U), C, G,在蛋白質中是氨基酸殘基的單字母表示)排列在同一列上。 这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。 术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。.

新!!: BLAST (生物資訊學)和序列比對 · 查看更多 »

开放阅读框架

#重定向 開放閱讀框.

新!!: BLAST (生物資訊學)和开放阅读框架 · 查看更多 »

细菌

細菌(学名:Bacteria)是生物的主要類群之一,屬於細菌域。也是所有生物中數量最多的一類,據估計,其總數約有5×1030個。細菌的個體非常小,目前已知最小的細菌只有0.2微米長,因此大多--能在顯微鏡下看到它們;而世界上最大的細菌可以用肉眼直接看見,有0.2-0.6毫米大,是一種叫納米比亞嗜硫珠菌的細菌。細菌一般是單細胞,細胞結構簡單,缺乏細胞核以及膜狀胞器,例如粒線體和葉綠體。基於這些特徵,細菌屬於原核生物。原核生物中還有另一類生物稱做古細菌,是科學家依據演化關係而另闢的類別。為了區別,本類生物也被稱做真細菌(Eubacteria)。古細菌與真細菌在生活環境、營養方式以及遺傳上有所不同。細菌的形狀相當多樣,主要有球狀、桿狀,以及螺旋狀。 細菌廣泛分佈於土壤和水中,或著與其他生物共生。人體身上也帶有相當多的細菌。據估計,人體內及表皮上的細菌細胞總數約是人體細胞總數的十倍。此外,也有部分種類分布在極端的環境中,例如溫泉,甚至是放射性廢棄物中,它們被歸類為嗜極生物,其中最著名的種類之一是海棲熱袍菌,科學家是在意大利的一座海底火山中發現這種細菌的。甚至在太空梭上也能生長。然而,細菌種類是如此多,科學家研究過並命名的種類只佔其中的小部份。細菌域下所有門中,只有約一半能在實驗室培養的種類。 細菌的營養方式有自养及异养,其中异养的腐生細菌是生态系统中重要的分解者,使碳循環能順利進行。部分細菌會進行固氮作用,使氮元素得以轉換為生物能利用的形式。細菌也對人類活動有很大的影響。一方面,細菌是許多疾病的病原體,包括肺結核、淋病、炭疽病、梅毒、鼠疫、砂眼等疾病都是由細菌所引發。然而,人類也時常利用細菌,例如乳酪及酸奶和酒釀的製作、部分抗生素的製造、廢水的處理等,都與細菌有關。在生物科技領域中,細菌有也著廣泛的運用。 總的來說,這世界上約有5×1030 隻細菌。其生物量遠大於世界上所有動植物體內細胞數量的總和。細菌還在營養素循環上扮演相當重要的角色,像是微生物造成的腐敗作用,就與氮循環相關。而在海底火山和在冷泉中,細菌則是靠硫化氫和甲烷來產生能量。2013年3月17日,研究者在深約11公里的馬里亞納海溝中發現了細菌。其他研究則指出,在美國西北邊離岸2600米的海床下580米深處,仍有許多的微生物根據這些研究人員的說法:「你可以在任何地方找到他們,他們的適應力遠比你想像的還要強,可以在任何地方存活。.

新!!: BLAST (生物資訊學)和细菌 · 查看更多 »

美国国家生物技术信息中心

国家生物技术信息中心(National Center for Biotechnology Information,简称NCBI)是美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所的一部分)。NCBI位于美國马里兰州的贝塞斯达,建立于1988年。 NCBI设置有与生物技术和生物医学相关的一系列数据库,是生物信息学工具和服务的重要资源。 主要数据库包括DNA序列GenBank,和生物医学文献书目数据库PubMed。 其他数据库包括NCBI。 所有这些数据库都可以通过Entrez搜索引擎在线获取。 许多受尊敬的研究者在NCBI工作,如比较基因组学领域的一位多产的科学家Eugene Koonin和BLAST序列数据库搜索算法的作者Stephen Altschul。 NCBI在研究数据库r3data.org的注册表中列出。.

新!!: BLAST (生物資訊學)和美国国家生物技术信息中心 · 查看更多 »

生物信息学

生物信息學(bioinformatics)利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。目前主要的研究方向有:序列比对、序列組裝、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。 生物学技术往往生成大量的嘈杂数据。与数据挖掘类似,生物信息学利用数学工具从大量数据中提取有用的生物学信息。生物信息学所要处理的典型问题包括:重新組裝在霰弹枪定序法测序过程中被打散的DNA序列,从蛋白质的氨基酸序列预测蛋白质结构,利用mRNA微阵列或质谱仪的数据检验基因调控的假说。 某些人将计算生物学作为生物信息学的同义词处理;但是另外一些人认为计算生物学和生物信息学应当被当作不同的条目处理,因为生物信息学更侧重於生物学领域中计算方法的使用和发展,而计算生物学强调应用信息学技术对生物学领域中的假说进行检验,并尝试发展新的理论。 生物信息学可以定义为对分子生物学中两类信息流的研究:.

新!!: BLAST (生物資訊學)和生物信息学 · 查看更多 »

物种

种(Species)或稱物种,生物分类的基本单位,位于生物分类法中最後一级,在属之下。較為籠統的概念,是指一群或多或少与其它这样的群体形态相同,並能够交配繁殖出具生殖能力後代的相关生物群体。以演化生物學家恩斯特·麥爾的定义来说,物种是:「能够(或可能)相互配育的自然种群的类群,这些类群与其它这样的类群在生殖上相互隔离着。」昆虫学家陈世骧(1978)对物种所下定义为:「物种是繁殖单元,由又连续又间断的居群所组成;物种是进化单元,是生物系统线上的基本环节,是分类的基本单元。」。 在分类学中,一个物种被赋予一个拉丁化的雙名法名称。该名称使用斜体印刷,手写时则加上底線;属名首字母大写,屬名之後紧跟一个唯一的形容词,這個詞稱為種小名或種加詞,其首字母不可大寫。只有完整的双名制名称才称为「种名」,而非仅仅是双名制名称的第二个部分。例如人的种名叫Homo sapiens(智人),而不是sapiens。 物种也是演化和生物多样性的基本单元。.

新!!: BLAST (生物資訊學)和物种 · 查看更多 »

轉譯

#重定向 翻譯 (生物學).

新!!: BLAST (生物資訊學)和轉譯 · 查看更多 »

脱氧核糖核酸

--氧核醣核酸(deoxyribonucleic acid,縮寫:DNA)又稱--氧核醣核酸,是一種生物大分子,可組成遺傳指令,引導生物發育與生命機能運作。主要功能是資訊儲存,可比喻為「藍圖」或「配方」。其中包含的指令,是建構細胞內其他的化合物,如蛋白質與核醣核酸所需。帶有蛋白質編碼的DNA片段稱為基因。其他的DNA序列,有些直接以本身構造發揮作用,有些則參與調控遺傳訊息的表現。 DNA是一種長鏈聚合物,組成單位稱為核苷酸,而糖類與磷酸藉由酯鍵相連,組成其長鏈骨架。每個糖單位都與四種鹼基裡的其中一種相接,這些鹼基沿著DNA長鏈所排列而成的序列,可組成遺傳密碼,是蛋白質氨基酸序列合成的依據。讀取密碼的過程稱為轉錄,是根據DNA序列複製出一段稱為RNA的核酸分子。多數RNA帶有合成蛋白質的訊息,另有一些本身就擁有特殊功能,例如核糖體RNA、小核RNA與小干擾RNA。 在細胞內,DNA能組織成染色體結構,整組染色體則統稱為基因組。染色體在細胞分裂之前會先行複製,此過程稱為DNA複製。對真核生物,如動物、植物及真菌而言,染色體是存放於細胞核內;對於原核生物而言,如細菌,則是存放在細胞質中的拟核裡。染色體上的染色質蛋白,如組織蛋白,能夠將DNA組織並壓縮,以幫助DNA與其他蛋白質進行交互作用,進而調節基因的轉錄。.

新!!: BLAST (生物資訊學)和脱氧核糖核酸 · 查看更多 »

蛋白質一級結構

蛋白质一级结构(Protein primary structure)是肽或蛋白质中氨基酸的线性序列。按照惯例,蛋白质的一级结构被报道从氨基末端(N)端到羧基末端(C)端。蛋白质生物合成最通常由细胞中的核糖体进行。肽也可以在实验室中合成。蛋白质一级结构可以被直接测序,或从DNA序列推断。 在生物化學裡,生物分子的一級結構是其分子組成和分子間化學鍵結的精確模樣。對於一典型的無分支、無交叉的生物聚合物(如DNA、RNA或典型的細胞內蛋白質等分子),其第一結構等同於描述其單體單位的序列,即如DNA序列和肽序列。「一級結構」這一名詞在Linderstrom-Lang於1951年的Lane Medical Lectures上首次被提到。一級結構和一級序列有一點相似,即使在二級或三級結構中並沒有平行的概念。.

新!!: BLAST (生物資訊學)和蛋白質一級結構 · 查看更多 »

蛋白质

蛋白质(protein,旧称“朊”)是大型生物分子,或高分子,它由一个或多个由氨基酸残基组成的长链条组成。氨基酸分子呈线性排列,相邻氨基酸残基的羧基和氨基通过肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被改變原子的排序而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。 与其他生物大分子(如多糖和核酸)一样,蛋白质是地球上生物体中的必要组成成分,参与了细胞生命活动的每一个进程。酶是最常见的一类蛋白质,它们催化生物化学反应,尤其对于生物体的代谢至关重要。除了酶之外,还有许多结构性或机械性蛋白质,如肌肉中的肌动蛋白和肌球蛋白,以及细胞骨架中的微管蛋白(参与形成细胞内的支撑网络以维持细胞外形)。另外一些蛋白质则参与细胞信号传导、免疫反应、细胞黏附和细胞周期调控等。同时,蛋白质也是动物饮食中必需的营养物质,这是因为动物自身无法合成所有氨基酸,动物需要和必须从食物中获取必需氨基酸。通过消化过程将蛋白质降解为自由氨基酸,动物就可以将它们用于自身的代谢。.

新!!: BLAST (生物資訊學)和蛋白质 · 查看更多 »

氨基酸

胺基酸是生物學上重要的有機化合物,它是由胺基(-NH2)和羧基(-COOH)的官能團組成的,以及一個側鏈连到每一個胺基酸。胺基酸是構成蛋白質的基本單位。賦予蛋白質特定的分子結構形態,使他的分子具有生化活性。蛋白質是生物体內重要的活性分子,包括催化新陳代謝的酶(又称“酵素”)。 不同的胺基酸脱水缩合形成肽(蛋白質的原始片段),是蛋白質生成的前.

新!!: BLAST (生物資訊學)和氨基酸 · 查看更多 »

泊松分佈

Poisson分布(法語:loi de Poisson,英語:Poisson distribution),译名有--分布、--分布、--分佈、--分佈、--分佈、--分佈、卜氏分配等,又稱帕松小數法則(Poisson law of small numbers),是一種統計與概率學裡常見到的離散機率分佈,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。 泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、雷射的光子數分布等等。 泊松分布的概率質量函数为: 泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 根据泰勒展开式可得:e^.

新!!: BLAST (生物資訊學)和泊松分佈 · 查看更多 »

重定向到这里:

BLAST (基因测序)BLAST (生物资讯学)

传出传入
嘿!我们在Facebook上吧! »