徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

字符串

指数 字符串

字符串(String),是由零个或多个字符组成的有限序列。一般记为s.

68 关系: ASCIIAwk偏序关系可數集子串子集字串搜尋演算法字形字符字符串运算字符编码字节字母表 (计算机科学)串接帕斯卡 (消歧義)幺半群序列交換律二元关系二元运算形式语言列表單位元全序关系克莱尼星号C++C语言CJK空字元串空字符空集算法结合律编程语言直譯器EBCDICErlangEUC非负整数複合型別词典序语素文字语法資料類型自由幺半群ISO/IEC 2022PerlPrologPythonRuby...SedShift JISUnicodeUNIXUTF-16排序算法树 (图论)正则表达式汉语泛型朝鮮語有限状态机有限集合最小元文本文件日语数组整数 扩展索引 (18 更多) »

ASCII

ASCII( ,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其擴展版本EASCII則可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。 ASCII第一次以規範標準的型態發表是在1967年,最後一次更新則是在1986年,至今為止共定義了128個字元;其中33個字元無法顯示(一些终端提供了扩展,使得这些字符可顯示为諸如笑臉、撲克牌花式等8-bit符號),且這33個字元多數都已是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。在33個字元之外的是95個可顯示的字元。用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元(顯示為空白)。.

新!!: 字符串和ASCII · 查看更多 »

Awk

AWK是一种优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎之一。这种编程及数据操作语言(其名称得自于它的创始人阿尔佛雷德·艾侯、彼得·溫伯格和布萊恩·柯林漢姓氏的首个字母)的最大功能取决于一个人所拥有的知识。AWK提供了极其强大的功能:可以进行正则表达式的匹配,样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。它具备了一个完整的语言所应具有的几乎所有精美特性。实际上AWK的确拥有自己的语言:AWK程序设计语言,三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。gawk是AWK的GNU版本。 最简单地说,AWK是一种用于处理文本的编程语言工具。AWK在很多方面类似于Unix shell编程语言,尽管AWK具有完全属于其本身的语法。它的设计思想来源于SNOBOL4、sed、Marc Rochkind设计的有效性语言、语言工具yacc和lex,当然还从C语言中获取了一些优秀的思想。在最初创造AWK时,其目的是用于文本处理,并且这种语言的基础是,只要在输入数据中有模式匹配,就执行一系列指令。该实用工具扫描文件中的每一行,查找与命令行中所给定内容相匹配的模式。如果发现匹配内容,则进行下一个编程步骤。如果找不到匹配内容,则继续处理下一行。.

新!!: 字符串和Awk · 查看更多 »

偏序关系

偏序集合(Partially ordered set,简写poset)是数学中,特别是序理论中,指配备了部分排序关系的集合。 这个理論將排序、顺序或排列这个集合的元素的直觉概念抽象化。这种排序不必然需要是全部的,就是说不必要保证此集合内的所有对象的相互可比较性。部分排序集合定义了部分排拓扑。.

新!!: 字符串和偏序关系 · 查看更多 »

可數集

在数学上,可数集,或称可列集、可数无穷集合,是与自然数集的某个子集具有相同基數(等势)的集合。在这个意义下不是可数集的集合称为不可数集。这个术语是康托尔创造的。可数集的元素,正如其名,是“可以计数”的:尽管计数永远无法终止,集合中每一个特定的元素都将对应一个自然数。 “可数集”这个术语也可以代表能和自然数集本身一一对应的集合。例子参见两个定义的差别在于有限集合在前者中算作可数集,而在后者中不算作可数集。 为了避免歧义,前一种意义上的可数有时称为至多可数,参见.

新!!: 字符串和可數集 · 查看更多 »

子串

一个字符串 s 被称作另一个字符串 S 的子串,表示 s 在 S 中出现了。比如,“中出”是“我们中出了一个叛徒”的子串。注意子串和子序列是不同的:“苹机”是“苹果手机”的子序列,而不是子串。 前缀和后缀是两种特殊的子串:一个前缀在原串的开始位置出现,而一个后缀在原串的末端出现。 例如,“苹果手机”的所有子串是:“”(空串),“苹”,“果”,“手”,“机”,“苹果”,“果手”,“手机”,“苹果手”,“果手机”,“苹果手机”。.

新!!: 字符串和子串 · 查看更多 »

子集

子集,為某個集合中一部分的集合,故亦稱部分集合。 若A和B为集合,且A的所有元素都是B的元素,则有:.

新!!: 字符串和子集 · 查看更多 »

字串搜尋演算法

字串搜尋演算法(String searching algorithms)又稱字串比對演算法(string matching algorithms)是一种搜索算法,是字串演算法中的一類,用以試圖在一長字符串或文章中,找出其是否包含某一個或多個字符串,以及其位置。 最直觀的解法是比對,如下例中,在字符串haystack中找出字符串needle char* haystack; char* needle; int hlen, nlen, found; int i,j,k; found.

新!!: 字符串和字串搜尋演算法 · 查看更多 »

字形

字形(glyph),又稱字圖或書形,是指字的形体。中华人民共和国国家标准GB/T 16964《信息技术·字型信息交换》中定义字形为“一个可以辨认的抽象的图形符号,它不依赖于任何特定的设计”。在語言學中,字(character)是語意的最基本單位,即語素;字形是指為了表達這個意義的具體表達。同一字可以有不同的字形,而不影響其表達的意思,例如拉丁字母第一個字母可以寫作a或ɑ,漢字中的“--”、“--”。.

新!!: 字符串和字形 · 查看更多 »

字符

在電腦和電信領域中,字符(Character)是一個資訊單位。對使用字母系統或音節文字等自然語言,它大約對應為一個音位、類音位的單位或符號。簡單來講就是一個漢字、假名、韓文字……,或是一個英文、其他西方語言的字母。 字符的例子有:字母、數字系統或標點符號。另外有所謂控制字符的概念,它是指:並不對應到自然語言中的某個特定符號,而是對應到語言中一些用來處理文句的概念(類似排版)。例子為列印機或其它顯示設備的命令,如Enter或Tab。.

新!!: 字符串和字符 · 查看更多 »

字符串运算

在计算机科学领域形式语言理论中,经常用到各种字符串函数;但是符号不同于计算机编程中所用到的,某些在理论领域中常用的函数,在编程中很少用到。本文定义其中一些基本术语。.

新!!: 字符串和字符串运算 · 查看更多 »

字符编码

字符编码(Character encoding)、字集碼是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位元组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号編號,並用7位元的二进制來表示这个整数。通常會額外使用一个扩充的位元,以便于以1个字节的方式存储。 在计算机技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐漸成為標準。但这些字符集的局限很快就变得明显,于是人们开发了許多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符,并且需要一种系统而不是临时的方法实现这些字符的编码。.

新!!: 字符串和字符编码 · 查看更多 »

字节

,通常用作计算机信息计量单位,不分数据类型。 一個字节代表八個。是程序设计语言不可缺少的基本数据类型——整數。 字节是现代计算机中连续的、固定数量的比特(二進制),即八個位元為一字节。 八个二进位经常在规范中被称为Octet(八位组),例如在一些工业标准、网络及电信技术裡。 Byte(字节)可缩写成B,例如MB表示Megabyte;Bit(位元)可缩写成b(小写),例如Mb表示。.

新!!: 字符串和字节 · 查看更多 »

字母表 (计算机科学)

在计算机科学中,字母表是字符或数字的有限集合。最常见的字母表是二元字母表。有限字符串是来自字母表的字符的有限序列;例如二元字符串是来自字母表的字符构成的字符串。字符的无限序列也可以用来自一个字母表的元素来构造。 给定一个字母表\Sigma,我们写\Sigma^*来指示在字母表\Sigma上的所有有限字符串的集合。这里的^*指示Kleene星号算子。我们写\Sigma^\infty(偶尔\Sigma^\N或\Sigma^\omega)来指示在字母表\Sigma上的所有无限序列的集合。 例如,如果我们使用二元字母表,则字符串ε, 0, 1, 00, 01, 10, 11, 000,等都将在这个字母表的Kleene闭包中(这里的ε表示空串)。 字母表在形式语言、自动机和半自动机理论中是重要。自动机如确定有限状态自动机(DFA)要求在形式定义中有字母表。.

新!!: 字符串和字母表 (计算机科学) · 查看更多 »

串接

在形式語言理論(特別是編程語言),字串串接(Concatenation),又稱字串相加、連接、串連、相連,指將兩個字串的首尾相接的操作。例如「foo」和「bar」串接後便成了「foobar」。部分語言,串接的操作是透過將串接運算子放在兩個字串(運算元)之間。.

新!!: 字符串和串接 · 查看更多 »

帕斯卡 (消歧義)

帕斯卡(Pascal),抑或帕斯卡爾,可能指:.

新!!: 字符串和帕斯卡 (消歧義) · 查看更多 »

幺半群

在抽象代數此一數學分支中,幺半群(又稱為單群、亞群、具幺半群或四分之三群)是指一個帶有可結合二元運算和單位元的代數結構。么半群在許多的數學分支中都會出現。在幾何學中,幺半群捉取了函數複合的概念;更確切地,此一概念是從範疇論中抽象出來的,之中的幺半群是個帶有一個物件的範疇。幺半群也常被用來當做電腦科學的堅固代數基礎;在此,變換幺半群和語法幺半群被用來描述有限狀態自動機,而跡幺半群和歷史幺半群則是做為進程演算和並行計算的基礎。幺半群的研究中一些較重要的結論有克羅恩-羅德斯定理和星高問題。.

新!!: 字符串和幺半群 · 查看更多 »

序列

数学上,序列是被排成一列的对象(或事件);这样,每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。.

新!!: 字符串和序列 · 查看更多 »

交換律

交換律(Commutative property)是被普遍使用的一個數學名詞,意指能改變某物的順序而不改變其最終結果。交換律是大多數數學分支中的基本性質,而且許多的數學證明需要倚靠交換律。簡單運算的交換律許久都被假定存在,且沒有給定其一特定的名稱,直到19世紀,數學家開始形式化數學理論之後,交換律才被聲明。.

新!!: 字符串和交換律 · 查看更多 »

二元关系

数学上,二元关系(Binary relation,或简称关系)用於讨论两种物件的连系。诸如算术中的「大於」及「等於」、几何学中的「相似」或集合论中的「为……之元素」、「为……之子集」。.

新!!: 字符串和二元关系 · 查看更多 »

二元运算

二元运算属于数学运算的一种。二元运算需要三个元素:二元运算符以及该运算符作用的两个变量。如四则运算的加、减、乘、除均属于二元运算。 如在运算1 + 2之中,二元运算符为“+”,而该运算符作用的操作数分别为1与2。 二元运算只是二元函数的一种,由于它被广泛应用于各个领域,因此受到比其它函数更高的重视。.

新!!: 字符串和二元运算 · 查看更多 »

形式语言

在数学、逻辑和计算机科学中,形式语言(Formal language)是用精确的数学或机器可处理的公式定义的语言。 如语言学中语言一样,形式语言一般有两个方面: 语法和语义。专门研究语言的语法的数学和计算机科学分支叫做形式语言理论,它只研究语言的语法而不致力于它的语义。在形式语言理论中,形式语言是一个字母表上的某些有限长字符串的集合。一个形式语言可以包含无限多个字符串。.

新!!: 字符串和形式语言 · 查看更多 »

列表

#重定向 表格.

新!!: 字符串和列表 · 查看更多 »

單位元

單位元是集合裏的一種特別的元素,與該集合裏的二元運算有關。當單位元和其他元素結合時,並不會改變那些元素。單位元被使用在群和其他相關概念之中。 設 (S,*)為一帶有一二元運算* 的集合S(稱之為原群),則S內的一元素e被稱為左單位元若對所有在S內的a而言,e * a .

新!!: 字符串和單位元 · 查看更多 »

全序关系

全序关系即集合X上的反对称的、传递的和完全的二元关系(一般称其为\leq)。 若X满足全序关系,则下列陈述对于X中的所有a,b和c成立:.

新!!: 字符串和全序关系 · 查看更多 »

克莱尼星号

Kleene 星号,或稱Kleene 闭包,德语稱 Kleensche Hülle,在數學上是一種適用於字符串或符號及字元的集合的一元運算。當 Kleene 星号被應用在一個集合V時,寫法是V^*。它被廣泛用於正则表达式。.

新!!: 字符串和克莱尼星号 · 查看更多 »

C++

C++是一種使用廣泛的计算机程序設計語言。它是一種通用程序設計語言,支援多重编程模式,例如程序化程序設計、数据抽象、面向对象程序設計、泛型程序設計和设计模式等。 比雅尼·斯特勞斯特魯普博士在贝尔实验室工作期间在20世紀80年代發明並實現了C++。起初,這種語言被稱作“C with Classes”(“包含‘類’的C語言”),作為C語言的增強版出現。随后,C++不斷增加新特性。虚函数(virtual function)、运算符重载(operator overloading)、多繼承(multiple inheritance)、标准模板库(standard template library, STL)、异常处理(exception)、运行时类型信息(Runtime type information)、命名空間(namespace)等概念逐漸納入標準。1998年,國際標準組織(ISO)頒布了C++程序設計語言的第一個國際標準ISO/IEC 14882:1998,目前最新标准为ISO/IEC 14882:2017。根據《C++編--程思想》(Thinking in C++)一書,C++與C的代码执行效率往往相差在±5%之間。 C++語言發展大概可以分為三個階段:第一階段從80年代到1995年。這一階段C++語言基本上是傳統類型上的面向对象語言,並且憑藉着接近C語言的效率,在工業界使用的開發語言中佔據了相當大份額;第二階段從1995年到2000年,這一階段由於標準模板庫(STL)和後來的Boost等程式庫的出現,泛型程序設計在C++中佔據了越來越多的比重。當然,同時由於Java、C#等語言的出現和硬體價格的大規模下降,C++受到了一定的衝擊;第三階段從2000年至今,由於以Loki、MPL(Boost)等程式庫為代表的產生式編程和模板元編程的出現,C++出現了發展歷史上又一個新的高峰,這些新技術的出現以及和原有技術的融合,使C++已經成為當今主流程序設計語言中最複雜的一員。.

新!!: 字符串和C++ · 查看更多 »

C语言

C是一种通用的程式語言,广泛用于系统软件与应用软件的开发。于1969年至1973年間,為了移植與開發UNIX作業系統,由丹尼斯·里奇與肯·汤普逊,以B语言为基础,在贝尔实验室設計、开发出來。 C语言具有高效、灵活、功能丰富、表达力强和較高的可移植性等特点,在程式設計中备受青睐,成为最近25年使用最为广泛的编程语言。目前,C语言編譯器普遍存在於各種不同的操作系统中,例如Microsoft Windows、macOS、Linux、Unix等。C語言的設計影響了众多後來的程式語言,例如C++、Objective-C、Java、C#等。 二十世纪八十年代,為了避免各開發廠商用的C語言語法產生差異,由美國國家標準局為C語言訂定了一套完整的國際標準語法,稱為ANSI C,作為C語言的標準。二十世纪八十年代至今的有关程式開發工具,一般都支持符合ANSI C的語法。.

新!!: 字符串和C语言 · 查看更多 »

CJK

#重定向 中日韓統一表意文字.

新!!: 字符串和CJK · 查看更多 »

空字元串

在計算機科學或形式語言中,空字元串是指在字母表Σ上,其長度為 0 的那唯一字串,以ε或λ來標記。 在物件導向程式語言中,空字串共非空參照。一個字串型別的空參照並未指向一個字串物件,而對其操作則會導致錯誤。空字串則可以使用字串運算。.

新!!: 字符串和空字元串 · 查看更多 »

空字符

字符(Null character)又稱結束符,縮寫NUL,是一個數值為0的控制字符。在許多字符编码中都包括空字符,包括ISO/IEC 646(ASCII)、、通用字符集、Unicode和EBCDIC等,幾乎所有主流的程式語言都包括有空字符。 這個字符原來的意思類似NOP指令,當送到列表機或終端機時,設備不需作任何的動作(不過有些設備會錯誤的列印或顯示一個空白)。 空字符在C語言及其衍生語言及許多資料型態中都非常的重要,在C語言中空字符是字串的結束碼,這樣的字串稱為空字符終止字串或ASCIIZ字串。因此字串的長度可以為任意自然數,但需多增加一個字元的空間儲存空字元。.

新!!: 字符串和空字符 · 查看更多 »

空集

集是不含任何元素的集合,數學符號為\empty、\varnothing或\。.

新!!: 字符串和空集 · 查看更多 »

算法

-- 算法(algorithm),在數學(算學)和電腦科學之中,為任何良定义的具體計算步驟的一个序列,常用於計算、和自動推理。精確而言,算法是一個表示爲有限長列表的。算法應包含清晰定義的指令用於計算函數。 算法中的指令描述的是一個計算,當其時能從一個初始狀態和初始輸入(可能爲空)開始,經過一系列有限而清晰定義的狀態最終產生輸出並停止於一個終態。一個狀態到另一個狀態的轉移不一定是確定的。隨機化算法在内的一些算法,包含了一些隨機輸入。 形式化算法的概念部分源自尝试解决希尔伯特提出的判定问题,並在其后尝试定义或者中成形。这些尝试包括库尔特·哥德尔、雅克·埃尔布朗和斯蒂芬·科尔·克莱尼分别于1930年、1934年和1935年提出的遞歸函數,阿隆佐·邱奇於1936年提出的λ演算,1936年的Formulation 1和艾倫·圖靈1937年提出的圖靈機。即使在當前,依然常有直覺想法難以定義爲形式化算法的情況。.

新!!: 字符串和算法 · 查看更多 »

结合律

在數學中,結合律(associative laws)是二元運算可以有的一個性質,意指在一個包含有二個以上的可結合運算子的表示式,只要運算元的位置沒有改變,其運算的順序就不會對運算出來的值有影響。亦即,重新排列表示式中的括號並不會改變其值。例如: 上式中的括號雖然重新排列了,但表示式的值依然不變。當這在任何實數的加法上都成立時,我們說「實數的加法是一個可結合的運算」。 結合律不應該和交換律相混淆。交換律會改變表示式中運算元的位置,而結合律則不會。例如: 是一個結合律的例子,因為其中的括號改變了(且因此運算子在運算中的順序也改變了),而運算元5、2、1則在原來的位置中。再來, 則不是一個結合律的例子,因為運算元2和5的位置互換了。 可結合的運算在數學中是很常見的,且事實上,大多數的代數結構確實會需要它們的二元運算是可結合的。不過,也有許多重要且有趣的運算是不可結合的;其中一個簡單的例子為向量積。.

新!!: 字符串和结合律 · 查看更多 »

编程语言

编程语言(programming language),是用来定义计算机程序的形式語言。它是一种被标准化的交流技巧,用来向计算机发出指令。一种计算机语言让程序员能够准确地定义计算机所需要使用的数据,并精确地定义在不同情况下所应当采取的行动。 最早的编程语言是在電腦發明之前產生的,當時是用來控制及自動演奏鋼琴的動作。在電腦領域已發明了上千不同的编程語言,而且每年仍有新的编程語言誕生。很多编程語言需要用指令方式說明計算的程序,而有些编程語言則屬於宣告式編程,說明需要的結果,而不說明如何計算。 编程语言的描述一般可以分為及語義。語法是說明編程語言中,哪些符號或文字的組合方式是正確的,語義則是對於編程的解釋。有些語言是用規格文件定義,例如C語言的規格文件也是ISO標準中一部份,2011年後的版本為ISO/IEC 9899:2011,而其他55語言(像Perl)有一份主要的文件,視為是。.

新!!: 字符串和编程语言 · 查看更多 »

直譯器

譯器(interpreter),是一種電腦程式,能夠把高階程式語言一行一行直接轉譯執行。直譯器像是一位「中間人」,每次執行程式時都要先轉成另一種語言再作執行,因此直譯器的程式運行速度比較緩慢。它不會一次把整個程式轉譯出來,而是每轉譯一行程式敘述就立刻執行,然後再轉譯下一行,再執行,如此不停地進行下去。 直譯器的好處是它消除了編譯整個程式的負擔,程式可以拆分成多個部分來模組化,但這會讓執行時的效率打了折扣。相對地,編譯器已一次將所有原程式碼翻譯成另一種語言,如機械碼,執行時便無需再依賴編譯器或額外的程式,故而其運行速度比較快。.

新!!: 字符串和直譯器 · 查看更多 »

EBCDIC

EBCDIC(Extended Binary Coded Decimal Interchange Code)擴增二进式十进交換碼,为IBM於1963年-1964年间推出的字元编码表,根据早期打孔机式的二进化十进数(BCD,Bindary Coded Decimal)排列而成。是IBM迷尔級以上電腦的標準碼。 它的缺点是:英文字母不是连续地排列,中间出现多次断续,为撰写程式的人带来了一些困难。.

新!!: 字符串和EBCDIC · 查看更多 »

Erlang

Erlang()是一種通用的----,它由喬·阿姆斯特朗(Joe Armstrong)在瑞典電信設備製造商愛立信所轄的電腦科學研究室開發,目的是創造一種可以應付大規模開發活動的--和執行環境。Erlang於1987年釋出正式版本,最早是愛立信擁有的私有軟體,經過十年的發展,於1998年發表開放源碼版本。 Erlang是運作於虛擬機的--,但是現在也包含有烏普薩拉大學高性能Erlang計劃(HiPE)開發的原生程式碼編譯器,自R11B-4版本開始,Erlang也支持--。在編程範型上,Erlang屬於多重典範程式語言,涵蓋函數式、--及--。循序執行的Erlang是一个及早求值, 單次賦值和--的函數式程式語言。.

新!!: 字符串和Erlang · 查看更多 »

EUC

EUC全名为Extended Unix Code,是一个使用8位编码来表示字符的方法。 EUC最初是针对Unix系统,由一些Unix公司所开发,于1991年标准化。EUC基于ISO/IEC 2022的7位编码标准,因此单字节的编码空间为94,双字节的编码空间(区位码)为94x94。把每个区位加上0xA0来表示,以便符合ISO 2022。它主要用于表示及储存汉语文字、日语文字及朝鲜文字。 EUC定义了4个单独的码集(code set)。码集0总是对应于7位的ASCII(或其它的各国定义的ISO 646),包括了ISO 2022定义的C0与G0空间的值。码集1, 2, 3表示G1空间的值。其中,码集1表示一些未经修饰(unadorned)的字符。码集2的字符编码以0x8E(属于C1控制字符,或称SS2)为第一字节。码集3的字符编码以0x8F(另一个属于C1的控制字符,或称SS3)为第一字节。码集0总是编码为单字节;码集2、3总是编码为至少2个字节;码集1编码为1-3个字节。.

新!!: 字符串和EUC · 查看更多 »

非负整数

非負整數,就是數字前沒有加負號,亦指其絕對值等於其原數值。與正整數差一個數字。即為零,一個實数的平方必為非負整數。.

新!!: 字符串和非负整数 · 查看更多 »

複合型別

在電腦科學中,複合型別是一種資料型別,它可以原始型別和其它的複合型別所構成。構成一個複合型別的動作,又稱作組合。.

新!!: 字符串和複合型別 · 查看更多 »

词典序

#重定向 字典序.

新!!: 字符串和词典序 · 查看更多 »

语素文字

语素文字(logogram,来自λόγος“词”和γράμμα“字符”),又称表语文字,是表示词或语素(语言的最小语义单位)的文字。它和表音文字不同:表音文字是表示语音的文字,表音文字的一个字位表示一个音位或者音位的组合。 语素文字容易与象形符号和形意符号相混淆。语素文字跟象形符号和形意符号的区别主要有两点:.

新!!: 字符串和语素文字 · 查看更多 »

语法

语言学中语法(Grammar)是指任意自然语言中控制子句、词组以及单词等结构的规则,这一概念也被用来指对于这些规则进行研究的学科,例如词法学、语法学或音韵学等,并和其他学科如语音学、语义学或语用学互相补充。在很多文献中,语言学家通常不用“语法”来指正寫法。.

新!!: 字符串和语法 · 查看更多 »

資料類型

在程式設計的型別系統中,数据类型(Data type)是用來約束数据的解釋。在程式語言中,常見的数据类型包括--(如:整數、浮點數或字元)、多元組、記錄單元、代數資料型別、抽象数据类型、參考型別、类以及函式型別。資料型別描述了數值的表示法、解釋和結構,並以演算法操作,或是物件在記憶體中的儲存區,或者其它儲存裝置。.

新!!: 字符串和資料類型 · 查看更多 »

自由幺半群

#重定向 自由么半群.

新!!: 字符串和自由幺半群 · 查看更多 »

ISO/IEC 2022

ISO 2022,全称ISO/IEC 2022,由国际标准化组织(ISO)及国际电工委员会(IEC)联合制定,是一个使用7位或8位编码表示各种语言文字的通用技术规范。特别以东亚语言:汉语文字、日语文字或朝鲜文字的编码方法著称。 ISO 2022等同于欧洲标准组织(ECMA)的ECMA-35。中国国标GB 2312、日本工业规格JIS X 0202(旧称JIS C 6228)及韩国工业规格KS X 1004(旧称KS C 5620)均遵从ISO 2022。.

新!!: 字符串和ISO/IEC 2022 · 查看更多 »

Perl

Perl是高階、通用、直譯式、動態的程式语言家族。最初设计者拉里·沃尔為了讓在UNIX上進行報表處理的工作變得更方便,決定開發一個通用的腳本語言,而在1987年12月18日發表。目前,Perl语言家族包含两个分支Perl 5以及Perl 6(开发中)。 Perl借用了C、sed、awk、shell脚本以及很多其他程式語言的特性。其中最重要的特性是Perl内部集成了正则表达式的功能,以及巨大的第三方代码库CPAN。 2000年开始,目前拉里·沃尔开始開發Perl 6,來作為Perl的後繼;不過,Perl 6語言的語法有很多轉變,所以Perl 6被視為Perl家族中的另一個語言。 Perl语言的应用范围很广,除CGI以外,Perl被用于图形编程、系统管理、网络编程、金融、生物以及其他领域。由于其灵活性,Perl被称为脚本语言中的瑞士军刀。.

新!!: 字符串和Perl · 查看更多 »

Prolog

Prolog(Programming in Logic的缩写)是一种逻辑编程语言。它建立在逻辑学的理论基础之上, 最初被运用于自然语言等研究领域。现在它已广泛的应用在人工智能的研究中,它可以用来建造专家系统、自然语言理解、智能知识库等。.

新!!: 字符串和Prolog · 查看更多 »

Python

Python( ),是一种广泛使用的高级编程语言,属于通用型编程语言,由吉多·范罗苏姆创造,第一版发布于1991年。可以視之為一種改良(加入一些其他程式語言的優點,如物件導向)的LISP。作为一种解释型语言,Python的设计哲学强调代码的可读性和简洁的语法(尤其是使用空格缩进划分代码块,而非使用大括号或者关键词)。相比於C++或Java,Python让开发者能够用更少的代码表达想法。不管是小型还是大型程序,该语言都试图让程序的结构清晰明了。 与Scheme、Ruby、Perl、Tcl等动态类型编程语言一样,Python拥有动态类型系统和垃圾回收功能,能够自动管理内存使用,并且支持多种编程范式,包括面向对象、命令式、函数式和过程式编程。其本身拥有一个巨大而广泛的标准库。 Python 解释器本身几乎可以在所有的操作系统中运行。Python的正式直譯器CPython是用C语言编写的、是一個由社群驱动的自由软件,目前由Python软件基金会管理。.

新!!: 字符串和Python · 查看更多 »

Ruby

Ruby 是一种面向对象、命令式、函数式、动态的通用编程语言。在20世纪90年代中期由日本電腦科學家松本行弘(Matz)设计并开发。 遵守BSD许可证和Ruby License。它的灵感与特性来自于Perl、Smalltalk、Eiffel、Ada以及Lisp语言。由Ruby语言本身还发展出了JRuby(Java平台)、IronRuby(.NET平台)等其他平台的Ruby语言替代品。.

新!!: 字符串和Ruby · 查看更多 »

Sed

sed(意为流编辑器,源自英语“stream editor”的缩写)是Unix常见的命令行程序。sed用来把文档或字符串里面的文字经过一系列编辑命令转换为另一种格式输出。sed通常用来匹配一个或多个正则表达式的文本进行处理。 分号(;)可以用作分隔命令的指示符。尽管sed脚本固有的很多限制,一连串的sed指令加起来可以编程像 仓库番、快打砖块、甚至俄罗斯方块等电脑游戏的复杂程序。.

新!!: 字符串和Sed · 查看更多 »

Shift JIS

Shift_JIS是日本电脑系统常用的编码表,能容纳全形及半形拉丁字母、平假名、片假名、符号及日语汉字。 命名为Shift_JIS的原因,是在放置全形字符时,要避开原本在0xA1-0xDF放置的半角假名字符。 微软及IBM的日语电脑系统即使用了这个编码表,称为CP932。.

新!!: 字符串和Shift JIS · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

新!!: 字符串和Unicode · 查看更多 »

UNIX

UNIX,一种计算机操作系统,具有多任务、多用户的特征。于1969年,在美国AT&T公司的贝尔实验室开发類UNIX(UNIX-like)。.

新!!: 字符串和UNIX · 查看更多 »

UTF-16

UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数(即码元)的--,用于数据存储或传递。Unicode字符的码位,需要1个或者2个16位长的码元来表示,因此这是一个变长表示。 UTF是"Unicode/UCS Transformation Format"的首字母缩写,即把Unicode字符转换为某種格式之意。UTF-16正式定義於ISO/IEC 10646-1的附錄C,而RFC2781也定義了相似的做法。.

新!!: 字符串和UTF-16 · 查看更多 »

排序算法

在計算機科學與數學中,一個排序算法(Sorting algorithm)是一種能將一串資料依照特定排序方式进行排列的一種算法。最常用到的排序方式是數值順序以及字典順序。有效的排序算法在一些算法(例如搜尋算法與合併算法)中是重要的,如此這些算法才能得到正確解答。排序算法也用在處理文字資料以及產生人類可讀的輸出結果。基本上,排序算法的輸出必須遵守下列兩個原則:.

新!!: 字符串和排序算法 · 查看更多 »

树 (图论)

在图论中,树(Tree)是一種無向圖(undirected graph),其中任意两个顶点间存在唯一一條路径。或者说,只要没有回路的连通图就是树。森林是指互相不交并树的集合。树图广泛应用于计算机科学的数据结构中,比如二叉查找树,堆,Trie树以及数据压缩中的霍夫曼树等等。.

新!!: 字符串和树 (图论) · 查看更多 »

正则表达式

正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE),又称--、正規表示法、正規運算式、規則運算式、常規表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器裡,正則表达式通常被用来检索、替换那些符合某个模式的文本。 许多程序设计语言都支持利用正則表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正則表达式引擎。正則表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成regex,单数有regexp、regex,复数有regexps、regexes、regexen。.

新!!: 字符串和正则表达式 · 查看更多 »

汉语

漢語,又稱中文、華文、唐話、中國話等,是漢藏語系漢語族下之一種語文,為世界使用人数最多的语言,目前世界有六分之一人口做為母語。漢語有多種分支语言,當中現代標準漢語為現行的漢語通用語,為中华人民共和国的国家通用语言(又稱為普通話)、以及中華民國的国语。此外,漢語還是聯合國官方語言之一傳統華人社會習慣稱之為「漢語」,本文一律以漢族慣稱「漢語」來表示,國際間常稱中文。其他稱呼僅限特定人群使用,請另見相關條目。,并被上海合作组织等国际组织采用为官方语言。 汉字是汉语的文字書寫系统,又称汉文、中文、华文、唐文,在中华民国又称为国文,是一种意音文字,表意的同時也具一定的表音功能。漢語属分析语,有声调。漢語包含書面語及口語兩部分,古代書面汉语称为文言文,现代书面汉语一般指使用現代標準漢語語法、詞彙的中文通行文体(又称白话文)。 对于汉语的分支语言,学界主要有两种观点,一种观点将汉语定义为语言,并将官话、贛語、闽语、粤语、客家语、吴语、湘语七大语言定义为一级方言;另一种观点则将汉语视为语族,其下無法互相溝通的視為語言,如國際標準化組織就將漢語族分為13種語言:闽东语、晋语、官话、莆仙语、徽语、闽中语、赣语、客家语、湘语、闽北语、闽南语、吴语、粤语。.

新!!: 字符串和汉语 · 查看更多 »

泛型

泛型程序设计(generic programming)是程序设计语言的一种风格或范式。泛型允许程序员在强类型程序设计语言中编写代码时使用一些以后才指定的类型,在实例化时作为参数指明这些类型。各种程序设计语言和其编译器、运行环境对泛型的支持均不一样。Ada、Delphi、Eiffel、Java、C#、F#、Swift 和 Visual Basic.NET 称之为泛型(generics);ML、Scala 和 Haskell 称之为参数多态(parametric polymorphism);C++ 和 D称之为模板。具有广泛影响的1994年版的《Design Patterns》一书称之为参数化类型(parameterized type)。.

新!!: 字符串和泛型 · 查看更多 »

朝鮮語

--,是通行於-zh-hans:韩国、;zh-hant:南--zh-hans:朝鲜;zh-hant:北韓-及满洲、俄羅斯遠東地區、日本等朝鲜族聚居地區的語言。 朝鲜语在全球约有7560万使用者,是世界第十三大语言。随着大韩民国在国际社会政治、经济地位的不断提高,学习韩语的人数也不断增长,目前许多国家的高中和大学都教授韩语。在美国、日本、澳大利亚等地,大学入学考试的外語科目中可以選擇韩语應考。.

新!!: 字符串和朝鮮語 · 查看更多 »

有限状态机

有限状态机(finite-state machine,縮寫:FSM)又稱有限状态自动机,简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。.

新!!: 字符串和有限状态机 · 查看更多 »

有限集合

数学中,一个集合被称为有限集合,簡單來說就是元素個數有限,嚴格而言則是指有一个自然数n使该集合与集合之间存在双射。例如 -15到3之间的整数组成的集合,这个集合有19个元素,它跟集合存在雙射,所以它是有限的。不是有限的集合称为无限集合。 也就是说如果一个集合的基数是自然数,那这个集合就是有限的。所有的有限集合都是可数的,但并不是所有的可数集都是有限的,例如所有素数的集合。 有一个定理(戴德金定理)是:一个集合是有限的当且仅当不存在一个该集合与它的任何一个真子集之间的双射。 I I.

新!!: 字符串和有限集合 · 查看更多 »

最小元

设(A, \leq)是偏序集,B \subseteq A,y \in B,若对于所有的x \in B都有y \leq x,则称y为B的最小元。 请注意最小元和极小元的区别。最小元是B中最小的元素,它与B中其它元素都可比;而极小元不一定与B中其它元素都可比,只要没有比它小的元素,它就是极小元。对于有穷集合B,极小元一定存在,但最小元不一定存在。最小元如果存在一定是唯一的,但极小元可能有多个。.

新!!: 字符串和最小元 · 查看更多 »

文本文件

文本文件一般指只有字符原生编码构成的二进制计算机文件,與富文本相比,其不包含字样样式的控制元素,能够被最简单的文本编辑器直接读取。.

新!!: 字符串和文本文件 · 查看更多 »

日语

日本語(),簡稱日語,其文字称为日文,是一種主要為日本列島上大和族所使用的語言,日語也是大國語言之一。雖然日本并沒有在法律上明確規定其官方語言,但是各种法令都规定要使用日语,在学校教育中作为国语教授的也是日语。日語是日本的公用語言是不爭的事實。但僅為事實上的官方語言,類似於美國的英語的事實上的國語地位。 雖然并沒有精確的日語使用人口的統計,不過計算日本國內的人口以及居住在日本國外的日本人和日僑,日語使用者應超過一億三千萬人。幾乎所有在日本出生長大的日本國民都以日語為母語。此外,對於失聰者,有對應日語文法及音韻系統的日本手語存在。 2017年3月的互联网使用语言排名中,日语仅次于英语、汉语、西班牙语、阿拉伯语、葡萄牙语、印尼語(馬來語),排名第七。 在日语语法学界,如果无特别说明,「日語」(日本語)这个詞彙,一般是指以江戶山手地區(今東京中心一帶)的中流階層方言為基礎的日语現代標準語,有時也稱作「共通語」(共通語)。.

新!!: 字符串和日语 · 查看更多 »

数组

在計算機科學中,陣列資料結構(array data structure),簡稱数组(Array),是由相同类型的元素(element)的集合所組成的資料結構,分配一块连续的内存来存储。利用元素的索引(index)可以计算出该元素對應的儲存地址。 最簡單的資料結構類型是一維陣列。例如,索引為0到9的32位元整數陣列,可作為在記憶體位址2000,2004,2008,...2036中,儲存10個變量,因此索引為i的元素即在記憶體中的2000+4×i位址。陣列第一個元素的記憶體位址稱為第一位址或基礎位址。 二维数组,对应于數學上的矩陣概念,可表示為二維矩形格。例如: a.

新!!: 字符串和数组 · 查看更多 »

整数

整数,是序列中所有的数的统称,包括负整数、零(0)与正整数。和自然數一樣,整數也是一個可數的無限集合。這個集合在数学上通常表示粗體Z或\mathbb,源于德语单词Zahlen(意为“数”)的首字母。 在代數數論中,這些屬於有理數的一般整數會被稱為有理整數,用以和高斯整數等的概念加以區分。.

新!!: 字符串和整数 · 查看更多 »

重定向到这里:

字串字串演算法字符串及字符处理

传出传入
嘿!我们在Facebook上吧! »