中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在Java中使用正則表達式API

發布時間:2022-06-09 16:24:23 來源:億速云 閱讀:346 作者:iii 欄目:開發技術

本文小編為大家詳細介紹“怎么在Java中使用正則表達式API”,內容詳細,步驟清晰,細節處理妥當,希望這篇“怎么在Java中使用正則表達式API”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。

前言:

在正則表達式的世界中,有許多不同的風格可供選擇,比如grep、Perl、Python、PHP、awk等等。這意味著在一種編程語言中工作的正則表達式可能在另一種編程語言中不工作。Java中的正則表達式語法與Perl中的最相似。要在Java中使用正則表達式,我們不需要任何特殊設置。JDK包含一個特殊的java包java.util.regex完全致力于regex。我們只需要將其導入到我們的代碼中。此外,java.lang.String類還具有我們在代碼中常用的內置正則表達式支持。

Java正則表達式包

 java.util.regex包由三個類組成:PatternMatcherPatternSyntaxException

  • Pattern模式對象是一個已編譯的正則表達式。Pattern類不提供公共構造函數。要創建一個模式,我們必須首先調用它的一個公共靜態編譯方法,然后該方法將返回一個模式對象。這些方法接受正則表達式作為第一個參數。

  • Matcher對象解釋模式并對輸入字符串執行匹配操作。它也沒有定義公共構造函數。我們通過調用模式對象上的Matcher方法來獲得Matcher對象。

  • PatternSyntaxException對象是一個未經檢查的異常,它指示正則表達式模式中的語法錯誤。

我們必須首先了解正則表達式是如何在Java中構造的。

如果你已經從不同的環境中熟悉了正則表達式,你可能會發現某些差異,但它們是最小的。

簡單的例子

讓我們從正則表達式的最簡單用例開始。如前所述,當正則表達式應用于字符串時,它可能會匹配零次或多次。

java支持的最基本的模式匹配形式。java.util.regex正則表達式API是字符串文本的匹配。例如,如果正則表達式為foo,輸入字符串為foo,則匹配將成功,因為字符串相同:

@Test
public void givenText_whenSimpleRegexMatches_thenCorrect() {
    Pattern pattern = Pattern.compile("foo");
    Matcher matcher = pattern.matcher("foo");
 
    assertTrue(matcher.find());
}

我們首先通過調用其靜態編譯方法并向其傳遞我們想要使用的模式來創建一個Pattern對象。

然后我們創建一個Matcher對象,調用Pattern對象的Matcher方法,并將要檢查匹配的文本傳遞給它。

之后,我們在Matcher對象中調用find方法。

find方法在輸入文本中不斷前進,并為每個匹配返回true,因此我們也可以使用它來查找匹配計數:

@Test
public void givenText_whenSimpleRegexMatchesTwice_thenCorrect() {
    Pattern pattern = Pattern.compile("foo");
    Matcher matcher = pattern.matcher("foofoo");
    int matches = 0;
    while (matcher.find()) {
        matches++;
    }
 
    assertEquals(matches, 2);
}

由于我們將運行更多的測試,我們可以抽象出在一個名為runTest的方法中查找匹配數的邏輯:

public static int runTest(String regex, String text) {
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(text);
    int matches = 0;
    while (matcher.find()) {
        matches++;
    }
    return matches;
}

當我們得到0個匹配項時,測試應該失敗,否則應該通過。

Meta Characters元字符

元字符會影響模式匹配的方式,從而為搜索模式添加邏輯。JavaAPI支持多個Meta Characters,最簡單的是“.”匹配任何字符:

@Test
public void givenText_whenMatchesWithDotMetach_thenCorrect() {
    int matches = runTest(".", "foo");
    
    assertTrue(matches > 0);
}

考慮到前面的例子,其中regex-foo匹配文本foo和foo兩次。如果我們在正則表達式中使用點元字符,那么在第二種情況下,我們不會得到兩個匹配:

@Test
public void givenRepeatedText_whenMatchesOnceWithDotMetach_thenCorrect() {
    int matches= runTest("foo.", "foofoo");
 
    assertEquals(matches, 1);
}

注意正則表達式中foo后面的點。匹配器匹配前面有foo的每個文本,因為最后一個點部分表示后面的任何字符。因此,在找到第一個foo之后,其余的被視為任何角色。這就是為什么只有一場比賽。

該API支持其他幾個元字符<([{\^-=$!|]})?*+.>我們將在本文中進一步探討。

Character類

瀏覽官方模式類規范,我們將發現受支持的正則表達式構造的摘要。在Character類下,我們有大約6個結構。

OR

構造為[abc]。集合中的任何元素都是匹配的:

@Test
public void givenORSet_whenMatchesAny_thenCorrect() {
    int matches = runTest("[abc]", "b");
 
    assertEquals(matches, 1);
}

如果它們都出現在文本中,則每一個單獨匹配,不考慮順序:

@Test
public void givenORSet_whenMatchesAnyAndAll_thenCorrect() {
    int matches = runTest("[abc]", "cab");
 
    assertEquals(matches, 3);
}

它們也可以作為字符串的一部分進行替換。在下面的示例中,當我們通過將第一個字母與集合中的每個元素交替來創建不同的單詞時,它們都是匹配的:

@Test
public void givenORSet_whenMatchesAllCombinations_thenCorrect() {
    int matches = runTest("[bcr]at", "bat cat rat");
 
    assertEquals(matches, 3);
}

NOR

通過添加插入符號作為第一個元素來否定上述集合:

@Test
public void givenNORSet_whenMatchesNon_thenCorrect() {
    int matches = runTest("[^abc]", "g");
 
    assertTrue(matches > 0);
}

另外一個例子:

@Test
public void givenNORSet_whenMatchesAllExceptElements_thenCorrect() {
    int matches = runTest("[^bcr]at", "sat mat eat");
 
    assertTrue(matches > 0);
}

Range類

我們可以定義一個類,該類使用連字符(-)指定匹配文本應該落在的范圍內,同樣,我們也可以否定一個范圍。

匹配大寫字母:

@Test
public void givenUpperCaseRange_whenMatchesUpperCase_
  thenCorrect() {
    int matches = runTest(
      "[A-Z]", "Two Uppercase alphabets 34 overall");
 
    assertEquals(matches, 2);
}

匹配小寫字母:

@Test
public void givenLowerCaseRange_whenMatchesLowerCase_
  thenCorrect() {
    int matches = runTest(
      "[a-z]", "Two Uppercase alphabets 34 overall");
 
    assertEquals(matches, 26);
}

匹配大小寫字母:

@Test
public void givenBothLowerAndUpperCaseRange_
  whenMatchesAllLetters_thenCorrect() {
    int matches = runTest(
      "[a-zA-Z]", "Two Uppercase alphabets 34 overall");
 
    assertEquals(matches, 28);
}

匹配范圍:

@Test
public void givenNumberRange_whenMatchesAccurately_
  thenCorrect() {
    int matches = runTest(
      "[1-5]", "Two Uppercase alphabets 34 overall");
 
    assertEquals(matches, 2);
}

匹配另外的數字范圍:

@Test
public void givenNumberRange_whenMatchesAccurately_
  thenCorrect2(){
    int matches = runTest(
      "[30-35]", "Two Uppercase alphabets 34 overall");
 
    assertEquals(matches, 1);
}

Union類

union字符類是兩個或多個字符類組合的結果:

@Test
public void givenTwoSets_whenMatchesUnion_thenCorrect() {
    int matches = runTest("[1-3[7-9]]", "123456789");
 
    assertEquals(matches, 6);
}

上述測試將只匹配9個整數中的6個,因為并集跳過4、5和6。

Intersection類

與union類類似,該類是在兩個或多個集合之間拾取公共元素的結果。要應用交叉點,我們使用&&:

@Test
public void givenTwoSets_whenMatchesIntersection_thenCorrect() {
    int matches = runTest("[1-6&&[3-9]]", "123456789");
 
    assertEquals(matches, 4);
}

我們得到4個匹配,因為兩個集合的交集只有4個元素。

Subtraction類

我們可以使用減法對一個或多個字符類求反,例如匹配一組奇數十進制數:

@Test
public void givenSetWithSubtraction_whenMatchesAccurately_thenCorrect() {
    int matches = runTest("[0-9&&[^2468]]", "123456789");
 
    assertEquals(matches, 5);
}

讀到這里,這篇“怎么在Java中使用正則表達式API”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

汉寿县| 禹城市| 三台县| 明溪县| 九龙坡区| 澄迈县| 宁强县| 新宾| 遵义县| 石屏县| 开阳县| 武清区| 汉阴县| 临夏县| 樟树市| 运城市| 普格县| 黄大仙区| 榆林市| 伊金霍洛旗| 景谷| 梁河县| 巩留县| 庆元县| 揭西县| 北流市| 宁陕县| 宜君县| 裕民县| 崇州市| 百色市| 长沙市| 湖南省| 奉贤区| 黄山市| 黎川县| 明水县| 海伦市| 满城县| 长白| 大足县|