中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用Python怎么求兩個字符串最長公共子序列

發布時間:2021-05-13 17:36:52 來源:億速云 閱讀:752 作者:Leah 欄目:開發技術

使用Python怎么求兩個字符串最長公共子序列?相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

一、問題描述

給定兩個字符串,求解這兩個字符串的最長公共子序列(Longest Common Sequence)。比如字符串1:BDCABA;字符串2:ABCBDAB。則這兩個字符串的最長公共子序列長度為4,最長公共子序列是:BCBA

二、算法求解

這是一個動態規劃的題目。對于可用動態規劃求解的問題,一般有兩個特征:①最優子結構;②重疊子問題

①最優子結構

設X=(x1,x2,...,xn)和Y=(y1,y2,...,ym)是兩個序列,將X和Y的最長公共子序列記為LCS(X,Y)

找出LCS(X,Y)就是一個最優化問題。因為,我們需要找到X和Y中最長的那個公共子序列。而要找X和Y的LCS,首先考慮X的最后一個元素和Y的最后一個元素。

⑴如果xn=ym,即X的最后一個元素與Y的最后一個元素相同,這說明該元素一定位于公共子序列中。因此,現在只需要找:LCS(Xn-1,Ym-1)

LCS(Xn-1,Ym-1)就是原問題的一個子問題。為什么叫子問題?因為它的規模比原問題小。

為什么是最優的子問題?因為我們要找的是Xn-1和Ym-1的最長公共子序列啊。最長的!換句話說就是最優的那個。

⑵如果xn!=ym,這下要麻煩一點,因為它產生了兩個子問題:LCS(Xn-1,Ym)和LCS(Xn,Ym-1)

因為序列X和序列Y的最后一個元素不相等,那說明最后一個元素不可能是最長公共子序列中的元素。

LCS(Xn-1,Ym)表示:最長公共序列可以在(x1,x2,...xn-1)和(y1,y2,...,ym)中找。

LCS(Xn,Ym-1)表示:最長公共序列可以在(x1,x2,...xn)和(y1,y2,...,ym-1)中找。

求解上面兩個子問題,得到的公共子序列誰最長,那誰就是LCS(X,Y)。用數學表示就是:

LCS=max{LCS(Xn-1,Ym),LCS(Xn,Ym-1)}

由于條件⑴和⑵考慮到了所有可能的情況。因此,我們成功的把原問題轉化成了三個規模更小的問題。

②重疊子問題

重疊子問題是什么?就是說原問題轉化成子問題后,子問題中有相同的問題。

原問題是:LCS(X,Y)。子問題有?LCS(Xn-1,Ym-1)? LCS(Xn-1,Ym)? LCS(Xn,Ym-1)

乍一看,這三個問題是不重疊的。可本質上它們是重疊的,因為它們只重疊了一大部分。舉例:

第二個子問題:LCS(Xn-1,Ym)就包含了問題?LCS(Xn-1,Ym-1),為什么?

因為,當Xn-1和Ym的最后一個元素不相同時,我們又需要將LCS(Xn-1,Ym-1)進行分解:分解成:LCS(Xn-1,Ym-1)和LCS(Xn-2,Ym)

也就是說:在子問題的繼續分解中,有些問題是重疊的。

由于像LCS這樣的問題,它具有重疊子問題的性質,因此:用遞歸來求解就太不劃算了。國為采用遞歸,它重復地求解了子問題,而且需要注意的是,所有子問題加起來的個數是指數級的。

那么問題來了,如果用遞歸求解,有指數級個子問題,故時間復雜度是指數級的。這指數級個子問題,難道用了動態規劃,就變成多項式時間了??

關鍵是采用動態規劃時,并不需要去一一計算那些重疊了的子問題。或者說:用了動態規劃之后,有些子問題是通過“查表”直接得到的,而不是重新又計算一遍得到的。舉個例子:比如求Fib數列。

使用Python怎么求兩個字符串最長公共子序列

求fib(5),分解成了兩個子問題:fib(4)和fib(3),求解fib(4)和fib(3)時,又分解了一系列的小問題...

從圖中可以看出:根的左右子樹:fib(4)和fib(3)下,是有很多重疊的!比如,對于fib(2),它就一共出現了三次。如果用遞歸來求解,fib(2)就會被計算三次,而用DP(Dynamic Programming)動態規劃,則fib(2)只會計算一次,其他兩次則是通過“查表”直接求得。而且,更關鍵的是:查找求得該問題的解之后,就不需要再繼續去分解該問題了。而對于遞歸,是不斷地將問題解,直到分解為基準問題(fib(0)或者fib(1))

說了這么多,還是寫下最長公共子序列的遞歸式才完整。

使用Python怎么求兩個字符串最長公共子序列

C[i,j]表示:(x1,x2,...,xi)和(y1,y2,...,yj)的最長公共子序列的長度。公式的具體解釋可參考《算法導論》動態規劃章節

三、LCS Python代碼實現

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author  : mayi
# Blog   : http://www.cnblogs.com/mayi0312/
# Date   : 2019/5/16
# Name   : test03
# Software : PyCharm
# Note   : 用于實現求解兩個字符串的最長公共子序列


def longestCommonSequence(str_one, str_two, case_sensitive=True):
  """
  str_one 和 str_two 的最長公共子序列
  :param str_one: 字符串1
  :param str_two: 字符串2(正確結果)
  :param case_sensitive: 比較時是否區分大小寫,默認區分大小寫
  :return: 最長公共子序列的長度
  """
  len_str1 = len(str_one)
  len_str2 = len(str_two)
  # 定義一個列表來保存最長公共子序列的長度,并初始化
  record = [[0 for i in range(len_str2 + 1)] for j in range(len_str1 + 1)]
  for i in range(len_str1):
    for j in range(len_str2):
      if str_one[i] == str_two[j]:
        record[i + 1][j + 1] = record[i][j] + 1
      elif record[i + 1][j] > record[i][j + 1]:
        record[i + 1][j + 1] = record[i + 1][j]
      else:
        record[i + 1][j + 1] = record[i][j + 1]

  return record[-1][-1]

if __name__ == '__main__':
  # 字符串1
  s1 = "BDCABA"
  # 字符串2
  s2 = "ABCBDAB"
  # 計算最長公共子序列的長度
  res = longestCommonSequence(s1, s2)
  # 打印結果
  print(res) # 4

python的數據類型有哪些?

python的數據類型:1. 數字類型,包括int(整型)、long(長整型)和float(浮點型)。2.字符串,分別是str類型和unicode類型。3.布爾型,Python布爾類型也是用于邏輯運算,有兩個值:True(真)和False(假)。4.列表,列表是Python中使用最頻繁的數據類型,集合中可以放任何數據類型。5. 元組,元組用”()”標識,內部元素用逗號隔開。6. 字典,字典是一種鍵值對的集合。7. 集合,集合是一個無序的、不重復的數據組合。

看完上述內容,你們掌握使用Python怎么求兩個字符串最長公共子序列的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

南汇区| 龙游县| 兖州市| 温泉县| 城口县| 武安市| 朝阳市| 南康市| 云和县| 襄汾县| 勃利县| 比如县| 阿图什市| 甘洛县| 郑州市| 定日县| 侯马市| 禹州市| 邢台县| 宁蒗| 康马县| 确山县| 安吉县| 乐亭县| 台江县| 连江县| 大埔区| 滁州市| 吴忠市| 墨竹工卡县| 临泉县| 集安市| 法库县| 高雄县| 新乐市| 莎车县| 长顺县| 巧家县| 凤冈县| 顺平县| 朝阳市|