NLTK庫可以通過使用align_words函數對文本進行對齊。以下是一個示例代碼:
from nltk.translate import AlignedSent
from nltk.translate import Alignment
src_words = ['I', 'saw', 'the', 'man']
tgt_words = ['Je', 'ai', 'vu', 'l', 'homme']
alignment = Alignment([(0, 0), (1, 1), (2, 2), (3, 3)])
aligned_sent = AlignedSent(src_words, tgt_words, alignment)
print(aligned_sent.words)
print(aligned_sent.mots)
print(aligned_sent.alignment)
在這個示例中,我們創建了一個包含源語言單詞列表和目標語言單詞列表的AlignedSent對象,然后打印出對齊后的結果。您也可以使用Alignment()函數來指定單詞之間的對應關系,以生成自定義的對齊結果。