strip_tags和正則表達式可以配合使用來過濾HTML標簽以及其他特定的文本格式。下面是一個示例代碼,演示如何結合使用strip_tags和正則表達式來過濾HTML標簽:
import re
def remove_html_tags(text):
cleaned_text = strip_tags(text) # 去除HTML標簽
cleaned_text = re.sub(r'<.*?>', '', cleaned_text) # 去除其他特定格式的文本,如<>中的內容
return cleaned_text
html_text = "<p>Hello, <strong>world!</strong></p>"
cleaned_text = remove_html_tags(html_text)
print(cleaned_text) # Output: Hello, world!
在這個示例中,首先使用strip_tags函數去除HTML標簽,然后使用正則表達式<.*?>
來匹配并去除<>中的內容,最終得到清理后的文本。通過結合使用strip_tags和正則表達式,可以更好地過濾文本中的特定格式內容。