要讀取文件夾下所有網頁標題,可以使用以下步驟:
glob()
函數獲取文件夾中的所有網頁文件。例如,假設網頁文件都是以 .html
或 .htm
結尾的,可以使用以下代碼獲取文件列表:$files = glob('path/to/folder/*.html');
$files += glob('path/to/folder/*.htm');
file_get_contents()
函數讀取文件內容,然后使用正則表達式提取標題。foreach ($files as $file) {
$html = file_get_contents($file);
preg_match("/<title>(.*?)<\/title>/i", $html, $matches);
$title = $matches[1];
echo $title;
}
注意:這里的正則表達式僅適用于簡單的網頁,如果網頁結構復雜,可能需要更復雜的表達式來匹配標題。同時,這種方法只能獲取每個文件的第一個標題,如果一個網頁文件中有多個標題,可能需要進行進一步的處理。