策略是託管伺服器上的一個設置,強制所有流量透過安全 連結連接到網站。當整個網站從 切換到 時,通常會使用 重新導向。如果實施正確,這比 重定向更安全。 可以被惡意者忽略,但他仍然可以存取該網站的 版本。如果頁面有 重新導向,則無法存取舊的 版本。這就是為什麼在每個頁面上考慮從 到 的轉換非常重要。如果 頁面或內容元素之後仍然可以訪問,則可以說存在安全風險。
首次造訪網站後,伺服器不會觸發 重定向,但瀏覽器已提前識別該重定向。從造訪網站的那一刻起,瀏覽器就會記住 策略已生效。因此,無法存取該頁面的舊 版本。然而,仍需要實施常規的站點範圍 重定向。這是因為 僅在透過 連線發送被觸發並禁止訪客存取 版本的區塊時才起作用。
具有忽略 策略的功能。如果啟用此功能,則會檢查從 到 的底層 重定向是否正常運作。
您可以透過取消選取 配置中的「尊重 策略」來完成此操作。
爬行路徑報告
抓取網站的方式與 相同。作為網站所有者,你可以建立一個漂亮的選單結構,但如果不遵循它,它就行不通。
透過爬行路徑報告,您可以發現 用於存取某個頁面的連結。如果這與您想要的不同,您可以採取措施進行更改。
您可以透過右鍵單擊 來發現爬網路徑報告。
在尖叫青蛙中使用正規表示式
正規表示式或正規表示式是定義搜尋模式的一系列字 賭號數據 符,主要用於搜尋(和替換)檔案或資料庫。例如,正規表示式在 中用於 匹配,並支援最受歡迎的編輯器(如 、、 和 )中的「尋找和替換」。
範例:電子郵件地址的正規表示式:
上面的正規表示式可用於檢查給定的字串是否是電子郵件地址
使用正規表示式進行
正規 西班牙 IAB 的一項研究顯示,2023 年西班牙數位媒體廣告投資超過 49.7 億美元 表示式是加速 工作最強大的方法之一。假設您有一個 列表,並且您只想保留此列表中的網域名稱。您可以使用文字編輯器的「搜尋和取代」功能輕鬆刪除 和 ,但如何刪除 後面的檔案名稱和子資料夾?
使用正規表示式這非常容易!使用正規表示式通配符 ,您可以刪除斜線及其後面的所有內容。這樣,您可以透過簡單的操作來清理整個列表,而您已經手動投入了許多小時的工作。這 艾鉛 是一個簡單的範例,但正規表示式的可能性非常廣泛。
正規表示式也可以用於尖叫青蛙。本文介紹了將 與 結合使用的兩個選項:
搜尋
搜尋 和 。
使用 進行 搜尋的正規表示式
正規表示式可用於向 指示哪些 應包含在爬網清單中以及 應產生什麼輸出。假設我們要從 中抓取所有部落格並將其顯示為輸出。
若要包含 ,請在 中導覽至設定 包含
若要排除 ,請在 中導覽至設定 排除
在本例中,我們只想在清單中包含包含 的 。
我們在「包含」視窗中輸入以下內容:
我們按“確定”,讓尖叫青蛙開始抓取網站。這會產生以下輸出:
透過這種簡單的方式,我們確保只有部落格文章顯示為輸出。您可以透過這種方式將 用於多種目的,例如:排除關閉子網域以及排除關閉 中的參數。
用於在 和 中搜尋和抓取的正規表示式
自動擷取許多重要數據,例如;頁面標題、 元素、規範標籤等。透過自訂提取和正規表示式,您可以對 進行編程,以從網站中提取幾乎任何所需的內容或程式碼。若要在 中使用此功能,請前往「配置」下的「自訂」「提取」 。