資源簡介 (共18張PPT)第14課 互聯網搜索新發展第三單元 便捷的互聯網服務第14課 學習目標123了解搜索引擎的工作原理。學習目標知道搜索引擎的簡單工作過程。了解網絡爬蟲等自動化技術給搜索帶來的影響。第14課 課堂導入學校讀書節活動正在如火如荼地開展著,有些同學想通過網絡了解更多圖書的信息,有些同學想查找資料制作讀書海報。如何在網絡中簡單、高效地尋找想要的信息呢?問題情境相信大家會不約而同地選擇搜索引擎。下面,就帶領同學們深入了解搜索引擎。第14課 學習內容二 搜索系統的創新改進學習內容一 搜索引擎的工作思路一、搜索引擎的工作思路第14課 學習內容想象一下,互聯網上有難以計數的網站,搜索引擎需要從這些網站中尋找與關鍵詞相匹配的網頁,然后返回搜索結果,應該需要花費很長時間。但實際上,在搜索引擎中輸入問題或關鍵詞后,很快就能看到結果,為什么能搜得這么快?第14課 學習內容實驗目的 熟悉搜索引擎的工作過程實驗條件 《簡易搜索系統》軟件、配套資源中的Web文件夾實驗步驟1.運行《簡易搜索系統》軟件,啟動搜索服務,然后嘗試用關鍵詞“中國探月”進行搜索,查看搜索結果。□搜到相關信息 □未搜到相關信息√一、搜索引擎的工作思路第14課 學習內容2.把老師提供的Web文件夾復制到搜索服務軟件所在的文件夾中。3.重新運行搜索服務軟件后,再次以“中國探月”為關鍵詞進行搜索。一、搜索引擎的工作思路第14課 學習內容6.繼續進行搜索,看看能否搜到剛剛保存的內容。4.瀏覽一些網頁,并把網頁保存到Web文件夾中。5.打開Web文件夾中的pages.csv,記錄網頁文件的文件名和對應的網址。一、搜索引擎的工作思路實驗結論1.搜索引擎搜到的信息是( □搜索前放進去的 □實時在網絡中獲取的)。2.網頁數據都保存在:3.網頁文件跟實際網址的關系保存在:4.當前網頁排序用的算法是:第14課 學習內容√Web文件夾pages.csv根據關鍵詞出現的次數進行排序,次數越多越靠前一、搜索引擎的工作思路第14課 學習內容5.梳理搜索系統的結構組成,把下圖補充完整。A.網頁數據B.建立索引C.網頁索引D.獲取信息E.網頁排序DABCE一、搜索引擎的工作思路第14課 學習內容搜索引擎提前把海量信息保存下來,耗費了大量的存儲空間,換來了對查詢需求的快速響應。這種工作方式體現了“以空間換時間”的思想。一、搜索引擎的工作思路第14課 學習內容如果讓計算機替代人工操作,會極大提升工作效率。例如,用網絡爬蟲自動獲取相關的網頁以備查詢。通過人工操作來擴充搜索系統中的網頁數據比較煩瑣,有沒有辦法更高效地完成相關操作呢?二、搜索系統的創新改進第14課 學習內容1.運行《網絡爬蟲測試》軟件,輸入一個網址后,單擊窗口中的按鈕,看看能否自動獲取相應的網頁。2.把spider.pyc文件復制到搜索系統文件夾中,然后重新運行《簡易搜索系統》軟件,觀察界面的變化。二、搜索系統的創新改進第14課 學習內容二、搜索系統的創新改進3.輸入一個網址,然后單擊“啟動網絡爬蟲”按鈕。4.嘗試用相應的關鍵詞搜索,對比一下搜索到的結果有什么不同。第14課 學習內容5.對照搜索引擎工作流程,梳理網絡爬蟲對搜索引擎的改進。→自動→自動二、搜索系統的創新改進1.搜索引擎提前把信息保存下來,以供用戶搜索。2.搜索引擎的工作流程包含獲取信息、建立索引、網頁排序等步驟。3.搜索引擎通過自動爬取網頁等技術提高效率。第14課 課堂總結1.運行《分詞測試》軟件,輸入一個短語進行分詞,感受分詞的效果。第14課 拓展與提升2.把tokenizer.pyc文件復制到搜索系統文件夾中,然后運行《簡易搜索系統》軟件,看看搜索結果的變化。進一步創新改進搜索系統3.搜索結果是根據關鍵詞出現的次數進行排序的。請思考:除了“關鍵詞出現次數”這一指標外,還有哪些指標可以讓搜到的網頁,排序更精準?第14課 拓展與提升4.參照搜索引擎工作流程,暢想一下,還有什么地方可以改進,然后交流討論技術創新的推動作用。進一步創新改進搜索系統 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫