資源簡介 (共15張PPT)情境導入:本單元主題:智能技術初體驗語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。其最大優勢在于使得人機用戶界面更加自然和容易使用。為什么智能音箱能聽懂人們的問題 你認為如何讓人工智能聽懂家鄉的方言 《第5課 語音識別技術》2023年浙教版 八年級下冊-第2單元 智能技術初體驗 -珠珠老師信息科技 課件2022新版課標內容1活動1:語音識別的過程2活動2:語音識別的實踐《目錄》信息科技01語音識別的過程活動101.知識點講解語音識別一般會經歷以下基本過程:通過數模轉化得到一個數字聲音信號,再對該聲音信號進行預處理和特征提取,將該特征在聲學模型中進行模式識別得到音素序列,最后將該音素序列在語言模型中查找概率最高的文本,并輸出識別結果。語音識別的過程如圖5-1所示。活動1:語音識別的過程0101.知識點講解活動1:語音識別的過程011.聲音數字化聲音數字化是指將連續變化的聲音物理信號,每隔一段時間,測得模擬信號的電壓值,給出該電壓值相應的量化值,并在計算機中用O和1表示,將模擬信號轉換為數字信號。2.信號預處理對輸人的語音信號進行預處理,如降噪、消除錄制聲音時的雜音、回聲等等,得到一個比較干凈的語音信號。3.特征提取特征提取就是每隔一定時間,把聲音的音高、音長、音強和音色等特征提取出來的過程。4.模式匹配模式匹配就是將提取出來的特征在聲學模型中進行比對,得到一組音素序列。音素是根據語音的自然規律劃分出的最小的語音單位。漢語拼音中的"a、o、e、b、p、m…”等聲母、韻母可視為一個個音素。例如“國家”這個單詞包含“g、uo、j、i、a”這些音素,把音素按語言規律組合起來,就構成了每個單詞的發音。模式匹配是一種最原始、最基本的模式識別方法,在人工智能中有著廣泛的應用。01.知識點講解活動1:語音識別的過程01助力知識模式識別 人工智能中的模式識別是根據某個類別數據的共有模式,即模型(特征),對數據進行檢測識別或分類。模型的建立可以是直接給予某一事物的各種特征描述,或給予某一事物的海量數據樣本,讓機器通過樣本來自己發現特征。01.知識點講解活動1:語音識別的過程015.語言處理語言處理需要借助語言模型。聲學模型識別出的單個音素,經過語言模型可以找出該音素出現概率最高的一個詞語。不同單詞之間的搭配,在語句中出現的概率是不一樣的。一般來說,常見的詞語出現的概率比生僻的詞語出現的概率高。例如,在“世界旅游必去十大景點”中,“世界”出現的概率肯定高于“事件”,因此語言處理時會優先輸出“世界”這個概率高的單詞。“旅游”和“事件”搭配同時出現的概率,肯定低于“旅游”和“世界”這個單詞搭配的概率,因此語言處理時會優先輸出“世界”這個概率高的單詞。同時,單詞和單詞之間的搭配應符合語言習慣。助力知識語言模型對搜集到的海量語句進行分析統計,獲得單詞與單詞之間搭配的概率關系,從而形成語言模型。02語音識別的實踐活動201.知識點講解人工智能開放平臺集成了大量聲學和語言模型,通過這些平臺提供的軟件開發工具包,可以把錄制的聲音傳送到平臺并進行識別,再返回識別結果。如利用人工智能開放平臺的開發工具包,識別錄制的myaudio.wav文件中的語音信息,識別程序(部分)如圖5-2所示,識別過程及結果如圖5-3所示。活動2:語音識別的實踐0201.知識點講解活動2:語音識別的實踐02嘗試在人工智能開放平臺、APP或相關軟件中,將錄制的myaudio.wav文件分別轉換成文本。實踐探究語音識別的準確率與聲學模型及語言模型都密切相關。如果聲學模型是用普通話訓練的,那么識別方言語音,正確率就相對較低。通過及時更新地名、網絡流行語等詞匯,在語言模型中改變單詞之間的搭配概率,可以有效地提高新單詞的識別率。語音識別的準確率還與錄音時周邊環境的噪音、錄音設備的質量等因素有關。助力知識1.錄制一段語音,在人工智能開放平臺、APP或軟件中,將錄制的語音分別轉換成文本,并統計轉換后文本的準確率。錄制的語音文件名:______________,包含文字(不含標點)的數量:_______________________個。>鞏固練習序號 平臺名稱、APP或軟件名稱 識別出正確的文字數量 準確率12342.選擇不同的“發音人”或者方言對同一段文本信息進行錄制,然后在同一個平臺、APP或軟件中進行測試,并統計識別正確率。文本信息中包含文字(不含標點)|的數量:______個。平臺、APP或軟件名稱:>鞏固練習序號 錄制者姓名 采用的語言 識別出正確的文字數量 準確率12341活動1:語音識別的過程2活動2:語音識別的實踐《總結》信息科技《感謝觀看》- Thank for Viewing -珠珠老師2023年浙教版 八年級下冊《第5課 語音識別技術》教學設計教學內容分析本節課是2023年浙教版出版的八年級下冊第二單元第1課。本節課分為兩個活動:“語音識別的過程”“語音識別的實踐”兩部分內容組成。學生通過小組合作探究學習逐步掌握本節課的知識點,具備一定的小組合作能力、探究能力、創新能力等,提升信息社會責任,綜合提升信息素養。教學目標及核心素養指向1、通過對語音識別應用的體驗,理解語音識別的基本過程和原理(信息意識、計算思維) 2、了解聲學模型和語音模型,感受語音識別帶來的便利(信息意識、計算思維、數字化學習與創新、信息社會責任)教學重難點教學重點: 1、通過對語音識別應用的體驗,理解語音識別的基本過程和原理 設計原因:語音識別應用是本節課的主要內容,知識點的滲透需要作為重點內容。 教學難點: 了解聲學模型和語音模型,感受語音識別帶來的便利 設計原因:聲學模型和語音模型此部分對學生來說難度較高,應作為難點內容。教學過程1、情境導入(3分鐘)教師活動 學生活動情境引入:人語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。其最大優勢在于使得人機用戶界面更加自然和容易使用。 為什么智能音箱能聽懂人們的問題 你認為如何讓人工智能聽懂家鄉的方言 學生聽教師引導生活中的案例,學生討論,回答提問設計意圖: 激發學生對語音識別的學習興趣并快速進入學習狀態。2、新知講授(35分鐘)教師活動 學生活動活動1:語音識別的過程 知識講解 語音識別一般會經歷以下基本過程:通過數模轉化得到一個數字聲音信號,再對該聲音信號進行預處理和特征提取,將該特征在聲學模型中進行模式識別得到音素序列,最后將該音素序列在語言模型中查找概率最高的文本,并輸出識別結果。語音識別的過程如圖5-1所示。 1.聲音數字化 聲音數字化是指將連續變化的聲音物理信號,每隔一段時間,測得模擬信號的電壓值,給出該電壓值相應的量化值,并在計算機中用O和1表示,將模擬信號轉換為數字信號。 2.信號預處理 對輸人的語音信號進行預處理,如降噪、消除錄制聲音時的雜音、回聲等等,得到一個比較干凈的語音信號。 3.特征提取 特征提取就是每隔一定時間,把聲音的音高、音長、音強和音色等特征提取出來的過程。 4.模式匹配 模式匹配就是將提取出來的特征在聲學模型中進行比對,得到一組音素序列。音素是根據語音的自然規律劃分出的最小的語音單位。漢語拼音中的"a、o、e、b、p、m…”等聲母、韻母可視為一個個音素。例如“國家”這個單詞包含“g、uo、j、i、a”這些音素,把音素按語言規律組合起來,就構成了每個單詞的發音。模式匹配是一種最原始、最基本的模式識別方法,在人工智能中有著廣泛的應用。 重點知識:模式識別 人工智能中的模式識別是根據某個類別數據的共有模式,即模型(特征),對數據進行檢測識別或分類。模型的建立可以是直接給予某一事物的各種特征描述,或給予某一事物的海量數據樣本,讓機器通過樣本來自己發現特征。 5.語言處理 語言處理需要借助語言模型。聲學模型識別出的單個音素,經過語言模型可以找出該音素出現概率最高的一個詞語。不同單詞之間的搭配,在語句中出現的概率是不一樣的。一般來說,常見的詞語出現的概率比生僻的詞語出現的概率高。例如,在“世界旅游必去十大景點”中,“世界”出現的概率肯定高于“事件”,因此語言處理時會優先輸出“世界”這個概率高的單詞。“旅游”和“事件”搭配同時出現的概率,肯定低于“旅游”和“世界”這個單詞搭配的概率,因此語言處理時會優先輸出“世界”這個概率高的單詞。同時,單詞和單詞之間的搭配應符合語言習慣。 語言模型對搜集到的海量語句進行分析統計,獲得單詞與單詞之間搭配的概率關系,從而形成語言模型。 活動2:語音識別的實踐 知識講解 人工智能開放平臺集成了大量聲學和語言模型,通過這些平臺提供的軟件開發工具包,可以把錄制的聲音傳送到平臺并進行識別,再返回識別結果。如利用人工智能開放平臺的開發工具包,識別錄制的myaudio.wav文件中的語音信息,識別程序(部分)如圖5-2所示,識別過程及結果如圖5-3所示。 重點知識 語音識別的準確率與聲學模型及語言模型都密切相關。如果聲學模型是用普通話訓練的,那么識別方言語音,正確率就相對較低。通過及時更新地名、網絡流行語等詞匯,在語言模型中改變單詞之間的搭配概率,可以有效地提高新單詞的識別率。語音識別的準確率還與錄音時周邊環境的噪音、錄音設備的質量等因素有關。 學生通過教師的講解,以小組合作的方式,開展探討交流,完成任務 活動1:語音識別的過程 小組合作探究 1.梳理語音識別的過程。 活動2:語音識別的實踐 小組合作探究 1.嘗試在人工智能開放平臺、APP或相關軟件中,將錄制的myaudio.wav文件分別轉換成文本。設計意圖: 培養學生獨立思考的能力,提高核心素養。3、課堂小結(7分鐘)教師活動 學生活動總結本課內容: 活動1:語音識別的過程 活動2:語音識別的實踐 學生一同回答并梳理知識設計意圖: 幫助學生梳理本節課知識,加深學生對知識的理解。(共1張PPT)學習單1活動1:語音識別的過程梳理語音識別的過程,并將過程寫在下面實踐探究班級:8年__班組別:______2活動2:語音識別的實踐嘗試在人工智能開放平臺、APP或相關軟件中,將錄制的myaudio.wav文件分別轉換成文本。思考與討論《第5課 語音識別技術》作業設計作業分析作業類型 基礎型作業 探究型作業 實踐型作業 跨學科綜合作業作業類別 課時作業 單元作業 學期作業應用場景 課前預習 課中練習 課后作業作業對象 全體學生作業 學生根據情況可選作業設計思路 浙教版8下信息科技學科第5課《語音識別技術》作業設計旨在通過填空題、選擇題和實踐題等多種題型,全面考察學生對語音識別技術基本概念、原理及應用的理解與掌握。作業內容緊扣教材內容,難度適中,旨在幫助學生鞏固課堂知識,提升實際應用能力。作業內容一、填空題【難度等級:★★★★】1. 語音識別技術是一種將人類語音轉換為________的技術,它廣泛應用于智能手機、智能家居等領域。2. 語音識別系統通常包括________、特征提取、聲學模型、語言模型等組成部分。3. 在語音識別過程中,________是將輸入的語音信號轉換成機器可讀的數字信號的關鍵步驟。4. 提高語音識別準確率的方法包括優化________、增加訓練數據、改進算法等。5. 當前流行的語音助手,如Siri、小愛同學等,都是基于________技術實現的智能交互系統。二、選擇題【難度等級:★★★】1. 語音識別技術是通過什么方式將語音轉換為文字的?A. 圖像識別B. 信號處理C. 模式識別D. 語音編碼2. 語音識別技術中,哪個部分負責將語音信號轉換為數字特征?A. 聲學模型B. 特征提取C. 語言模型D. 語音識別器3. 下列哪項不是提高語音識別準確率的方法?A. 增加訓練數據B. 降低環境噪音C. 減少模型復雜度D. 優化聲學模型4. 語音助手Siri使用的是哪家公司的語音識別技術?A. 谷歌B. 亞馬遜C. 蘋果D. 微軟5. 在語音識別技術中,聲學模型的主要作用是什么?A. 描述語音信號與文字之間的對應關系B. 識別語音中的情感C. 提取語音信號中的特征D. 生成語音合成所需的參數三、實踐題【難度等級:★★★★★】1. 請使用智能手機或電腦上的語音識別軟件,嘗試將以下句子轉換為文字:“今天天氣真好,適合去戶外運動。”將轉換后的文字結果記錄下來,并觀察語音識別軟件在轉換過程中是否出現了錯誤或誤差。2. 嘗試使用不同的語速、音量和口音,再次對同一句子進行語音識別轉換,并比較結果。記錄下語速、音量和口音對語音識別準確率的影響。3. 請訪問一款在線語音識別服務(如訊飛語音、百度語音識別等),上傳一段自己的錄音,觀察并分析該服務在識別過程中的表現。記錄識別結果的準確性,并嘗試分析可能導致識別錯誤的原因(如背景噪音、發音不清晰等)。 展開更多...... 收起↑ 資源列表 第5課語音識別技術 作業設計.docx 第5課語音識別技術 學習單.pptx 第5課語音識別技術 教學設計.docx 第5課語音識別技術 教學課件.pptx 縮略圖、資源來源于二一教育資源庫