資源簡介 課程基本信息課題《數據編碼——字符編碼》教科書書名:《信息技術必修1:數據與計算》出版社:人民教育出版社、中國地圖出版社出版日期:2019年6月教學目標教學目標:1.知道字符編碼作用,了解常見字符編碼方案ASCII、GB2312-1980、GBK、GB18030-2005、unicode字符集及編碼方案。【信息意識】【計算思維】2.了解計算機處理字符的過程,知道中文漢字的輸入碼、機內碼以及輸出碼。【信息意識】【計算思維】3.掌握常見字符處理問題(txt文檔與網頁亂碼現象、Word中文字重疊)的解決方法,能夠根據需要選擇合適的字符編碼。【信息意識】【數字化學習與創造】教學重點:常見的字符編碼方案教學難點:常見字符處理問題的解決方法教學過程時間教學環節主要師生活動2分鐘提出真實問題、確立探究主題在日常使用計算機的時候,同學們有沒有遇到過這樣的情況或問題呢:打開文本文檔、瀏覽網頁時出現了亂碼現象Word文件中出現了文字重疊的情況遇到這些情況時,我們該怎么辦呢?若想解決問題,必要知其原理。今天,我們就和大家一起來探究計算機是如何處理字符的。15分鐘辨析概念原理、理解字符編碼計算機作為數據處理的一種工具,只識別0和1的二進制。因此,在處理各種對象時需要將其轉換成計算機可識別的二進制數據。那么字符是如何轉變成二進制的呢?(一)探究一:字符如何變成二進制?1.字符編碼的概念字符編碼是按照預先確定的規則,將所需字符轉換映射為計算機可以接受的二進制數字的過程。字符編碼方案會為每個字符指定對應的數字編碼,便于不同計算機系統間交換文件,產生的編碼叫做交換碼。字符編碼包括字符集(系統支持的所有抽象字符的集合)與字符編碼(方案)(符號集合與數字系統間建立對應關系的法則)。(1)英文字符編碼方案——ASCII在早期應用時,計算機只用處理英文字母、數字和常用的英文標點符號。為了處理英文字符,美國信息標準協會制定ASCII(AmericanStandardCodeforInformationInterchange)美國信息交換標準代碼。在ASCII編碼方案中,制定了包含128個英文字符的字符集,包括英文大小寫字、數字、常用符號等。提問思考:至少需要幾個字節可以表示128個字符呢?1個字節為8位,可以表示256種情況。因此,ASCII采用1個字節對128個字符進行編碼。體驗活動:利用編碼輸入字符在輸入英文字符時,我們可以通過鍵入字符、插入符號等方式,也可以利用ALT+ASCII編碼來輸入。(2)中文字符編碼方案當計算機引入中國后,我國的中文漢字多達10萬多個,1個字節的ASCII編碼已無法滿足需求。因此,我國設計了GB系列字符編碼用于將漢字轉換為計算機可接受的數字。GB2312-19801980年,我國頒布了GB2312-1980,即《信息交換用漢字編碼字符集——基本集》。共收錄了6763個漢字,以及包括數字、拉丁字母、希臘字母等在內的682個字符。GB2312-1980兼容ASCII編碼,依然用單字節表示ASCII規定的英文字符,采用2個字節表示1個漢字以及其他字符。GBKGB2312基本滿足了計算機處理漢字的需要,但未包含人名、古漢語等方面出現的罕用字。在GB2312的基礎上我們又增加了2萬多個字符1995年,形成了GBK《漢字內碼擴展規范》,。GB18030-2005在GBK的基礎上,GB18030-2005又增加了少數民族的文字。采用單字節、雙字節和4字節的變長編碼,且能夠向下兼容GBK、GB2312和ASCII。(3)unicode字符集與編碼方案每個國家擁有自己的語言和文化,在使用計算機時也會建立自己的字符編碼。隨著互聯網將世界連接起來,各個國家采用的字符編碼不同,信息交流時就會產生問題。那么有沒有一種編碼方案能夠容納世界上的所有字符,實現集大成者呢?面對這樣的情況,國際標準化組織和Unicode組織制定了unicode字符集,致力于將世界上所有文字和符號都納入,以滿足使用不同語言的人利用計算機進行信息交流。對于unicode字符集,常見的編碼方案有UTF-8、UTF-16、UTF-32等。(4)體驗活動:txt中的聯通剛剛我們學習了常見的字符編碼,下面我們通過實踐體驗一下不同的字符編碼對字符處理會產生什么樣的影響。①體驗實踐請同學們在自己的計算機中新建一個txt文檔,輸入“聯通”兩個漢字,保存后再打開看看會出現什么?②原理分析經過實踐,同學們發現“聯通”兩個字變成了亂碼,那么這是為什么呢?讓我們通過一段短片來看一下。③問題解決文本文檔【另存為】-【編碼】選項中選擇合適的字符編碼。(二)探究二:計算機處理字符時要經歷哪些過程?1.計算機處理字符的基本工作過程通過鍵盤等方式輸入字符,在計算機內部進行存儲和處理,最后通過顯示屏等輸出。(1)輸入字符英文字符:利用鍵盤直接鍵入中文漢字:輸入碼(外碼)輸入碼是將漢字與鍵盤能建立對應關系,實現利用鍵盤將漢字輸入到計算機中。(2)處理字符英文字符:ASCII編碼中文漢字:機內碼(由交換碼計算而來)由于GB2312-1980等編碼方案兼容ASCII編碼,以3021(十六進制)為例,它在GB2312-1980和ASCII中表示不同,計算機就會產生歧義。因此,計算機在處理中文漢字時,要在交換碼的基礎上計算得出機內碼。(3)輸出字符字型碼用于字符在顯示屏或打印機輸出,又稱輸出碼、字模碼,通常有兩種表示方式:點陣和矢量。不同的字體庫擁有不同的字形碼。2.小結計算機處理字符的過程環節英文中文輸入鍵盤直接鍵入輸入碼(拼音、五筆等)處理ASCII編碼機內碼輸出字型碼(輸出碼):點陣&矢量6分鐘解決常見問題、應用所學實踐1.問題1:如何解決亂碼的問題?解決方法:選擇合適的字符編碼方案(1)txt文檔——另存為選擇編碼方案(2)網頁——右擊選擇編碼方案2.問題2:如何解決Word中的文字重疊?解決方法:字間距設置,選擇合適的字體庫3.問題2拓展:Word能不能同時保存字體?解決方法:保存時嵌入字體庫學生根據演示視頻學習保存Word文件時嵌入字體庫的方法并實踐。2分鐘回顧復習新知、自評學習效果1.回復復習所學知識2.利用小測自評學習效果Q1.在GB2312-1980中,一個漢字占用幾個字節?(單選)()A.1個B.2個C.4個Q2.以下哪些是常用漢字的編碼方案?(多選)()A.ASCIIB.GB2312-1980C.GBKD.GB18030-2005Q3.用計算機處理漢字,可能要經歷哪些編碼過程?(單選)()A.輸入碼->ASCII碼->字型碼B.字型碼->機內碼->輸入碼C.輸入碼->機內碼->字型碼E.unicode字符集與UTF-8編碼(共48張PPT)數據編碼——字符編碼(第四課時)你遇到過這些問題嗎?文檔網頁出現亂碼你遇到過這些問題嗎?下載Word文字重疊計算機是如何處理字符的?計算機是如何處理字符的?字符如何轉換成二進制?一、字符編碼字符(文字、符號等)數字(二進制等)預先確定的規則每個字符擁有對應的數字編碼便于不同計算機系統間交換信息交換碼編碼方案一、字符編碼字符(文字、符號等)數字(二進制等)預先確定的規則編碼方案字符集方案支持的所有抽象字符的集合字符編碼字符集與數之間建立對應關系的法則1.英文字符編碼英文字母數字英文標點符號……1.英文字符編碼ASCII編碼美國信息交換標準代碼(AmericanStandardCodeforInformationInterchange)字符集:大小寫字母、數字、常用符號等128個字符1.英文字符編碼001100000001100011001100102001100113……01000001A01100001a01000000@00101011+……128個字符幾個字節?1.英文字符編碼ASCII編碼美國信息交換標準代碼(AmericanStandardCodeforInformationInterchange)字符集:大小寫字母、數字、常用符號等128個字符字符編碼:利用1個字節對128個字符進行數字編碼體驗活動:利用ASCII碼輸入字符ALT鍵+數字(十進制)2.中文字符編碼2.中文字符編碼《信息交換用漢字編碼字符集——基本集》收錄6763個漢字,及包括數字、拉丁字母等在內的682個字符字符編碼:兼容ASCII編碼;1個字節表示ASCII規定的英文字符,采用2個字節表示1個漢字以及其他字符。GB2312-19802.中文字符編碼GB2312-1980擴充2萬多個字符GBK《漢字內碼擴展規范》2.中文字符編碼GB2312-1980GBKGB18030-2005收錄7萬多個漢字兼容GB2312-1980、GBK、ASCII等采用多字節編碼,包括1個、2個、4個字節2.中文字符編碼GB2312-1980GBKGB18030-2005GB18030-2005GBKGB2312-1980ASCII3.通用字符編碼方案unicode字符集與編碼方案致力于納入世界上所有字符國際化標準組織和Unicode組織聯合制定unicode字符集字符編碼方案UTF-8UTF-16UTF-32……不同語言的人使用計算機體驗活動:txt中的“聯通”新建一個txt文本文檔,輸入“聯通”兩個字,保存后再打開看看會如何?體驗活動:txt中的“聯通”新建一個txt文本文檔,輸入“聯通”兩個字,保存后再打開看看會如何?為什么會出現亂碼?資料體驗活動:txt中的“聯通”為什么會出現亂碼?相同數字在各字符編碼代表可能不同選擇合適的字符編碼二、計算機處理字符的過程存儲、操作、傳輸等處理顯示屏輸出、打印輸出等輸出利用鍵盤等輸入字符輸入1.輸入字符:輸入碼利用鍵盤等輸入字符輸入英文字符鍵盤對應,直接輸入加入我們!1.輸入字符:輸入碼利用鍵盤等輸入字符輸入中文漢字拼音、五筆等輸入碼(外碼)建立漢字與鍵盤的關系加入我們!二、計算機處理字符的過程環節英文中文輸入鍵盤直接鍵入輸入碼(拼音、五筆等)2.內部處理:ASCII編碼&機內碼存儲、操作、傳輸等處理英文字符字符二進制中文字符ASCII編碼2.內部處理:ASCII編碼&機內碼例:3021(十六進制)0!啊GB2312ASCII編碼產生歧義!GB18030-2005GBKGB2312-1980ASCII2.內部處理:ASCII編碼&機內碼英文字符字符二進制中文字符ASCII編碼機內碼基于交換碼計算存儲、操作、傳輸等處理二、計算機處理字符的過程環節英文中文輸入鍵盤直接鍵入輸入碼(拼音、五筆等)處理ASCII編碼機內碼3.輸出字符:字型碼顯示屏輸出、打印輸出等輸出字符二進制字型碼3.輸出字符:字型碼用于字符在顯示屏或打印機輸出又稱輸出碼、字模碼通常有兩種方式:點陣和矢量字型碼顯示屏輸出、打印輸出等輸出3.輸出字符:字型碼點陣碼3.輸出字符:字型碼二、計算機處理字符的過程環節英文中文輸入鍵盤直接鍵入輸入碼(拼音、五筆等)處理ASCII編碼機內碼輸出字型碼(輸出碼):點陣&矢量三、解決常見的字符處理問題問題1:如何解決顯示亂碼?解決方法:選擇合適的字符編碼方案三、解決常見的字符處理問題問題1:如何解決顯示亂碼?解決方法:選擇合適的字符編碼方案txt文本文檔另存為—>選擇編碼三、解決常見的字符處理問題問題1:如何解決顯示亂碼?解決方法:選擇合適的字符編碼方案網頁:右擊—>選擇編碼三、解決常見的字符處理問題問題2:如何解決Word中的文字重疊?解決方法:字間距設置,選擇合適的字體庫三、解決常見的字符處理問題問題2拓展:Word能不能同時保存字體?解決方法:保存時嵌入字體庫三、解決常見的字符處理問題四、小結與練習字符編碼字符編碼概念計算機處理漢字的編碼過程含義:字符轉換成二進制組成:字符集和編碼方式等常見字符編碼方案作用:便于不同系統交換信息英文:ASCII編碼通用:unicode字符集與編碼方案(UTF-8等)中文:GB2312-1980、GBK、GB18030-2005輸入:輸入碼(拼音、五筆等)輸出:字型碼(點陣&矢量)處理:機內碼(基于交換碼計算而得)四、小結與練習Q1.在GB2312-1980中一個漢字占用幾個字節?Q2.常用漢字的編碼方案有哪些?Q3.用計算機處理漢字,可能要經歷哪些編碼過程?課后練習Q1.在GB2312-1980中,一個漢字占用幾個字節?(單選)()A.1個B.2個C.4個Q2.以下哪些是常用漢字的編碼方案?(多選)()ASCIIB.GB2312-1980C.GBKD.GB18030-2005E.unicode字符集與UTF-8編碼Q3.用計算機處理漢字,可能要經歷哪些編碼過程?(單選)()A.輸入碼->ASCII碼->字型碼B.字型碼->機內碼->輸入碼C.輸入碼->機內碼->字型碼正確答案:BBCDEASCII是英文字符編碼。C學習任務單課程基本信息課題《數據編碼——字符編碼》教科書書名:《信息技術必修1:數據與計算》出版社:人民教育出版社、中國地圖出版社出版日期:2019年6月學生信息姓名學校班級學號學習目標(1)知道字符編碼作用,了解常見的字符編碼方案ASCII、GB2312-1980、GBK、GB18030-2005、unicode字符集及編碼方案。【信息意識】【計算思維】(2)了解計算機處理字符的過程,知道中文漢字的輸入碼、機內碼以及輸出碼。【信息意識】【計算思維】(3)掌握常見字符處理問題(txt文檔與網頁亂碼現象、Word中文字重疊)的解決方法,能夠根據需要選擇合適的字符編碼。【計算思維】【數字化學習與創造】課前學習任務1.準備好任務單。2.在自己的電腦中安裝好Word軟件。課上學習任務【學習任務一】體驗活動:利用ASCII碼輸入字符請同學們打開ASCII編碼表,查找字符對應的十進制數字。新建word文件,利用ALT+十進制數字嘗試輸入字母或符號,例如ALT+65輸入A。其中,十進制數字要通過數字小鍵盤輸入。提示:如果使用的筆記本電腦沒有數字小鍵盤,同學們可以通過【開始】-搜索【屏幕鍵盤】-點擊【NumLock】,打開屏幕鍵盤中的數字小鍵盤。標準ASCII編碼表見最后。請將你的輸入結果截圖放在下面:【學習任務二】體驗活動:txt中的“聯通”請在自己的計算機上新建一個txt文檔,輸入“聯通”兩個字,保存后再打開看看會出現什么?出現亂碼的原因是:____________________________________________解決的辦法是:__________________________________________________【學習任務三】任務實踐:Word保存嵌入字體庫請同學們根據課程中的演示,學習如何在Word設置文件保存嵌入字體庫。推薦的學習資源字符所占的存儲容量用點陣表示字型時,根據漢字的不同要求所有的點陣也不一樣。通常,顯示一個漢字一般采用16×16點陣或24×24點陣或48×48點陣。根據點陣的大小,可以計算出一個漢字所需占用的空間。例如16×16點陣的漢字字模,每個小格是1b,字模大小就是16b×16b/2=32B,即16×16點陣表示一個漢字,字形碼需用32字節。2.ANSI編碼在unicode字符集及其編碼方案問世前,各個國家都在ASCII編碼的基礎上設計了自己國家的編碼方案。所有這些各個國家和地區所獨立制定的既兼容ASCII又互相不兼容的字符編碼,微軟統稱為ANSI編碼。在Windows系統中,ANSI編碼一般代表系統默認編碼方式。例如,在簡體中文操作系統中ANSI編碼默認指的是GB系列編碼(GB2312、GBK、GB18030)標準ASCII編碼二進制十進制十六進制字符/縮寫解釋00000000000NUL(NULL)空字符00000001101SOH(StartOfHeadling)標題開始00000010202STX(StartOfText)正文開始00000011303ETX(EndOfText)正文結束00000100404EOT(EndOfTransmission)傳輸結束00000101505ENQ(Enquiry)請求00000110606ACK(Acknowledge)回應/響應/收到通知00000111707BEL(Bell)響鈴00001000808BS(Backspace)退格00001001909HT(HorizontalTab)水平制表符00001010100ALF/NL(LineFeed/NewLine)換行鍵00001011110BVT(VerticalTab)垂直制表符00001100120CFF/NP(FormFeed/NewPage)換頁鍵00001101130DCR(CarriageReturn)回車鍵00001110140ESO(ShiftOut)不用切換00001111150FSI(ShiftIn)啟用切換000100001610DLE(DataLinkEscape)數據鏈路轉義000100011711DC1/XON(DeviceControl1/TransmissionOn)設備控制1/傳輸開始000100101812DC2(DeviceControl2)設備控制2000100111913DC3/XOFF(DeviceControl3/TransmissionOff)設備控制3/傳輸中斷000101002014DC4(DeviceControl4)設備控制4000101012115NAK(NegativeAcknowledge)無響應/非正常響應/拒絕接收000101102216SYN(SynchronousIdle)同步空閑000101112317ETB(EndofTransmissionBlock)傳輸塊結束/塊傳輸終止000110002418CAN(Cancel)取消000110012519EM(EndofMedium)已到介質末端/介質存儲已滿/介質中斷00011010261ASUB(Substitute)替補/替換00011011271BESC(Escape)逃離/取消00011100281CFS(FileSeparator)文件分割符00011101291DGS(GroupSeparator)組分隔符/分組符00011110301ERS(RecordSeparator)記錄分離符00011111311FUS(UnitSeparator)單元分隔符001000003220(Space)空格001000013321!?001000103422"?001000113523#?001001003624$?001001013725%?001001103826&?001001113927'?001010004028(?001010014129)?00101010422A?00101011432B+?00101100442C,?00101101452D-?00101110462E.?00101111472F/?0011000048300?0011000149311?0011001050322?0011001151333?0011010052344?0011010153355?0011011054366?0011011155377?0011100056388?0011100157399?00111010583A:?00111011593B;?00111100603C<?00111101613D=?00111110623E>?00111111633F??010000006440@?010000016541A?010000106642B?010000116743C?010001006844D?010001016945E?010001107046F?010001117147G?010010007248H?010010017349I?01001010744AJ?01001011754BK?01001100764CL?01001101774DM?01001110784EN?01001111794FO?010100008050P?010100018151Q?010100108252R?010100118353S?010101008454T?010101018555U?010101108656V?010101118757W?010110008858X?010110018959Y?01011010905AZ?01011011915B[?01011100925C\?01011101935D]?01011110945E^?01011111955F_?011000009660`?011000019761a?011000109862b?011000119963c?0110010010064d?0110010110165e?0110011010266f?0110011110367g?0110100010468h?0110100110569i?011010101066Aj?011010111076Bk?011011001086Cl?011011011096Dm?011011101106En?011011111116Fo?0111000011270p?0111000111371q?0111001011472r?0111001111573s?0111010011674t?0111010111775u?0111011011876v?0111011111977w?0111100012078x?0111100112179y?011110101227Az?011110111237B{?011111001247C|?011111011257D}?011111101267E~?011111111277FDEL(Delete)刪除 展開更多...... 收起↑ 資源列表 word如何保存時嵌入字體.mp4 為何聯通是亂碼.mp4 體驗活動:ALT+數字鍵.mp4 體驗活動:txt中的聯通.mp4 數據編碼——字符編碼(第四課時)-任務單.docx 數據編碼——字符編碼(第四課時)-教學設計.docx.docx 數據編碼——字符編碼(第四課時)-練習題.docx 數據編碼——字符編碼(第四課時)-課件.pptx 縮略圖、資源來源于二一教育資源庫