在計算機系統內部使用的漢字編碼是機內碼。
漢字機內碼,又稱“漢字ASCII碼”,簡稱“內碼”,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受后就由漢字操作系統的“輸入碼轉換模塊”轉換為機內碼,與所采用的鍵盤輸入法無關。
機內碼是漢字最基本的編碼,不管是什么漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。不過國標碼還不能直接在計算機上使用,因為這樣還是會和早已通用的ASCII碼沖突,從而導致亂碼。
漢字進入計算機的三種途徑:
1、機器自動識別漢字
計算機通過“視覺”裝置(光學字符閱讀器或其他),用光電掃描等方法識別漢字。
2、通過語音識別輸入
計算機利用人們給它配備的“聽覺器官”,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
3、通過漢字編碼輸入
根據一定的編碼方法,由人借助輸入設備將漢字輸入計算機。機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由于難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。