文字集合と符号化方式

文字コードの構成要素には、文字集合、符号化方式の2つがある事を昨日知りました。なので今日は文字集合、符号化方式について調べました。

 

文字集合とは

表現できる文字の集合です。

 

符号化方式とは

文字をコンピュータ上でどういった数値で表現するかを定義したものです。

 

 

Unicode文字集合


UTF-8, UTF-16Unicodeの符号化方式
UTF-8は8bit単位、UTF-16は16bit単位で表現されます。

 

感想その他

前職でエクセルで文字化けしないCSVを出力する機能を作った際に文字コードについて少し調べましたが、文字集合、符号化方式の2つの違いをよくわかっておりませんでした。

知れて良かったです!