文字コード
今日は文字コードについて少し調べました〜
文字コードとは
文字に数値を当てはめたものです。
文字コードの種類
- ASCII
アルファベット、数字、その他記号を表現できる。7ビットで1文字を表現できる。
1文字2バイトで表現されます。
ASCIIで表現できるものに加え、ひらがな、カタカナ、漢字が使えます。
世界で使われる全ての文字を共通の文字集合にて利用できるようにしようという考えで作られた文字コードです。
はじめは1文字2バイトでしたが足りなくなり、3バイト、4バイトと拡張されています。
何でいろんな種類があるか
以下のような歴史的な経緯があるためだそうです。
アルファベットを1バイト以下で表現するASCII誕生
→ アルファベット意外にも対応するため2バイトの文字コードが誕生
→ 互換性を保つために複雑化
感想その他
UnicodeとUTF-8とがごっちゃになっているのでその辺りも整理したいです。