コンピュータで文字を処理したり通信するために使用する文字コードについて説明します。
文字コードとは
文字コードとは、文字をコンピュータで処理したり通信したりするために、文字に番号を割り振って定義したものです。
例えば「あ」は「1」、「い」は「2」という共通ルールを作ることで、文字列のデータを送受信することが可能になりました。
初期は、ASCIIという英語圏のみ対応している単純な文字コードでしたが、現在では、世界中のあらゆる文字を定義しようとしています。
文字コードが違う場合
文字コードが違う場合「文字化け」が発生します。例えば、WindowsとMac間でファイルを送付した結果、文字化けを経験された方は少なくないかと思います。原因は、ファイルの圧縮をする際に、Windowsは「Shift-JIS」を使用し、Macは「UTF-8」を使用するためです。
文字コードの種類
下記が代表的な文字コードになります。
ASCII
アメリカ規格協会(ANSI)が制定した文字コード。最も基礎のとなる文字コードになります。扱っている文字は全て半角になり「アルファベット」「数字」「記号」を表現します。漢字など2バイト以上(全角)の文字は表現できないため、なるべく使用を避けましょう。
Shift-JIS
ASCIIに日本語を加えた文字コードです。Microsoft社により定められた文字コードになります。WindowsやMS-DOS、Macで使用されています。
UTF-8
ASCIIに各国の文字を加えた文字コードです。ASCIIと同じ部分は1バイト、その他の部分を2-6バイトで符号化することで、アルファベット、漢字、カナ、アラビア文字など世界中の文字を定義しています。インターネットの世界共通文字コードとして使用されています。
POINT
各文字コードには特徴があります。相手の環境によっては文字化けを起こす可能性があることを意識しておきましょう。
コメント