Unicodeとは
コンピュータは本質的には数字しか扱うことができないため、 文字や記号を扱う時にはそれぞれを番号で表現して扱えるようにしています。 この番号の割り当て方法を文字コードと呼んでいますが、 UnicodeはApple社、IBM社、Microsoft社、 Xerox社など米国の情報関連企業が中心となって提唱し、 1993年に国際標準化機構(ISO)でISO/IEC 10646の一部として標準化された文字コードです。 当初の目的は、世界中で使われる文字を16ビットの数値に割り当て、 固定長でモード切り替えをなくし、 プログラムでの処理を簡単にするというものでした。 しかし実際にはとても足りずサロゲートペアという方法を導入して拡張したため、 16ビット固定長ではなくなっています。