CS 3

2209 ワード

Day-3


第1章コンピュータ内部の言語体系


5.テキスト表示


5-1アスキーコード


アスキーって何?

  • 情報交換用のアメリカ標準コード
    또는 줄여서 ASCII (아스키) 부른다. 

  • 代表的な英字文字コード

  • 7ビットは最大128文字または記号を表します.
  • アスキーコード表


    コントロール文字列
  • ワードを出力するのではなく、制御装置に使用される.
  • 制御文字の多くは、通信に使用される文字である.
  • アスキー制御文字テーブル

    1-2異なる標準の進化


    コンピュータが広く使われるにつれて、他の言語をサポートするために、
    国際標準化機構(ISO)
    ISO-646(国際標準化組織標準、規定7ビット文字コード);
    ISO-8859(国家標準化組織標準、規定8桁文字コード)
    アスキーを導入し拡張し,各国言語版の文字コードを規定した.
    文字コード規制の例
    日本工業規格JIS(日本工業規格)JIS X 0201
    韓国工業標準KS(韓国工業標準)KS C 5601(現在KS X 1001)
    などと、各国の基準が出てきました.

    1-3 Unicode形式コピー8ビット


    Unicodeとは?

  • 数値と文字(キーと値を1:1にマッピング)形式のコード

  • Unicode名の下には、Askyコードで表せない文字や記号などがあります.
    전 세계의 모든 문자를 특정 숫자(키)와 1:1로 매핑한 것이다. 

  • 16ビットを使用して21ビットに拡張します.
  • Unicode表

    Unicode記号
    ex)アン=U+C 548
    UTF-8(Unicode変換形式8ビット)

  • Unicodeの符号化方法

  • 互換性と効率が最も良く、最も多く使用されています.

  • アスキー以外の文字については、
    프로그램이 깨지지 않는 방법으로 문자를 인코딩

  • 符号化:非同位モードを表すビットモード
                  (컴퓨터가 이해할 수 있는 형태로 바꿔주는것)

  • 8ビット文字(octet)毎に定義される順序(シーケンス)を符号化する.
  • UTF-8 Unicode符号化例

    A=U+0 x 0041(Unicode)=0 x 41(16進)=1000001(バイナリ)=0(MSB)1000001(8 bit)
    𝝅 = U+0 x 03 C 0(Unicode)=0 xCF 0 x 80(16進)=1100,111/10000(バイナリ)
    = 110(MSB)01111/10(MSB)000000(8bit)
    ♣♣=U+0 x 2663(Unicode)=0 xE 2 0 x 99 0 xA 3(16進)=1100010/1011001/10001(バイナリ)
     =1110(MSB)0010 / 10(MSB)011001 / 10(MSB)100011(bit)
  • (Most Significant Bit)は、任意のデータ型の最上位
  • を指す.