TIL

936 ワード

今日は2021年10月27日水曜日、CS基礎を勉強しました.
コンピューター科学を学ぶ理由は...
過去を知ってこそ、未来に似たようなことが起こったときに原因を見つけやすいからだ.

今日整理するコンセプト

文字列に関連する符号化/復号概念
-Unicode-UTF-8/UTF-16

Unicodeとコーディング

Unicodeとは、世界中の異なる自然言語(韓国語、英語...)を指す.これはコンピュータが理解できるように設計された統一的な表現と処理の産業基準である.例えば、同じ韓国語であっても、どのように符号化するかによって復号化の方法が異なるため、1つの標準(標準)に統一することができ、発生する可能性のあるエラーを低減することができる.

コードとは何ですか。

いくつかの文字または記号をコンピュータで使用可能な信号にします.

🥎 UTF-8/UTF-16

ここでutf-8/utf-16はUnicodeをどのように符号化するかを意味する.
[自然言語]🔜 [Unicode]🔜 [ utf-8 ]

'코'라는 문자의 유니코드는 
16진수(HEX) : U+CF54 / 2진수(binary number) : 1100-1111-0101-0100
이를 UTF-8로 표현하면, 11101100 10111101 10010100로 표현된다.

[その他の概念]

utf後ろの数字は8 bit/16 bitの略です.

utf-8は可変長(10バイトから4バイト)を有する.

utf-8は、バイト順を考慮せず、自ら順序を決定する.

utf-16は4バイトで表すことができるが、大部分は2バイトである.

utf-16のタイプはバイト順に依存する.

Reference

この問題について(TIL), 我々は、より多くの情報をここで見つけました https://velog.io/@bothsides/TIL

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

GITの説明:Gitサブモジュールを用いたプロジェクトアンブレラ構造

単純な翻訳アプリを構築することによって反応文脈システムを理解すること