ASCII, S-JIS, UTF-8
ASCII
- 半角英数を1Byte(8bit)で表現
- 実際は、7bitしか利用していない
- 代表的なコード
- 実際は、7bitしか利用していない
文字 | コード(16進数) | 備考 |
---|---|---|
LF | 0A | Unix系の改行 |
CR | 0D | windowsの改行(CRLF) |
SP | 20 | 空白 |
0 | 30 | |
\ | 5C | 文字化けの原因 |
a | 61 | |
DEL | 7F | ASCII最大コード |
S-JIS
- ASCIIを拡張している
- 半角英数のみを見るとASCIIと同じ文字コードとなる
- 半角カナは1Byte
- ASCIIと被らないように8bit目を利用している
- 漢字は2Byte
- 1Byte目は、ASCIIと半角カナと被らないコードを利用
- 2Byte目は、ASCIIと半角カナと被ることもある
- この仕様が、文字化けの原因となる。
- 文字化け
- /がエスケープ文字の意味を持つ言語で、2Byte目が/の漢字を利用した場合、/が消えてしまう。
- 例:「申」「十」「表」
UTF-8
- ASCIIを拡張している
- 半角英数のみを見るとASCIIと同じ文字コードとなる
- S-JISの文字化け対策
- 漢字の2Byte目が、ASCIIと半角カナと被らないコードを利用しているため、/による文字化けはおこらない
- 半角英数のみを見るとASCIIと同じ文字コードとなる
- ASCIIと被らないように8bit目を利用している
- 1Byte目は、ASCIIと半角カナと被らないコードを利用
- 2Byte目は、ASCIIと半角カナと被ることもある
- この仕様が、文字化けの原因となる。
- /がエスケープ文字の意味を持つ言語で、2Byte目が/の漢字を利用した場合、/が消えてしまう。
- 例:「申」「十」「表」
- ASCIIを拡張している
- 半角英数のみを見るとASCIIと同じ文字コードとなる
- S-JISの文字化け対策
- 漢字の2Byte目が、ASCIIと半角カナと被らないコードを利用しているため、/による文字化けはおこらない
Author And Source
この問題について(ASCII, S-JIS, UTF-8), 我々は、より多くの情報をここで見つけました https://qiita.com/icechikin/items/1729b6482c997f4d3833著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .