기타

κ°‘μžκΈ° μœ λ‹ˆμ½”λ“œ

μ• μ •μ“° 2023. 7. 2. 13:19

νšŒμ‚¬μ—μ„œ λ°₯을 λ¨ΉλŠ”λ° μ‘°μ—˜ 온 μ†Œν”„νŠΈμ›¨μ–΄ μ–˜κΈ°κ°€ λ‚˜μ™€μ„œ λ‹€ 읽지 λͺ»ν•œ 이 책을 λ‹€μ‹œ ν•œλ²ˆ 펼쳐 λ³΄μ•˜λ‹€

ν…ŒμŠ€νŠΈμ— λŒ€ν•œ 글을 읽어보고 μžˆμ—ˆλŠ”λ° λ°”λ‘œ λ‹€μŒμž₯에 μœ λ‹ˆμ½”λ“œμ™€ 문자 집합에 λŒ€ν•œ 이야기가 λ‚˜μ™€μ„œ 처음 λ³΄λŠ” 것 마λƒ₯ ν₯미둭게 μ½μ—ˆλ‹€.

μ €μžλŠ” μœ λ‹ˆμ½”λ“œλ₯Ό λͺ¨λ₯Έλ‹€λ©΄ λ§Ήμ„Έμ½” μž μˆ˜ν•¨μ—μ„œ 6κ°œμ›” λ™μ•ˆ μ–‘νŒŒ κ»μ§ˆμ„ κΉŒλŠ” λ²ŒμΉ™μ„ μ€€λ‹€κ³  ν•΄μ„œ μ—΄μ‹¬νžˆ μ½μ—ˆλ‹€...

 

μ „μ†‘λ˜λŠ” 인코딩 방식을 지정할 수 μžˆλŠ”λ° μ§€κΈˆμ€ Unicodeλ₯Ό μ‚¬μš©ν•˜κ³  μžˆμ§€λ§Œ μ΄μ „μ—λŠ” ASCII 와 같은 인코딩 방식을 μ‚¬μš©ν–ˆλ‹€.

ν•˜μ§€λ§Œ ASCIIλŠ” 7λΉ„νŠΈλ‘œ κ΅¬μ„±λ˜μ–΄ μžˆμ–΄μ„œ 0~127κΉŒμ§€μ˜ 숫자λ₯Ό μ΄μš©ν•΄ 영문 μ•ŒνŒŒλ²³, 숫자, 특수 문자 등을 ν‘œν˜„ν•  수 μžˆμ—ˆλ‹€.

(맨 μ™Όμͺ½ 1λΉ„νŠΈλŠ” 톡신 μž₯λΉ„μ—μ„œ μ‚¬μš©λ˜λŠ” μ œμ–΄ λΉ„νŠΈλ₯Ό μœ„ν•΄ μ˜ˆμ•½λœ κ³΅κ°„μ΄μ—ˆκ³  μ‹€μ œλ‘œλŠ” 7λΉ„νŠΈλ§Œ μ‚¬μš©λ˜μ—ˆλ‹€.) 

 

ν•˜μ§€λ§Œ 인터넷 νŠΉμ„±μƒ μ•ŒνŒŒλ²³μ΄ μ•„λ‹Œ λ‹€λ₯Έ μ–Έμ–΄λ₯Ό ν‘œν˜„ν•  수 μžˆμ–΄μ•Ό ν–ˆλ‹€.

κ·Έλž˜μ„œ μœ λ‹ˆμ½”λ“œκ°€ κ°œλ°œλ˜μ—ˆκ³  μœ λ‹ˆμ½”λ“œλŠ” 16λΉ„νŠΈ ~ 32λΉ„νŠΈ κΉŒμ§€ λ‹€μ–‘ν•œ 크기λ₯Ό μ‚¬μš©ν•˜μ—¬ 문자λ₯Ό ν‘œν˜„ν•œλ‹€.

UTF-8, UTF-16, UTF-32 등이 μžˆλ‹€. 특히 μš°λ¦¬κ°€ 자주 μ‚¬μš©ν•˜κ³  μžˆλŠ” UTF-8 κ²½μš°μ—λŠ” κ°€λ³€ 길이 인코딩 λ°©μ‹μœΌλ‘œ μ˜μ–΄ μ•ŒνŒŒλ²³μ€ 1λ°”μ΄νŠΈ, λ‹€λ₯Έ μ–Έμ–΄λŠ” ν•„μš”μ— 따라 2λ°”μ΄νŠΈ μ΄μƒμœΌλ‘œ ν‘œν˜„ν•œλ‹€. λ‚˜λ¨Έμ§€λŠ” μ΄λ¦„μœΌλ‘œ μ˜ˆμƒ κ°€λŠ₯ν•˜λ‹€. UTF-16 은 2λ°”μ΄νŠΈλ‘œ κ³ μ •ν•˜κ³  UTF-32λŠ” 4λ°”μ΄νŠΈλ‘œ κ³ μ •λœ κΈ°λ₯Ό 가진닀.

 

κ°€λ³€ 길이 인코딩 방식이 뭐지?
UTF-8은 ASCIIλ₯Ό κ·ΈλŒ€λ‘œ μ‚¬μš©ν•΄μ„œ ASCII에 ν¬ν•¨λœ λ¬Έμžλ“€μ€ 1λ°”μ΄νŠΈλ‘œ 인코딩 λœλ‹€.
κ·Έ μ™Έ λ‹€λ₯Έ λ¬ΈμžλŠ” μ—¬λŸ¬ λ°”μ΄νŠΈλ‘œ 인코딩 λœλ‹€.
μ΄λ ‡κ²Œ κ°€λ³€μ μœΌλ‘œ 크기가 λ³€κ²½λ˜κΈ° λ•Œλ¬Έμ— 문자λ₯Ό 효율적으둜 μ €μž₯ν•˜κ³  전솑할 수 있게 ν•΄ μ€€λ‹€.

 

λ°˜μ‘ν˜•