320x100
320x100

유니코드

: 전세계의 모든 문자를 일관적으로 표현할 수 있는 표준 코드

: 1byte 안에 임의대로 알파벳 대신 각국의 언어를 할당하여 사용하는 방식

: 한글 '가'의 유니코드는 U+AC00 임

 

 

 

 

UTF-8 (Universal Coded Character Set + Transformation Format – 8-bit)

: 유니코드를 가변적으로 인코딩 하는 방식

: 글자마다 바이트를 다르게 표현

: 표현가능한 길이는 최대 6바이트지만 다른 인코딩과의 호환을 위해 4바이트까지만 사용 

: 한글자가 1~4바이트의 크기를 가지며 1바이트 영역은 아스키코드와 하위 호환성을 가짐

 > 아스키코드의 0~127비트 까지는 UTF-8과 완전히 호환 됨

: HTML 태그나 자바스크립트 등 아스키로 구축된 사이트를 별다른 변환 처리 없이 그대로 사용할 수 있음

 

 

 

 

EUC-KR

: 한글과 한국에서 통용되는 한자, 영문을 표현할 수 있는 인코딩 방식

: 일본식 한자와 중국어의 간체자 등은 표현 불가

: 프랑스어의 악상이나 독일어의 움라우트 등도  표현 불가

: 한글 1자가 2바이트의 크기를 가짐

 

 

 

 

 

Refference 

 

utf-8 / euc-kr 의 차이

UTF-8은 유니코드입니다. 유니코드는 전세계의 모든 문자를 한꺼번에 표현할 수 있는 인코딩입니다. 한...

blog.naver.com

 

 

UTF-8이란 무엇일까?

어느 기업 구인공고를 보다가 UTF-8이 무엇이냐라는 질문이 있었다.막상 면접에서 이걸 물어봤다면 내가 답할 수 있었을까.UTF-8을 알기 위해서는 먼저 유니코드를 알아야한다.유니코드는 전 세계

velog.io

300x250
728x90