HTML 케릭터 셋, 엔코딩(HTML Charset)
HTML Encoding(Character Sets)
HTML 페이지를 정확히 표시하기 위해, 웹 브라우저는 어떤 케릭터 셋을 사용해야 하는지 알아야 한다.
What is Character Encoding?
아스키코드(ASCII)는 첫번째 케릭터 인코딩 표준(케릭터 셋)이었다.
아스키코드는 127개의 다른 인터넷에서 사용될 수 있는 영숫자 집합을 정의했다.
0~9, 알파벳(A~Z), 그리고 특수문자 등이 속한다.
ANSI(Windows-1252)는 256가지 다른 문자코드를 지원하는 윈도우즈 케릭터 셋이다.
ISO-8859-1은 HTML4의 기본 케릭터 셋인데, 이것도 256가지 문자코드를 지원한다.
ANSI와 ISO-8859-1은 제한적이었기 때문에, HTML5에서는 기본 케릭터 셋이 UTF-8로 바뀌게 되었다.
UTF-8(유니코드)는 세상에 있는 거의 모든 문자와 기호들을 지원한다.
The HTML charset Attribute
HTML 페이지를 화면에 올바르게 출력하기 위해서,
웹 브라우저는 페이지가 어떤 케릭터 셋을 사용하는지 알아야 하는데,
그것은 <meta> 태그가 정의하고 있다.
<!--HTML4 에서 케릭터 셋 정의-->
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
<!--HTML5 에서 케릭터 셋 정의-->
<meta charset="UTF-8">
Differences Between Character Sets
케릭터 셋 별 차이는 여기를 참조한다.
아래 링크를 참조하여 번역 및 수정 함
http://www.w3schools.com/html/html_charset.asp