:: 세상의 중심 ::

escape() / encodeURI() / encodeURIComponent()

이 모든 함수는 자바스크립트에서 인코딩을 담당하는 함수이다.

여기서 말하는 인코딩이란, 네트워크를 통해서 정보를 공유할 때 어떤 시스템에서나 읽을 수 있는 ASCII 문자로 바꿔주는 것을 말한다. 모든 네트워크를 통한 전송에는 ASCII 문자가 기반이 된다. 특히 한글이나 특수문자의 경우 이를 2진수 바이트코드로 변환해서 전송하면 받는 상대편의 시스템에 따라 잘못 해석되거나, 해석이 불가능할 수 있기 때문이다.

이를 해결하기 위해 모든 시스템에서 공통으로 읽을 수 있는 ASCII 문자로 바꿔서 데이터를 전송할 필요가 있다.



1. escape()

아래 열거된 아스키문자가 아니라면 모두 유니코드 형식으로 변환한다.

ABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijklmnopqrstuvwxyz
1234567890
@*-_+./

그 변환된 형식은 16진수 형식으로 표시되며 1바이트 문자%XX 형태로, 2바이트 문자%uXXXX 형태로 변환된다.
1바이트 문자는 빈칸(%20)을 들 수 있고, 2바이트 문자는 한글(%uD55C%uAE00)이 있을 수 있다.

가끔 인터넷검색을 하면 주소창에 %XX형식의 문자들이 들어있는 것을 볼 수 있는데, 이는 인코딩 된 것의 한 종류라고 볼 수 있다.

가끔은 홈페이지의 자바스크립트나 HTML 소스, 음원URL을 보기 힘들게 하기 위해 사용하기도 하지만,
이는 자바스크립트의 인코딩을 아는 자라면 어렵지 않게 풀어 사용할 수 있다.


2. encodeURI()

기본적으로는 escape()와 비슷한 동작을 하지만 인터넷 주소표시에 쓰이는 특수문자들을 인코딩하지 않는다.
즉,  : ; / = ? &  등의 특수문자는 인코딩이 되지 않는다.
그래서 보통은 파라미터를 전달하는 인터넷주소(URL) 전체를 인코딩할 때 사용한다.



3. encodeURIComponent()

기본적인 동작은 역시 escape()와 비슷하지만 인터넷 주소표시에 쓰이는 모든 문자를 추가로 인코딩한다.
즉,  : ; / = ? &  등의 특수문자가 추가로 인코딩 되는 것이다.

그래서 인터넷주소(URL) 전체를 인코딩할 때는 사용할 수 없고, 넘기는 필드 하나하나를 따로 인코딩할 때 사용한다.
그 이유는 넘어가는 값이 text="test=&테스트" 이와 같이 text라는 필드 값이 test=&테스트인 경우 그냥 encodeURI()로 인코딩 하면, '=' 나 '&'는 인코딩되지 않아서 필드값을 처리할 때 데이터값이 아닌 여러개의 필드를 넘기는 명령어로 인식할 수 있기 때문이다.

하지만, "http://test.com/test.php?text=테스트" 와 같은 URL 전체를 encodeURIComponent()로 인코딩하게 되면 : / ? 를 모두 인코딩하여 주소를 인식할 수 없게 된다.



4. 실제 인코딩의 차이를 보여주는 Javascript 소스

var chr = 'http://test.com/folder1/folder2/default.html?mode=write&value=&*테스트';

document.writeln("original = " + chr + '<br />');
document.writeln("escape() = <font color='red'>" + escape(chr) + "</font><br />");
document.writeln("encodeURI() = <font color='blue'>" + encodeURI(chr) + "</font><br />");
document.writeln("encodeURIComponent() = <font color='orange'>" + encodeURIComponent(chr) + "</font><br />");


위의 소스를 <script></script> 안에 넣고 실행하면 인코딩의 차이를 직접 확인 할 수 있으며,
직접 인코딩과 디코딩 결과를 확인 하고 싶은 경우 "Javascript String Encoder"를 참고하시기 바랍니다.



Posted by bsh Trackback 0 Comment 5

댓글을 달아 주세요

  1.  댓글주소 수정/삭제 댓글쓰기 2009.10.08 10:17

    비밀댓글입니다

  2.  댓글주소 수정/삭제 댓글쓰기 2010.12.10 16:28

    비밀댓글입니다

  3.  댓글주소 수정/삭제 댓글쓰기 이상우 2011.06.01 01:48 신고

    좋은 정보 감사합니다.

  4.  댓글주소 수정/삭제 댓글쓰기 escape연구가 2011.11.23 16:48 신고

    escape 함수를 쓸 때
    줄바꿈은 %0A로 인코딩되고 유니코드가 아니지만 2바이트 문자이기 때문에
    escape 함수로 %uxxxx 이런 값을 읽어들여서 계산하는 것도 정확하지는 않는 것 같아욤.....ㅠㅠㅠ