파이썬 2버전대를 공부하다보면 좀 신경쓰이는게 한글 처리인데...

사용하는 운영체제가 윈도우인 경우, 한글 처리를 하기 위해서는 인코딩 처리를 euc-kr 혹은 cp949 로 처리를 해야한다. cp949 가 euc-kr의 상위호완형이라고 보면 된다.
(참고로 cp = code page 의 약자. 즉, 통합형 한글 코드로 다른 언어셋이 표현하지못하는 한글까지 표현이 가능한 인코딩이다. 뷁,쐙 등...)

그런데 메모장이나 기타 일부 텍스트 에디터에서 저장시 인코딩셋을 설정해야하는데 cp949 도 euc-kr도 목록에 보이지 않을 수 있다.

 

ANSI , 유니코드, UTF-8 을 일반적으로 볼 수 있을텐데 이런 경우에는 저장시 ANSI 를 선택해주면된다. 
ANSI 는 특정 인코딩 형식을 나타내는게 아니라 내 시스템에서 사용하는 코드페이지 형식으로 저장을 한다. 그래서 ANSI로 저장을 하면 우리 입장에서는 EUC-KR 혹은 CP949로 저장하는것과 마찬가지인셈이다.

인코딩에 대하여 추가적으로 자세한 정보를 알고 싶다면 아래 블로그를 참고해보자.

http://umbum.tistory.com/328

 

Encoding 정리. Unicode, ANSI, UTF, CP949

Unicode 유니코드 자체는 특정 encoding 방식을 가리키는 말이 아니라, 순서(U+????)와 문자를 1:1로 매핑해놓은 하나의 코드표를 가리킨다. ANSI와 달리 전세계 글자를 하나의 코드표에 표현하기 위에

umbum.dev

 

'프로그래밍 > 파이썬' 카테고리의 다른 글

[파이썬] 파이썬 설치시 환경변수 설정  (0) 2021.08.03

+ Recent posts