Text 파일을 읽어서 처리하는 어떤 응용 프로그램에서 아래와 같은 에러가 발생하는 경우가 있습니다.
'utf-8' codec can't decode byte 0xbb in position 5526: invalid start byte
이건 해당 프로그램에서 텍스트 파일을 읽는 과정에서 캐릭터셋 인코딩 처리를 제대로 안했을 때 발생합니다.
이 문제를 해결하는 방법은 해당 프로그램을 개발자가 고치면 됩니다. ㅎㅎ
하지만 이게 여의치 않은 경우에는 프로그램에서 읽어들이는 텍스트파일의 인코딩을 바꿔주는 방법도 있습니다.
텍스트파일 인코딩 바꿔주는 방법이 생각보다 어렵지 않습니다.
왠만한 에디터 프로그램들이 이런 것을 지원하거든요.
저는 AcroEdit 를 가지고 변환해보겠습니다.
AcroEdit 에서 Text 파일을 열면 맨 아래에 ANSI 라고 나옵니다. 이게 Unicode 인 경우에는 다르게 나옵니다.
이걸 바꾸려면 [파일] - [변환] 메뉴에서 "유니코드 UTF-8" 을 선택해줍니다.
이렇게 하면, ANSI -> U8 로 바뀌는 것을 확인할 수 있습니다. 이걸 저장하고 다시 응용프로그램에서 읽으면 에러없이 정상적으로 실행되는 것을 확인할 수 있습니다.
캐릭터셋 바꾸는거 엄청 쉽죠~~