cp949
-
파이썬으로 맥에서 깨진 한글 파일명 복구개발 환경/Mac 2020. 5. 15. 14:39
네이버 메일에서 첨부파일을 다운 받았는데 파일명이 전부 깨져버렸다... 물론 그냥 들어가서 내용을 보면 파일명을 유추할 수 있고 문서를 읽는데는 아무런 문제가 없지만, 개발자의 욕심? 끈기?를 이용해 복구하는데에 성공했다. 0. 나의 환경 OS: macOS Catalina 10.15.4 상대방 OS: windows (추정) 브라우저: 사파리 (크롬으로 했을때도 깨진 상태로 받아진다.) 네이버 메일 1. NFC vs NFD? 이리저리 찾다보니 알게된 사실이다. Unicode를 정규화하는 방법이 있는데 맥과 윈도우는 그 방법이 서로 다르다. 맥: NFD (Normalization Form Canonical Decomposition) 윈도우: NFC (Normalization Form Canonical Com..
-
Mac에서 한글 인코딩 다 깨졌을 때 모든 파일 변경하기 (find, read, iconv)개발 환경/Mac 2020. 3. 16. 19:52
윈도우에서 만든 txt 파일이 맥에서 열면 위와 같이 고대어가 된다. 찾아보니 원인은 윈도우에서 작성된 파일이 'cp949'로 인코딩되었기 때문이란다. 폴더 하부에 있는 모든 txt파일까지 전부 다시 'uft-8'로 바꿔보자. 1. find 명령어 find 명령어는 검색어에 따라 파일을 찾아주는 명령어이다. 나의 타겟은 txt파일이다. find . -name "*.txt" 위에 .은 현재 디렉토리를 말하고 현재 디렉토리부터 하위 디렉토리까지 모두 검색한다. -name은 검색어고 "*.txt"에서 *은 모든 경우을 말한다. 위 명령어를 실행하면 현재 디렉토리부터 하위 디렉토리까지 모든 txt파일을 찾아준다. 2. iconv 명령어 iconv 명령어는 문자열의 인코딩을 바꿔주는 명령어이다. 나는 현재 'cp..