문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 占쏙옙 (문단 편집) == 개요 == [[문자 깨짐|텍스트의 인코딩과 디코딩이 잘못됐을 때]] 생기는 문자열. 한자인 [[占]](점령할/점칠 점)의 음을 따서 '점쏙옙'이라고도 부른다. || '''UTF-8''' ||<-3> '''�''' ||<-3> '''�''' || || '''바이트''' || EF || BF || BD || EF || BF || BD || || '''EUC-KR''' ||<-2> '''[[占]]''' ||<-2> '''쏙''' ||<-2> '''옙''' || [[UTF-8]]로 저장하는 과정 중 뭔가 꼬여서 온전하게 저장되지 못한 문서를 EUC-KR로 불러오면 이렇게 된다. 문서를 UTF-8로 저장할 때, UTF-8에서 유효하지 않은 byte sequence는 모두 �(U+FFFD, REPLACEMENT CHARACTER)로 대체되는데, 이 [[�]]는 UTF-8에서 EF BF BD라는 세 바이트로 저장된다. UTF-8에서 �가 두 번 붙은 ��는 EF BF BD / EF BF BD가 되는데, 이것을 EUC-KR로 해석하면 EF BF / BD EF / BF BD로 나눠지고 셋은 각각 '占', '쏙', '옙'에 대응된다. 이와 같이 UTF-8 문서 저장 과정에서 뭔가 잘못된 경우, 저장된 문서를 다시 열어보면 문서의 모든 내용이 占쏙옙으로만 채워져 있다. '''불러올 대상이 이미 �로 깨져있어야만 일어나는 오류이기 때문에, 占쏙옙이 이미 일어난 상태에서는 뭔 짓을 해도 원래 나왔어야 할 문서는 못 본다.''' 어쨌든 데이터 저장 과정상의 오류이므로 웹에서 이 문제가 실제로 일어난다면 서버 측의 오류일 수도 있고, 클라이언트 측의 오류일수도 있다. 서버 상에서 한글 처리 오류가 발생해 입력받은 문서가 전부 �로 저장되거나, 업로드 시점에서 이미 데이터가 �로 깨져서 올라간 상태에서 사이트 기본 인코딩이 EUC-KR로 지정되어 있으면 이 문제가 일어나며, 반대로 서버와 서버 상의 데이터에는 문제가 없는데 클라이언트 상에서의 오류로 인해 서버에서 불러오는 한글이 전부 �로 깨져서 캐싱돼도 이 문제가 일어난다. 당연히 일부러 �로 깨진 페이지를 불러와서 인코딩을 EUC-KR로 강제 지정하면 맘껏 감상할 수 있다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기