깨알팁: 유효한 유니코드 코드포인트 값의 범위에는 구멍이 있습니다. UTF-16을 위해 만들어진 surrogate pair 영역입니다. 이 영역의 값은 UTF-16 외에서는 의미가 없고 사용될 수 없습니다.
UTF-16이 한 트롤링으로 Byte Order Mark (U+FFFE
) 라는 것도 있죠... UTF-16LE인지 UTF-16BE인지 확인하기 위해 바이트 인코딩된 문자열 맨 앞에 넣는 문자인데 (0xFE
가 먼저 오면 LE) 어떤 에디터는 이걸 UTF-8 문자열에도 집어넣어서 UTF-8인지 확인하겠다고 설치고 다니는 이하생략
If you have a fediverse account, you can reply to this note from your own instance. Search https://hackers.pub/ap/notes/0197e8cd-6aba-77b9-a609-cdbbcc91dd3a on your instance and reply to it.