「UTF-8は31bitまでエンコードできる」
というのはUnicodeのかわりにUCS側の枠組みを取り入れた場合の話で、
・ UTF-8の構造に着目すればさらに36bitまでは自然にエンコードできるし、
・ 後続バイトにバイト数情報を延長することを許せば任意に n byte で 5n + 1 bit を表現できる。
「UTF-8は31bitまでエンコードできる」
というのはUnicodeのかわりにUCS側の枠組みを取り入れた場合の話で、
・ UTF-8の構造に着目すればさらに36bitまでは自然にエンコードできるし、
・ 後続バイトにバイト数情報を延長することを許せば任意に n byte で 5n + 1 bit を表現できる。
If you have a fediverse account, you can quote this note from your own instance. Search https://qnmd.info/users/qnighy/statuses/116117928959337623 on your instance and quote it. (Note that quoting is not supported in Mastodon.)