https://en.wikipedia.org/wiki/Mojibake
文字化けって世界共通語なんですね...
https://stackoverflow.com/questions/63425970/decode-encode-html-escaped-special-characters-in-python
Conversation
Notices
-
nennneko5787 (nennneko5787@misskey.nukumori-sky.net)'s status on Wednesday, 20-Nov-2024 18:37:03 JST nennneko5787 - karintou likes this.
-
karintou@misskey.nukumori-sky.net's status on Wednesday, 20-Nov-2024 18:37:03 JST karintou @nennneko5787
日本語圏で文字化けが日常風景だったのは、Shift-JIS、EUC-JP、ISO-2022-JP、Unicodeと複数の文字コードが並行して使われていたからですが・・・他の言語圏はどうなんだろうか?
英語圏はASCIIがズレる事は無いだろうし、コンピューターの導入が遅かった国や、文字の種類が少ない国は文字コードが乱立する事も少なそう。
昔はネットワークで相互接続されないので、ベンダーや機種ごとにバラバラの文字コードが策定されたりしていた。加えて限られたビット数の中にいかに文字を収めるかという事や、欧米系システムとの互換性という問題があって、複数誕生した。In conversation permalink