里々はもっと簡単にUTF-8かどうかの判定ができて、
「全角の #$&()*0~9:=>@_ を示すUTF-8の3バイトの並びが出現したらUTF-8と判定」
という条件で、BOMがなくてもほぼ100%判定できるのです。辞書でまあまず確実に使う記号だからね。
UnicodeのHalfwidth and Fullwidth Formsの一部、UTF-8の並びでいくと
EFBCxx (xx = 83.84.86,88,89,8a,90-9a,9d,9e,a0,bf)
https://ukadon.shillest.net/@steve02081504/109911211034015304