UTF-8はUNICODEを符号化したもので、1文字あたり1~6バイトまでのバイト数になるマルチバイト文字だ。
通常のShift_JISの範囲であればUTF-8では3バイトに収まる。
しかし、Shift_JIS-2004(JIS X 0213:2004)ではUTF-8では4バイトの符号化される文字が含まれた。
JIS X 0213:2004 UTF-8で4バイトに符号化される文字

MySQLの文字コードはUTF-8を利用しているが、どうやら普通には4バイトのUTF-8は格納できず、create database,create table, columnの定義など必要な個所に CHARACTER SET utf8mb4 を定義する必要がある。

10.1.10.7. utf8mb4 文字セット (4 バイトの UTF-8 Unicode エンコーディング)
utf8 という名前の文字セットは、文字あたり最大 3 バイトを使用し、BMP 文字だけを含みます。utf8mb4 文字セットは、文字ごとに最大 4 バイトを使用し、補助文字をサポートします。

ついに、このUTF-8では4バイトとなる文字領域を扱う必要が出てきた。
テストデータを準備する際に困ったのは、4バイトとなる文字はどれか知らない。
そのためShift_JIS-2004の文字がUTF-8にした場合のバイト数を総当りして調査した。
※ 基となったデータはこちら。Shift_JIS-2004とUnicodeの対応表
※ ブラウザのフォントによっては見れません。

Shift_JIS-2004(JIS X 0213:2004)のUTF-8バイト数一覧表

黄色が4バイトになる文字。
データが大きいため、別ページに。

Shift_JIS-2004(JIS X 0213:2004)のUTF-8バイト数一覧表

Shift_JIS-2004(JIS X 0213:2004)の文字で、4バイトのUTF-8に符号化される文字一覧表

文字 SJIS UNICODE UTF-8 UTF-8 length 数値文字参照(10進) 数値文字参照(16進) type year Unicode ver.
𠀋 0x87A0 U+2000B F0A0808B 4 𠀋 𠀋 cjk 2000 Unicode3.1
𡈽 0x8861 U+2123D F0A188BD 4 𡈽 𡈽 cjk 2000 Unicode3.1
𡌛 0x886B U+2131B F0A18C9B 4 𡌛 𡌛 cjk 2000 Unicode3.1
𡑮 0x8880 U+2146E F0A191AE 4 𡑮 𡑮 cjk 2000 Unicode3.1
𡢽 0x889B U+218BD F0A1A2BD 4 𡢽 𡢽 cjk 2000 Unicode3.1
𠮟 0x9873 U+20B9F F0A0AE9F 4 𠮟 𠮟 cjk 2004 Unicode3.1
𡚴 0x9883 U+216B4 F0A19AB4 4 𡚴 𡚴 cjk 2000 Unicode3.1
𡸴 0x988E U+21E34 F0A1B8B4 4 𡸴 𡸴 cjk 2000 Unicode3.1
𣇄 0xEB59 U+231C4 F0A38784 4 𣇄 𣇄 cjk 2000 Unicode3.1
𣗄 0xEB92 U+235C4 F0A39784 4 𣗄 𣗄 cjk 2000 Unicode3.1
𣜿 0xEBA7 U+2373F F0A39CBF 4 𣜿 𣜿 cjk 2000 Unicode3.1
𣝣 0xEBB0 U+23763 F0A39DA3 4 𣝣 𣝣 cjk 2000 Unicode3.1
𣳾 0xEBDE U+23CFE F0A3B3BE 4 𣳾 𣳾 cjk 2000 Unicode3.1
𤟱 0xEC8C U+247F1 F0A49FB1 4 𤟱 𤟱 cjk 2000 Unicode3.1
𥒎 0xECFC U+2548E F0A5928E 4 𥒎 𥒎 cjk 2000 Unicode3.1
𥔎 0xED48 U+2550E F0A5948E 4 𥔎 𥔎 cjk 2000 Unicode3.1
𥝱 0xED66 U+25771 F0A59DB1 4 𥝱 𥝱 cjk 2000 Unicode3.1
𥧄 0xED73 U+259C4 F0A5A784 4 𥧄 𥧄 cjk 2000 Unicode3.1
𥶡 0xED8E U+25DA1 F0A5B6A1 4 𥶡 𥶡 cjk 2000 Unicode3.1
𦫿 0xEDDB U+26AFF F0A6ABBF 4 𦫿 𦫿 cjk 2000 Unicode3.1
𦹀 0xEE52 U+26E40 F0A6B980 4 𦹀 𦹀 cjk 2000 Unicode3.1
𧃴 0xEE68 U+270F4 F0A783B4 4 𧃴 𧃴 cjk 2000 Unicode3.1
𧚄 0xEE8C U+27684 F0A79A84 4 𧚄 𧚄 cjk 2000 Unicode3.1
𨉷 0xEEC7 U+28277 F0A889B7 4 𨉷 𨉷 cjk 2000 Unicode3.1
𨏍 0xEECF U+283CD F0A88F8D 4 𨏍 𨏍 cjk 2000 Unicode3.1
𪆐 0xEFE4 U+2A190 F0AA8690 4 𪆐 𪆐 cjk 2000 Unicode3.1
𠂉 0xF040 U+20089 F0A08289 4 𠂉 𠂉 cjk 2000 Unicode3.1
𠂢 0xF04A U+200A2 F0A082A2 4 𠂢 𠂢 cjk 2000 Unicode3.1
𠂤 0xF04D U+200A4 F0A082A4 4 𠂤 𠂤 cjk 2000 Unicode3.1
𠆢 0xF055 U+201A2 F0A086A2 4 𠆢 𠆢 cjk 2000 Unicode3.1
𠈓 0xF065 U+20213 F0A08893 4 𠈓 𠈓 cjk 2000 Unicode3.1
𠌫 0xF090 U+2032B F0A08CAB 4 𠌫 𠌫 cjk 2000 Unicode3.1
𠎁 0xF097 U+20381 F0A08E81 4 𠎁 𠎁 cjk 2000 Unicode3.1
𠍱 0xF099 U+20371 F0A08DB1 4 𠍱 𠍱 cjk 2000 Unicode3.1
𠏹 0xF141 U+203F9 F0A08FB9 4 𠏹 𠏹 cjk 2000 Unicode3.1
𠑊 0xF144 U+2044A F0A0918A 4 𠑊 𠑊 cjk 2000 Unicode3.1
𠔉 0xF146 U+20509 F0A09489 4 𠔉 𠔉 cjk 2000 Unicode3.1
𠗖 0xF150 U+205D6 F0A09796 4 𠗖 𠗖 cjk 2000 Unicode3.1
𠘨 0xF151 U+20628 F0A098A8 4 𠘨 𠘨 cjk 2000 Unicode3.1
𠝏 0xF157 U+2074F F0A09D8F 4 𠝏 𠝏 cjk 2000 Unicode3.1
𠠇 0xF15E U+20807 F0A0A087 4 𠠇 𠠇 cjk 2000 Unicode3.1
𠠺 0xF160 U+2083A F0A0A0BA 4 𠠺 𠠺 cjk 2000 Unicode3.1
𠢹 0xF169 U+208B9 F0A0A2B9 4 𠢹 𠢹 cjk 2000 Unicode3.1
𠥼 0xF171 U+2097C F0A0A5BC 4 𠥼 𠥼 cjk 2000 Unicode3.1
𠦝 0xF172 U+2099D F0A0A69D 4 𠦝 𠦝 cjk 2000 Unicode3.1
𠫓 0xF178 U+20AD3 F0A0AB93 4 𠫓 𠫓 cjk 2000 Unicode3.1
𠬝 0xF17B U+20B1D F0A0AC9D 4 𠬝 𠬝 cjk 2000 Unicode3.1
𠵅 0xF197 U+20D45 F0A0B585 4 𠵅 𠵅 cjk 2000 Unicode3.1
𠷡 0xF1A8 U+20DE1 F0A0B7A1 4 𠷡 𠷡 cjk 2000 Unicode3.1
𠺕 0xF1AF U+20E95 F0A0BA95 4 𠺕 𠺕 cjk 2000 Unicode3.1
𠹭 0xF1B0 U+20E6D F0A0B9AD 4 𠹭 𠹭 cjk 2000 Unicode3.1
𠹤 0xF1B8 U+20E64 F0A0B9A4 4 𠹤 𠹤 cjk 2000 Unicode3.1
𠽟 0xF1BB U+20F5F F0A0BD9F 4 𠽟 𠽟 cjk 2000 Unicode3.1
𡈁 0xF1D7 U+21201 F0A18881 4 𡈁 𡈁 cjk 2000 Unicode3.1
𡉕 0xF1DA U+21255 F0A18995 4 𡉕 𡉕 cjk 2000 Unicode3.1
𡉻 0xF1DC U+2127B F0A189BB 4 𡉻 𡉻 cjk 2000 Unicode3.1
𡉴 0xF1E1 U+21274 F0A189B4 4 𡉴 𡉴 cjk 2000 Unicode3.1
𡋤 0xF1E8 U+212E4 F0A18BA4 4 𡋤 𡋤 cjk 2000 Unicode3.1
𡋗 0xF1E9 U+212D7 F0A18B97 4 𡋗 𡋗 cjk 2000 Unicode3.1
𡋽 0xF1F0 U+212FD F0A18BBD 4 𡋽 𡋽 cjk 2000 Unicode3.1
𡌶 0xF1F2 U+21336 F0A18CB6 4 𡌶 𡌶 cjk 2000 Unicode3.1
𡍄 0xF1F3 U+21344 F0A18D84 4 𡍄 𡍄 cjk 2000 Unicode3.1
𡏄 0xF244 U+213C4 F0A18F84 4 𡏄 𡏄 cjk 2000 Unicode3.1
𡑭 0xF251 U+2146D F0A191AD 4 𡑭 𡑭 cjk 2000 Unicode3.1
𡗗 0xF25D U+215D7 F0A19797 4 𡗗 𡗗 cjk 2000 Unicode3.1
𦰩 0xF263 U+26C29 F0A6B0A9 4 𦰩 𦰩 cjk 2000 Unicode3.1
𡙇 0xF266 U+21647 F0A19987 4 𡙇 𡙇 cjk 2000 Unicode3.1
𡜆 0xF274 U+21706 F0A19C86 4 𡜆 𡜆 cjk 2000 Unicode3.1
𡝂 0xF275 U+21742 F0A19D82 4 𡝂 𡝂 cjk 2000 Unicode3.1
𡧃 0xF29E U+219C3 F0A1A783 4 𡧃 𡧃 cjk 2000 Unicode3.1
𡱖 0xF0AE U+21C56 F0A1B196 4 𡱖 𡱖 cjk 2000 Unicode3.1
𡴭 0xF0B5 U+21D2D F0A1B4AD 4 𡴭 𡴭 cjk 2000 Unicode3.1
𡵅 0xF0B6 U+21D45 F0A1B585 4 𡵅 𡵅 cjk 2000 Unicode3.1
𡵸 0xF0B8 U+21D78 F0A1B5B8 4 𡵸 𡵸 cjk 2000 Unicode3.1
𡵢 0xF0B9 U+21D62 F0A1B5A2 4 𡵢 𡵢 cjk 2000 Unicode3.1
𡶡 0xF0BD U+21DA1 F0A1B6A1 4 𡶡 𡶡 cjk 2000 Unicode3.1
𡶜 0xF0BE U+21D9C F0A1B69C 4 𡶜 𡶜 cjk 2000 Unicode3.1
𡶒 0xF0C3 U+21D92 F0A1B692 4 𡶒 𡶒 cjk 2000 Unicode3.1
𡶷 0xF0C6 U+21DB7 F0A1B6B7 4 𡶷 𡶷 cjk 2000 Unicode3.1
𡷠 0xF0C8 U+21DE0 F0A1B7A0 4 𡷠 𡷠 cjk 2000 Unicode3.1
𡸳 0xF0C9 U+21E33 F0A1B8B3 4 𡸳 𡸳 cjk 2000 Unicode3.1
𡼞 0xF0D9 U+21F1E F0A1BC9E 4 𡼞 𡼞 cjk 2000 Unicode3.1
𡽶 0xF0E4 U+21F76 F0A1BDB6 4 𡽶 𡽶 cjk 2000 Unicode3.1
𡿺 0xF0EA U+21FFA F0A1BFBA 4 𡿺 𡿺 cjk 2000 Unicode3.1
𢅻 0xF2A0 U+2217B F0A285BB 4 𢅻 𢅻 cjk 2000 Unicode3.1
𢌞 0xF2A9 U+2231E F0A28C9E 4 𢌞 𢌞 cjk 2000 Unicode3.1
𢎭 0xF2AE U+223AD F0A28EAD 4 𢎭 𢎭 cjk 2000 Unicode3.1
𢛳 0xF2CE U+226F3 F0A29BB3 4 𢛳 𢛳 cjk 2000 Unicode3.1
𢡛 0xF2E3 U+2285B F0A2A19B 4 𢡛 𢡛 cjk 2000 Unicode3.1
𢢫 0xF2EB U+228AB F0A2A2AB 4 𢢫 𢢫 cjk 2000 Unicode3.1
𢦏 0xF2F0 U+2298F F0A2A68F 4 𢦏 𢦏 cjk 2000 Unicode3.1
𢪸 0xF343 U+22AB8 F0A2AAB8 4 𢪸 𢪸 cjk 2000 Unicode3.1
𢭏 0xF348 U+22B4F F0A2AD8F 4 𢭏 𢭏 cjk 2000 Unicode3.1
𢭐 0xF349 U+22B50 F0A2AD90 4 𢭐 𢭐 cjk 2000 Unicode3.1
𢭆 0xF351 U+22B46 F0A2AD86 4 𢭆 𢭆 cjk 2000 Unicode3.1
𢰝 0xF353 U+22C1D F0A2B09D 4 𢰝 𢰝 cjk 2000 Unicode3.1
𢮦 0xF354 U+22BA6 F0A2AEA6 4 𢮦 𢮦 cjk 2000 Unicode3.1
𢰤 0xF358 U+22C24 F0A2B0A4 4 𢰤 𢰤 cjk 2000 Unicode3.1
𢷡 0xF375 U+22DE1 F0A2B7A1 4 𢷡 𢷡 cjk 2000 Unicode3.1
𣇃 0xF39D U+231C3 F0A38783 4 𣇃 𣇃 cjk 2000 Unicode3.1
𣇵 0xF3A1 U+231F5 F0A387B5 4 𣇵 𣇵 cjk 2000 Unicode3.1
𣆶 0xF3A2 U+231B6 F0A386B6 4 𣆶 𣆶 cjk 2000 Unicode3.1
𣍲 0xF3B8 U+23372 F0A38DB2 4 𣍲 𣍲 cjk 2000 Unicode3.1
𣏓 0xF3BA U+233D3 F0A38F93 4 𣏓 𣏓 cjk 2000 Unicode3.1
𣏒 0xF3BB U+233D2 F0A38F92 4 𣏒 𣏒 cjk 2000 Unicode3.1
𣏐 0xF3C0 U+233D0 F0A38F90 4 𣏐 𣏐 cjk 2000 Unicode3.1
𣏤 0xF3C1 U+233E4 F0A38FA4 4 𣏤 𣏤 cjk 2000 Unicode3.1
𣏕 0xF3C2 U+233D5 F0A38F95 4 𣏕 𣏕 cjk 2000 Unicode3.1
𣏚 0xF3C5 U+233DA F0A38F9A 4 𣏚 𣏚 cjk 2000 Unicode3.1
𣏟 0xF3C7 U+233DF F0A38F9F 4 𣏟 𣏟 cjk 2000 Unicode3.1
𣑊 0xF3D3 U+2344A F0A3918A 4 𣑊 𣑊 cjk 2000 Unicode3.1
𣑑 0xF3D4 U+23451 F0A39191 4 𣑑 𣑑 cjk 2000 Unicode3.1
𣑋 0xF3D5 U+2344B F0A3918B 4 𣑋 𣑋 cjk 2000 Unicode3.1
𣑥 0xF3D9 U+23465 F0A391A5 4 𣑥 𣑥 cjk 2000 Unicode3.1
𣓤 0xF3F5 U+234E4 F0A393A4 4 𣓤 𣓤 cjk 2000 Unicode3.1
𣕚 0xF3F6 U+2355A F0A3959A 4 𣕚 𣕚 cjk 2000 Unicode3.1
𣖔 0xF449 U+23594 F0A39694 4 𣖔 𣖔 cjk 2000 Unicode3.1
𣘹 0xF45E U+23639 F0A398B9 4 𣘹 𣘹 cjk 2000 Unicode3.1
𣙇 0xF45F U+23647 F0A39987 4 𣙇 𣙇 cjk 2000 Unicode3.1
𣘸 0xF461 U+23638 F0A398B8 4 𣘸 𣘸 cjk 2000 Unicode3.1
𣘺 0xF462 U+2363A F0A398BA 4 𣘺 𣘺 cjk 2000 Unicode3.1
𣜜 0xF46D U+2371C F0A39C9C 4 𣜜 𣜜 cjk 2000 Unicode3.1
𣜌 0xF478 U+2370C F0A39C8C 4 𣜌 𣜌 cjk 2000 Unicode3.1
𣝤 0xF481 U+23764 F0A39DA4 4 𣝤 𣝤 cjk 2000 Unicode3.1
𣟿 0xF489 U+237FF F0A39FBF 4 𣟿 𣟿 cjk 2000 Unicode3.1
𣟧 0xF48A U+237E7 F0A39FA7 4 𣟧 𣟧 cjk 2000 Unicode3.1
𣠤 0xF490 U+23824 F0A3A0A4 4 𣠤 𣠤 cjk 2000 Unicode3.1
𣠽 0xF495 U+2383D F0A3A0BD 4 𣠽 𣠽 cjk 2000 Unicode3.1
𣪘 0xF4A1 U+23A98 F0A3AA98 4 𣪘 𣪘 cjk 2000 Unicode3.1
𣱿 0xF4B2 U+23C7F F0A3B1BF 4 𣱿 𣱿 cjk 2000 Unicode3.1
𣴀 0xF4C7 U+23D00 F0A3B480 4 𣴀 𣴀 cjk 2000 Unicode3.1
𣵀 0xF4DA U+23D40 F0A3B580 4 𣵀 𣵀 cjk 2000 Unicode3.1
𣷺 0xF4DC U+23DFA F0A3B7BA 4 𣷺 𣷺 cjk 2000 Unicode3.1
𣷹 0xF4DD U+23DF9 F0A3B7B9 4 𣷹 𣷹 cjk 2000 Unicode3.1
𣷓 0xF4DE U+23DD3 F0A3B793 4 𣷓 𣷓 cjk 2000 Unicode3.1
𣽾 0xF551 U+23F7E F0A3BDBE 4 𣽾 𣽾 cjk 2000 Unicode3.1
𤂖 0xF566 U+24096 F0A48296 4 𤂖 𤂖 cjk 2000 Unicode3.1
𤄃 0xF56C U+24103 F0A48483 4 𤄃 𤄃 cjk 2000 Unicode3.1
𤇆 0xF581 U+241C6 F0A48786 4 𤇆 𤇆 cjk 2000 Unicode3.1
𤇾 0xF584 U+241FE F0A487BE 4 𤇾 𤇾 cjk 2000 Unicode3.1
𤎼 0xF5A0 U+243BC F0A48EBC 4 𤎼 𤎼 cjk 2000 Unicode3.1
𤘩 0xF5B1 U+24629 F0A498A9 4 𤘩 𤘩 cjk 2000 Unicode3.1
𤚥 0xF5B7 U+246A5 F0A49AA5 4 𤚥 𤚥 cjk 2000 Unicode3.1
𤢖 0xF5D1 U+24896 F0A4A296 4 𤢖 𤢖 cjk 2000 Unicode3.1
𤩍 0xF5F9 U+24A4D F0A4A98D 4 𤩍 𤩍 cjk 2000 Unicode3.1
𤭖 0xF64D U+24B56 F0A4AD96 4 𤭖 𤭖 cjk 2000 Unicode3.1
𤭯 0xF64F U+24B6F F0A4ADAF 4 𤭯 𤭯 cjk 2000 Unicode3.1
𤰖 0xF654 U+24C16 F0A4B096 4 𤰖 𤰖 cjk 2000 Unicode3.1
𤴔 0xF663 U+24D14 F0A4B494 4 𤴔 𤴔 cjk 2000 Unicode3.1
𤸎 0xF67C U+24E0E F0A4B88E 4 𤸎 𤸎 cjk 2000 Unicode3.1
𤸷 0xF681 U+24E37 F0A4B8B7 4 𤸷 𤸷 cjk 2000 Unicode3.1
𤹪 0xF686 U+24E6A F0A4B9AA 4 𤹪 𤹪 cjk 2000 Unicode3.1
𤺋 0xF689 U+24E8B F0A4BA8B 4 𤺋 𤺋 cjk 2000 Unicode3.1
𥁊 0xF695 U+2504A F0A5818A 4 𥁊 𥁊 cjk 2000 Unicode3.1
𥁕 0xF697 U+25055 F0A58195 4 𥁕 𥁕 cjk 2000 Unicode3.1
𥄢 0xF69A U+25122 F0A584A2 4 𥄢 𥄢 cjk 2000 Unicode3.1
𥆩 0xF69F U+251A9 F0A586A9 4 𥆩 𥆩 cjk 2000 Unicode3.1
𥇥 0xF6A1 U+251E5 F0A587A5 4 𥇥 𥇥 cjk 2000 Unicode3.1
𥇍 0xF6A2 U+251CD F0A5878D 4 𥇍 𥇍 cjk 2000 Unicode3.1
𥈞 0xF6A6 U+2521E F0A5889E 4 𥈞 𥈞 cjk 2000 Unicode3.1
𥉌 0xF6AA U+2524C F0A5898C 4 𥉌 𥉌 cjk 2000 Unicode3.1
𥐮 0xF6BB U+2542E F0A590AE 4 𥐮 𥐮 cjk 2000 Unicode3.1
𥓙 0xF6C6 U+254D9 F0A59399 4 𥓙 𥓙 cjk 2000 Unicode3.1
𥖧 0xF6D9 U+255A7 F0A596A7 4 𥖧 𥖧 cjk 2000 Unicode3.1
𥞩 0xF6F3 U+257A9 F0A59EA9 4 𥞩 𥞩 cjk 2000 Unicode3.1
𥞴 0xF6F4 U+257B4 F0A59EB4 4 𥞴 𥞴 cjk 2000 Unicode3.1
𥧔 0xF751 U+259D4 F0A5A794 4 𥧔 𥧔 cjk 2000 Unicode3.1
𥫤 0xF75C U+25AE4 F0A5ABA4 4 𥫤 𥫤 cjk 2000 Unicode3.1
𥫣 0xF75D U+25AE3 F0A5ABA3 4 𥫣 𥫣 cjk 2000 Unicode3.1
𥫱 0xF75F U+25AF1 F0A5ABB1 4 𥫱 𥫱 cjk 2000 Unicode3.1
𥮲 0xF771 U+25BB2 F0A5AEB2 4 𥮲 𥮲 cjk 2000 Unicode3.1
𥱋 0xF77C U+25C4B F0A5B18B 4 𥱋 𥱋 cjk 2000 Unicode3.1
𥱤 0xF77D U+25C64 F0A5B1A4 4 𥱤 𥱤 cjk 2000 Unicode3.1
𥸮 0xF793 U+25E2E F0A5B8AE 4 𥸮 𥸮 cjk 2000 Unicode3.1
𥹖 0xF794 U+25E56 F0A5B996 4 𥹖 𥹖 cjk 2000 Unicode3.1
𥹥 0xF795 U+25E65 F0A5B9A5 4 𥹥 𥹥 cjk 2000 Unicode3.1
𥹢 0xF797 U+25E62 F0A5B9A2 4 𥹢 𥹢 cjk 2000 Unicode3.1
𥻘 0xF79B U+25ED8 F0A5BB98 4 𥻘 𥻘 cjk 2000 Unicode3.1
𥻂 0xF79D U+25EC2 F0A5BB82 4 𥻂 𥻂 cjk 2000 Unicode3.1
𥻨 0xF7A0 U+25EE8 F0A5BBA8 4 𥻨 𥻨 cjk 2000 Unicode3.1
𥼣 0xF7A2 U+25F23 F0A5BCA3 4 𥼣 𥼣 cjk 2000 Unicode3.1
𥽜 0xF7A5 U+25F5C F0A5BD9C 4 𥽜 𥽜 cjk 2000 Unicode3.1
𥿠 0xF7AC U+25FE0 F0A5BFA0 4 𥿠 𥿠 cjk 2000 Unicode3.1
𥿔 0xF7AD U+25FD4 F0A5BF94 4 𥿔 𥿔 cjk 2000 Unicode3.1
𦀌 0xF7B2 U+2600C F0A6808C 4 𦀌 𦀌 cjk 2000 Unicode3.1
𥿻 0xF7B3 U+25FFB F0A5BFBB 4 𥿻 𥿻 cjk 2000 Unicode3.1
𦀗 0xF7BB U+26017 F0A68097 4 𦀗 𦀗 cjk 2000 Unicode3.1
𦁠 0xF7C0 U+26060 F0A681A0 4 𦁠 𦁠 cjk 2000 Unicode3.1
𦃭 0xF7CD U+260ED F0A683AD 4 𦃭 𦃭 cjk 2000 Unicode3.1
𦉰 0xF7E7 U+26270 F0A689B0 4 𦉰 𦉰 cjk 2000 Unicode3.1
𦊆 0xF7E9 U+26286 F0A68A86 4 𦊆 𦊆 cjk 2000 Unicode3.1
𦍌 0xF7F0 U+2634C F0A68D8C 4 𦍌 𦍌 cjk 2000 Unicode3.1
𣴎 0xF7F3 U+23D0E F0A3B48E 4 𣴎 𣴎 cjk 2000 Unicode3.1
𦐂 0xF7F7 U+26402 F0A69082 4 𦐂 𦐂 cjk 2000 Unicode3.1
𦙾 0xF854 U+2667E F0A699BE 4 𦙾 𦙾 cjk 2000 Unicode3.1
𦚰 0xF859 U+266B0 F0A69AB0 4 𦚰 𦚰 cjk 2000 Unicode3.1
𦜝 0xF865 U+2671D F0A69C9D 4 𦜝 𦜝 cjk 2000 Unicode3.1
𦣝 0xF875 U+268DD F0A6A39D 4 𦣝 𦣝 cjk 2000 Unicode3.1
𦣪 0xF877 U+268EA F0A6A3AA 4 𦣪 𦣪 cjk 2000 Unicode3.1
𦥑 0xF879 U+26951 F0A6A591 4 𦥑 𦥑 cjk 2000 Unicode3.1
𦥯 0xF87C U+2696F F0A6A5AF 4 𦥯 𦥯 cjk 2000 Unicode3.1
𦧝 0xF87E U+269DD F0A6A79D 4 𦧝 𦧝 cjk 2000 Unicode3.1
𦨞 0xF883 U+26A1E F0A6A89E 4 𦨞 𦨞 cjk 2000 Unicode3.1
𦩘 0xF88A U+26A58 F0A6A998 4 𦩘 𦩘 cjk 2000 Unicode3.1
𦪌 0xF890 U+26A8C F0A6AA8C 4 𦪌 𦪌 cjk 2000 Unicode3.1
𦪷 0xF893 U+26AB7 F0A6AAB7 4 𦪷 𦪷 cjk 2000 Unicode3.1
𦱳 0xF8C2 U+26C73 F0A6B1B3 4 𦱳 𦱳 cjk 2000 Unicode3.1
𦳝 0xF8CC U+26CDD F0A6B39D 4 𦳝 𦳝 cjk 2000 Unicode3.1
𦹥 0xF8DB U+26E65 F0A6B9A5 4 𦹥 𦹥 cjk 2000 Unicode3.1
𦾔 0xF8F3 U+26F94 F0A6BE94 4 𦾔 𦾔 cjk 2000 Unicode3.1
𦿸 0xF8FC U+26FF8 F0A6BFB8 4 𦿸 𦿸 cjk 2000 Unicode3.1
𦿶 0xF940 U+26FF6 F0A6BFB6 4 𦿶 𦿶 cjk 2000 Unicode3.1
𦿷 0xF941 U+26FF7 F0A6BFB7 4 𦿷 𦿷 cjk 2000 Unicode3.1
𧄍 0xF952 U+2710D F0A7848D 4 𧄍 𧄍 cjk 2000 Unicode3.1
𧄹 0xF955 U+27139 F0A784B9 4 𧄹 𧄹 cjk 2000 Unicode3.1
𧏛 0xF984 U+273DB F0A78F9B 4 𧏛 𧏛 cjk 2000 Unicode3.1
𧏚 0xF985 U+273DA F0A78F9A 4 𧏚 𧏚 cjk 2000 Unicode3.1
𧏾 0xF98B U+273FE F0A78FBE 4 𧏾 𧏾 cjk 2000 Unicode3.1
𧐐 0xF98E U+27410 F0A79090 4 𧐐 𧐐 cjk 2000 Unicode3.1
𧑉 0xF993 U+27449 F0A79189 4 𧑉 𧑉 cjk 2000 Unicode3.1
𧘕 0xF9A7 U+27615 F0A79895 4 𧘕 𧘕 cjk 2000 Unicode3.1
𧘔 0xF9A8 U+27614 F0A79894 4 𧘔 𧘔 cjk 2000 Unicode3.1
𧘱 0xF9AA U+27631 F0A798B1 4 𧘱 𧘱 cjk 2000 Unicode3.1
𧚓 0xF9B2 U+27693 F0A79A93 4 𧚓 𧚓 cjk 2000 Unicode3.1
𧜎 0xF9BA U+2770E F0A79C8E 4 𧜎 𧜎 cjk 2000 Unicode3.1
𧜣 0xF9BC U+27723 F0A79CA3 4 𧜣 𧜣 cjk 2000 Unicode3.1
𧝒 0xF9C0 U+27752 F0A79D92 4 𧝒 𧝒 cjk 2000 Unicode3.1
𧦅 0xF9D4 U+27985 F0A7A685 4 𧦅 𧦅 cjk 2000 Unicode3.1
𧪄 0xF9E1 U+27A84 F0A7AA84 4 𧪄 𧪄 cjk 2000 Unicode3.1
𧮳 0xF9F5 U+27BB3 F0A7AEB3 4 𧮳 𧮳 cjk 2000 Unicode3.1
𧮾 0xF9F7 U+27BBE F0A7AEBE 4 𧮾 𧮾 cjk 2000 Unicode3.1
𧯇 0xF9F8 U+27BC7 F0A7AF87 4 𧯇 𧯇 cjk 2000 Unicode3.1
𧲸 0xFA44 U+27CB8 F0A7B2B8 4 𧲸 𧲸 cjk 2000 Unicode3.1
𧶠 0xFA4E U+27DA0 F0A7B6A0 4 𧶠 𧶠 cjk 2000 Unicode3.1
𧸐 0xFA51 U+27E10 F0A7B890 4 𧸐 𧸐 cjk 2000 Unicode3.1
𧾷 0xFA58 U+27FB7 F0A7BEB7 4 𧾷 𧾷 cjk 2000 Unicode3.1
𨂊 0xFA61 U+2808A F0A8828A 4 𨂊 𨂊 cjk 2000 Unicode3.1
𨂻 0xFA67 U+280BB F0A882BB 4 𨂻 𨂻 cjk 2000 Unicode3.1
𨊂 0xFA78 U+28282 F0A88A82 4 𨊂 𨊂 cjk 2000 Unicode3.1
𨋳 0xFA7D U+282F3 F0A88BB3 4 𨋳 𨋳 cjk 2000 Unicode3.1
𨐌 0xFA86 U+2840C F0A8908C 4 𨐌 𨐌 cjk 2000 Unicode3.1
𨑕 0xFA8B U+28455 F0A89195 4 𨑕 𨑕 cjk 2000 Unicode3.1
𨕫 0xFA9A U+2856B F0A895AB 4 𨕫 𨕫 cjk 2000 Unicode3.1
𨗈 0xFA9E U+285C8 F0A89788 4 𨗈 𨗈 cjk 2000 Unicode3.1
𨗉 0xFA9F U+285C9 F0A89789 4 𨗉 𨗉 cjk 2000 Unicode3.1
𨛗 0xFAAA U+286D7 F0A89B97 4 𨛗 𨛗 cjk 2000 Unicode3.1
𨛺 0xFAAD U+286FA F0A89BBA 4 𨛺 𨛺 cjk 2000 Unicode3.1
𨥉 0xFACD U+28949 F0A8A589 4 𨥉 𨥉 cjk 2000 Unicode3.1
𨥆 0xFACE U+28946 F0A8A586 4 𨥆 𨥆 cjk 2000 Unicode3.1
𨥫 0xFAD5 U+2896B F0A8A5AB 4 𨥫 𨥫 cjk 2000 Unicode3.1
𨦇 0xFAE3 U+28987 F0A8A687 4 𨦇 𨦇 cjk 2000 Unicode3.1
𨦈 0xFAE4 U+28988 F0A8A688 4 𨦈 𨦈 cjk 2000 Unicode3.1
𨦺 0xFAEF U+289BA F0A8A6BA 4 𨦺 𨦺 cjk 2000 Unicode3.1
𨦻 0xFAF0 U+289BB F0A8A6BB 4 𨦻 𨦻 cjk 2000 Unicode3.1
𨨞 0xFAFC U+28A1E F0A8A89E 4 𨨞 𨨞 cjk 2000 Unicode3.1
𨨩 0xFB40 U+28A29 F0A8A8A9 4 𨨩 𨨩 cjk 2000 Unicode3.1
𨩱 0xFB4B U+28A71 F0A8A9B1 4 𨩱 𨩱 cjk 2000 Unicode3.1
𨩃 0xFB4C U+28A43 F0A8A983 4 𨩃 𨩃 cjk 2000 Unicode3.1
𨪙 0xFB55 U+28A99 F0A8AA99 4 𨪙 𨪙 cjk 2000 Unicode3.1
𨫍 0xFB56 U+28ACD F0A8AB8D 4 𨫍 𨫍 cjk 2000 Unicode3.1
𨫤 0xFB5C U+28AE4 F0A8ABA4 4 𨫤 𨫤 cjk 2000 Unicode3.1
𨫝 0xFB5D U+28ADD F0A8AB9D 4 𨫝 𨫝 cjk 2000 Unicode3.1
𨯁 0xFB6D U+28BC1 F0A8AF81 4 𨯁 𨯁 cjk 2000 Unicode3.1
𨯯 0xFB6E U+28BEF F0A8AFAF 4 𨯯 𨯯 cjk 2000 Unicode3.1
𨴐 0xFB76 U+28D10 F0A8B490 4 𨴐 𨴐 cjk 2000 Unicode3.1
𨵱 0xFB79 U+28D71 F0A8B5B1 4 𨵱 𨵱 cjk 2000 Unicode3.1
𨷻 0xFB7B U+28DFB F0A8B7BB 4 𨷻 𨷻 cjk 2000 Unicode3.1
𨸟 0xFB7C U+28E1F F0A8B89F 4 𨸟 𨸟 cjk 2000 Unicode3.1
𨸶 0xFB81 U+28E36 F0A8B8B6 4 𨸶 𨸶 cjk 2000 Unicode3.1
𨺉 0xFB85 U+28E89 F0A8BA89 4 𨺉 𨺉 cjk 2000 Unicode3.1
𨻫 0xFB87 U+28EEB F0A8BBAB 4 𨻫 𨻫 cjk 2000 Unicode3.1
𨼲 0xFB89 U+28F32 F0A8BCB2 4 𨼲 𨼲 cjk 2000 Unicode3.1
𨿸 0xFB91 U+28FF8 F0A8BFB8 4 𨿸 𨿸 cjk 2000 Unicode3.1
𩊠 0xFBA0 U+292A0 F0A98AA0 4 𩊠 𩊠 cjk 2000 Unicode3.1
𩊱 0xFBA1 U+292B1 F0A98AB1 4 𩊱 𩊱 cjk 2000 Unicode3.1
𩒐 0xFBB6 U+29490 F0A99290 4 𩒐 𩒐 cjk 2000 Unicode3.1
𩗏 0xFBC0 U+295CF F0A9978F 4 𩗏 𩗏 cjk 2000 Unicode3.1
𩙿 0xFBCA U+2967F F0A999BF 4 𩙿 𩙿 cjk 2000 Unicode3.1
𩛰 0xFBD4 U+296F0 F0A99BB0 4 𩛰 𩛰 cjk 2000 Unicode3.1
𩜙 0xFBD7 U+29719 F0A99C99 4 𩜙 𩜙 cjk 2000 Unicode3.1
𩝐 0xFBDB U+29750 F0A99D90 4 𩝐 𩝐 cjk 2000 Unicode3.1
𩣆 0xFBF4 U+298C6 F0A9A386 4 𩣆 𩣆 cjk 2000 Unicode3.1
𩩲 0xFC4B U+29A72 F0A9A9B2 4 𩩲 𩩲 cjk 2000 Unicode3.1
𩷛 0xFC6A U+29DDB F0A9B79B 4 𩷛 𩷛 cjk 2000 Unicode3.1
𩸽 0xFC6B U+29E3D F0A9B8BD 4 𩸽 𩸽 cjk 2000 Unicode3.1
𩸕 0xFC78 U+29E15 F0A9B895 4 𩸕 𩸕 cjk 2000 Unicode3.1
𩺊 0xFC7A U+29E8A F0A9BA8A 4 𩺊 𩺊 cjk 2000 Unicode3.1
𩹉 0xFC7C U+29E49 F0A9B989 4 𩹉 𩹉 cjk 2000 Unicode3.1
𩻄 0xFC87 U+29EC4 F0A9BB84 4 𩻄 𩻄 cjk 2000 Unicode3.1
𩻩 0xFC8D U+29EE9 F0A9BBA9 4 𩻩 𩻩 cjk 2000 Unicode3.1
𩻛 0xFC90 U+29EDB F0A9BB9B 4 𩻛 𩻛 cjk 2000 Unicode3.1
𩿎 0xFCA3 U+29FCE F0A9BF8E 4 𩿎 𩿎 cjk 2000 Unicode3.1
𪀯 0xFCA7 U+2A02F F0AA80AF 4 𪀯 𪀯 cjk 2000 Unicode3.1
𪀚 0xFCA9 U+2A01A F0AA809A 4 𪀚 𪀚 cjk 2000 Unicode3.1
𪃹 0xFCB0 U+2A0F9 F0AA83B9 4 𪃹 𪃹 cjk 2000 Unicode3.1
𪂂 0xFCB3 U+2A082 F0AA8282 4 𪂂 𪂂 cjk 2000 Unicode3.1
𢈘 0xFCD1 U+22218 F0A28898 4 𢈘 𢈘 cjk 2000 Unicode3.1
𪎌 0xFCD6 U+2A38C F0AA8E8C 4 𪎌 𪎌 cjk 2000 Unicode3.1
𪐷 0xFCD8 U+2A437 F0AA90B7 4 𪐷 𪐷 cjk 2000 Unicode3.1
𪗱 0xFCEC U+2A5F1 F0AA97B1 4 𪗱 𪗱 cjk 2000 Unicode3.1
𪘂 0xFCEE U+2A602 F0AA9882 4 𪘂 𪘂 cjk 2000 Unicode3.1
𪘚 0xFCF0 U+2A61A F0AA989A 4 𪘚 𪘚 cjk 2000 Unicode3.1
𪚲 0xFCF4 U+2A6B2 F0AA9AB2 4 𪚲 𪚲 cjk 2000 Unicode3.1

Shift_JIS-2004(JIS X 0213:2004)で4バイトのUTF-8 文字のみ

𠀋 𡈽 𡌛 𡑮 𡢽 𠮟 𡚴 𡸴 𣇄 𣗄 𣜿 𣝣 𣳾 𤟱 𥒎 𥔎 𥝱 𥧄 𥶡 𦫿 𦹀 𧃴 𧚄 𨉷 𨏍 𪆐 𠂉 𠂢 𠂤 𠆢 𠈓 𠌫 𠎁 𠍱 𠏹 𠑊 𠔉 𠗖 𠘨 𠝏 𠠇 𠠺 𠢹 𠥼 𠦝 𠫓 𠬝 𠵅 𠷡 𠺕 𠹭 𠹤 𠽟 𡈁 𡉕 𡉻 𡉴 𡋤 𡋗 𡋽 𡌶 𡍄 𡏄 𡑭 𡗗 𦰩 𡙇 𡜆 𡝂 𡧃 𡱖 𡴭 𡵅 𡵸 𡵢 𡶡 𡶜 𡶒 𡶷 𡷠 𡸳 𡼞 𡽶 𡿺 𢅻 𢌞 𢎭 𢛳 𢡛 𢢫 𢦏 𢪸 𢭏 𢭐 𢭆 𢰝 𢮦 𢰤 𢷡 𣇃 𣇵 𣆶 𣍲 𣏓 𣏒 𣏐 𣏤 𣏕 𣏚 𣏟 𣑊 𣑑 𣑋 𣑥 𣓤 𣕚 𣖔 𣘹 𣙇 𣘸 𣘺 𣜜 𣜌 𣝤 𣟿 𣟧 𣠤 𣠽 𣪘 𣱿 𣴀 𣵀 𣷺 𣷹 𣷓 𣽾 𤂖 𤄃 𤇆 𤇾 𤎼 𤘩 𤚥 𤢖 𤩍 𤭖 𤭯 𤰖 𤴔 𤸎 𤸷 𤹪 𤺋 𥁊 𥁕 𥄢 𥆩 𥇥 𥇍 𥈞 𥉌 𥐮 𥓙 𥖧 𥞩 𥞴 𥧔 𥫤 𥫣 𥫱 𥮲 𥱋 𥱤 𥸮 𥹖 𥹥 𥹢 𥻘 𥻂 𥻨 𥼣 𥽜 𥿠 𥿔 𦀌 𥿻 𦀗 𦁠 𦃭 𦉰 𦊆 𦍌 𣴎 𦐂 𦙾 𦚰 𦜝 𦣝 𦣪 𦥑 𦥯 𦧝 𦨞 𦩘 𦪌 𦪷 𦱳 𦳝 𦹥 𦾔 𦿸 𦿶 𦿷 𧄍 𧄹 𧏛 𧏚 𧏾 𧐐 𧑉 𧘕 𧘔 𧘱 𧚓 𧜎 𧜣 𧝒 𧦅 𧪄 𧮳 𧮾 𧯇 𧲸 𧶠 𧸐 𧾷 𨂊 𨂻 𨊂 𨋳 𨐌 𨑕 𨕫 𨗈 𨗉 𨛗 𨛺 𨥉 𨥆 𨥫 𨦇 𨦈 𨦺 𨦻 𨨞 𨨩 𨩱 𨩃 𨪙 𨫍 𨫤 𨫝 𨯁 𨯯 𨴐 𨵱 𨷻 𨸟 𨸶 𨺉 𨻫 𨼲 𨿸 𩊠 𩊱 𩒐 𩗏 𩙿 𩛰 𩜙 𩝐 𩣆 𩩲 𩷛 𩸽 𩸕 𩺊 𩹉 𩻄 𩻩 𩻛 𩿎 𪀯 𪀚 𪃹 𪂂 𢈘 𪎌 𪐷 𪗱 𪘂 𪘚 𪚲

Shift_JIS-2004(JIS X 0213:2004)で4バイトのUTF-8 数値文字参照(10進)

𠀋 𡈽 𡌛 𡑮 𡢽 𠮟 𡚴 𡸴 𣇄 𣗄 𣜿 𣝣 𣳾 𤟱 𥒎 𥔎 𥝱 𥧄 𥶡 𦫿 𦹀 𧃴 𧚄 𨉷 𨏍 𪆐 𠂉 𠂢 𠂤 𠆢 𠈓 𠌫 𠎁 𠍱 𠏹 𠑊 𠔉 𠗖 𠘨 𠝏 𠠇 𠠺 𠢹 𠥼 𠦝 𠫓 𠬝 𠵅 𠷡 𠺕 𠹭 𠹤 𠽟 𡈁 𡉕 𡉻 𡉴 𡋤 𡋗 𡋽 𡌶 𡍄 𡏄 𡑭 𡗗 𦰩 𡙇 𡜆 𡝂 𡧃 𡱖 𡴭 𡵅 𡵸 𡵢 𡶡 𡶜 𡶒 𡶷 𡷠 𡸳 𡼞 𡽶 𡿺 𢅻 𢌞 𢎭 𢛳 𢡛 𢢫 𢦏 𢪸 𢭏 𢭐 𢭆 𢰝 𢮦 𢰤 𢷡 𣇃 𣇵 𣆶 𣍲 𣏓 𣏒 𣏐 𣏤 𣏕 𣏚 𣏟 𣑊 𣑑 𣑋 𣑥 𣓤 𣕚 𣖔 𣘹 𣙇 𣘸 𣘺 𣜜 𣜌 𣝤 𣟿 𣟧 𣠤 𣠽 𣪘 𣱿 𣴀 𣵀 𣷺 𣷹 𣷓 𣽾 𤂖 𤄃 𤇆 𤇾 𤎼 𤘩 𤚥 𤢖 𤩍 𤭖 𤭯 𤰖 𤴔 𤸎 𤸷 𤹪 𤺋 𥁊 𥁕 𥄢 𥆩 𥇥 𥇍 𥈞 𥉌 𥐮 𥓙 𥖧 𥞩 𥞴 𥧔 𥫤 𥫣 𥫱 𥮲 𥱋 𥱤 𥸮 𥹖 𥹥 𥹢 𥻘 𥻂 𥻨 𥼣 𥽜 𥿠 𥿔 𦀌 𥿻 𦀗 𦁠 𦃭 𦉰 𦊆 𦍌 𣴎 𦐂 𦙾 𦚰 𦜝 𦣝 𦣪 𦥑 𦥯 𦧝 𦨞 𦩘 𦪌 𦪷 𦱳 𦳝 𦹥 𦾔 𦿸 𦿶 𦿷 𧄍 𧄹 𧏛 𧏚 𧏾 𧐐 𧑉 𧘕 𧘔 𧘱 𧚓 𧜎 𧜣 𧝒 𧦅 𧪄 𧮳 𧮾 𧯇 𧲸 𧶠 𧸐 𧾷 𨂊 𨂻 𨊂 𨋳 𨐌 𨑕 𨕫 𨗈 𨗉 𨛗 𨛺 𨥉 𨥆 𨥫 𨦇 𨦈 𨦺 𨦻 𨨞 𨨩 𨩱 𨩃 𨪙 𨫍 𨫤 𨫝 𨯁 𨯯 𨴐 𨵱 𨷻 𨸟 𨸶 𨺉 𨻫 𨼲 𨿸 𩊠 𩊱 𩒐 𩗏 𩙿 𩛰 𩜙 𩝐 𩣆 𩩲 𩷛 𩸽 𩸕 𩺊 𩹉 𩻄 𩻩 𩻛 𩿎 𪀯 𪀚 𪃹 𪂂 𢈘 𪎌 𪐷 𪗱 𪘂 𪘚 𪚲

やっとデータが揃ったので、MySQLでテストしてみよう。
※今後、絵文字なども調査してみたい。