Shift_JIS-2004 (JIS X 0213:2004)中の文字でUTF-8にすると4バイトになる文字を調べてみた。

UTF-8はUNICODEを符号化したもので、1文字あたり1~6バイトまでのバイト数になるマルチバイト文字だ。

通常のShift_JISの範囲であればUTF-8では3バイトに収まる。

しかし、Shift_JIS-2004(JIS X 0213:2004)ではUTF-8では4バイトの符号化される文字が含まれた。

JIS X 0213:2004 UTF-8で4バイトに符号化される文字

MySQLの文字コードはUTF-8を利用しているが、どうやら普通には4バイトのUTF-8は格納できず、create database,create table, columnの定義など必要な個所に CHARACTER SET utf8mb4 を定義する必要がある。

10.1.10.7 
utf8mb4 文字セット (4 バイトの UTF-8 Unicode エンコーディング) utf8 という名前の文字セットは、文字あたり最大 3 バイトを使用し、BMP 文字だけを含みます。
utf8mb4 文字セットは、文字ごとに最大 4 バイトを使用し、補助文字をサポートします。 MySQL :: MySQL 5.6 リファレンスマニュアル :: 10.1.10.7 utf8mb4 文字セット (4 バイトの UTF-8 Unicode エンコーディング)

ついに、このUTF-8では4バイトとなる文字領域を扱う必要が出てきた。 テストデータを準備する際に困ったのは、4バイトとなる文字はどれか知らない。

そのためShift_JIS-2004の文字がUTF-8にした場合のバイト数を総当りして調査した。

※ 基となったデータはこちら。 (ブラウザのフォントによっては見れません。 )

JIS X 0213のコード対応表 JIS X 0213のコード対応表

Shift_JIS-2004(JIS X 0213:2004)のUTF-8バイト数一覧表 黄色が4バイトになる文字。

データが大きいため、別ページへ。

Shift_JIS-2004(JIS X 0213:2004)のUTF-8バイト数一覧表 Shift_JIS-2004(JIS X 0213:2004)のUTF-8バイト数一覧表

Shift_JIS-2004(JIS X 0213:2004)の文字で、4バイトのUTF-8に符号化される文字一覧表

文字 SJIS UNICODE UTF-8 UTF-8 length 数値文字参照(10進) 数値文字参照(16進) type year Unicode ver.
𠀋 0x87A0 U+2000B F0A0808B 4 𠀋 𠀋 cjk 2000 Unicode3.1
𡈽 0x8861 U+2123D F0A188BD 4 𡈽 𡈽 cjk 2000 Unicode3.1
𡌛 0x886B U+2131B F0A18C9B 4 𡌛 𡌛 cjk 2000 Unicode3.1
𡑮 0x8880 U+2146E F0A191AE 4 𡑮 𡑮 cjk 2000 Unicode3.1
𡢽 0x889B U+218BD F0A1A2BD 4 𡢽 𡢽 cjk 2000 Unicode3.1
𠮟 0x9873 U+20B9F F0A0AE9F 4 𠮟 𠮟 cjk 2004 Unicode3.1
𡚴 0x9883 U+216B4 F0A19AB4 4 𡚴 𡚴 cjk 2000 Unicode3.1
𡸴 0x988E U+21E34 F0A1B8B4 4 𡸴 𡸴 cjk 2000 Unicode3.1
𣇄 0xEB59 U+231C4 F0A38784 4 𣇄 𣇄 cjk 2000 Unicode3.1
𣗄 0xEB92 U+235C4 F0A39784 4 𣗄 𣗄 cjk 2000 Unicode3.1
𣜿 0xEBA7 U+2373F F0A39CBF 4 𣜿 𣜿 cjk 2000 Unicode3.1
𣝣 0xEBB0 U+23763 F0A39DA3 4 𣝣 𣝣 cjk 2000 Unicode3.1
𣳾 0xEBDE U+23CFE F0A3B3BE 4 𣳾 𣳾 cjk 2000 Unicode3.1
𤟱 0xEC8C U+247F1 F0A49FB1 4 𤟱 𤟱 cjk 2000 Unicode3.1
𥒎 0xECFC U+2548E F0A5928E 4 𥒎 𥒎 cjk 2000 Unicode3.1
𥔎 0xED48 U+2550E F0A5948E 4 𥔎 𥔎 cjk 2000 Unicode3.1
𥝱 0xED66 U+25771 F0A59DB1 4 𥝱 𥝱 cjk 2000 Unicode3.1
𥧄 0xED73 U+259C4 F0A5A784 4 𥧄 𥧄 cjk 2000 Unicode3.1
𥶡 0xED8E U+25DA1 F0A5B6A1 4 𥶡 𥶡 cjk 2000 Unicode3.1
𦫿 0xEDDB U+26AFF F0A6ABBF 4 𦫿 𦫿 cjk 2000 Unicode3.1
𦹀 0xEE52 U+26E40 F0A6B980 4 𦹀 𦹀 cjk 2000 Unicode3.1
𧃴 0xEE68 U+270F4 F0A783B4 4 𧃴 𧃴 cjk 2000 Unicode3.1
𧚄 0xEE8C U+27684 F0A79A84 4 𧚄 𧚄 cjk 2000 Unicode3.1
𨉷 0xEEC7 U+28277 F0A889B7 4 𨉷 𨉷 cjk 2000 Unicode3.1
𨏍 0xEECF U+283CD F0A88F8D 4 𨏍 𨏍 cjk 2000 Unicode3.1
𪆐 0xEFE4 U+2A190 F0AA8690 4 𪆐 𪆐 cjk 2000 Unicode3.1
𠂉 0xF040 U+20089 F0A08289 4 𠂉 𠂉 cjk 2000 Unicode3.1
𠂢 0xF04A U+200A2 F0A082A2 4 𠂢 𠂢 cjk 2000 Unicode3.1
𠂤 0xF04D U+200A4 F0A082A4 4 𠂤 𠂤 cjk 2000 Unicode3.1
𠆢 0xF055 U+201A2 F0A086A2 4 𠆢 𠆢 cjk 2000 Unicode3.1
𠈓 0xF065 U+20213 F0A08893 4 𠈓 𠈓 cjk 2000 Unicode3.1
𠌫 0xF090 U+2032B F0A08CAB 4 𠌫 𠌫 cjk 2000 Unicode3.1
𠎁 0xF097 U+20381 F0A08E81 4 𠎁 𠎁 cjk 2000 Unicode3.1
𠍱 0xF099 U+20371 F0A08DB1 4 𠍱 𠍱 cjk 2000 Unicode3.1
𠏹 0xF141 U+203F9 F0A08FB9 4 𠏹 𠏹 cjk 2000 Unicode3.1
𠑊 0xF144 U+2044A F0A0918A 4 𠑊 𠑊 cjk 2000 Unicode3.1
𠔉 0xF146 U+20509 F0A09489 4 𠔉 𠔉 cjk 2000 Unicode3.1
𠗖 0xF150 U+205D6 F0A09796 4 𠗖 𠗖 cjk 2000 Unicode3.1
𠘨 0xF151 U+20628 F0A098A8 4 𠘨 𠘨 cjk 2000 Unicode3.1
𠝏 0xF157 U+2074F F0A09D8F 4 𠝏 𠝏 cjk 2000 Unicode3.1
𠠇 0xF15E U+20807 F0A0A087 4 𠠇 𠠇 cjk 2000 Unicode3.1
𠠺 0xF160 U+2083A F0A0A0BA 4 𠠺 𠠺 cjk 2000 Unicode3.1
𠢹 0xF169 U+208B9 F0A0A2B9 4 𠢹 𠢹 cjk 2000 Unicode3.1
𠥼 0xF171 U+2097C F0A0A5BC 4 𠥼 𠥼 cjk 2000 Unicode3.1
𠦝 0xF172 U+2099D F0A0A69D 4 𠦝 𠦝 cjk 2000 Unicode3.1
𠫓 0xF178 U+20AD3 F0A0AB93 4 𠫓 𠫓 cjk 2000 Unicode3.1
𠬝 0xF17B U+20B1D F0A0AC9D 4 𠬝 𠬝 cjk 2000 Unicode3.1
𠵅 0xF197 U+20D45 F0A0B585 4 𠵅 𠵅 cjk 2000 Unicode3.1
𠷡 0xF1A8 U+20DE1 F0A0B7A1 4 𠷡 𠷡 cjk 2000 Unicode3.1
𠺕 0xF1AF U+20E95 F0A0BA95 4 𠺕 𠺕 cjk 2000 Unicode3.1
𠹭 0xF1B0 U+20E6D F0A0B9AD 4 𠹭 𠹭 cjk 2000 Unicode3.1
𠹤 0xF1B8 U+20E64 F0A0B9A4 4 𠹤 𠹤 cjk 2000 Unicode3.1
𠽟 0xF1BB U+20F5F F0A0BD9F 4 𠽟 𠽟 cjk 2000 Unicode3.1
𡈁 0xF1D7 U+21201 F0A18881 4 𡈁 𡈁 cjk 2000 Unicode3.1
𡉕 0xF1DA U+21255 F0A18995 4 𡉕 𡉕 cjk 2000 Unicode3.1
𡉻 0xF1DC U+2127B F0A189BB 4 𡉻 𡉻 cjk 2000 Unicode3.1
𡉴 0xF1E1 U+21274 F0A189B4 4 𡉴 𡉴 cjk 2000 Unicode3.1
𡋤 0xF1E8 U+212E4 F0A18BA4 4 𡋤 𡋤 cjk 2000 Unicode3.1
𡋗 0xF1E9 U+212D7 F0A18B97 4 𡋗 𡋗 cjk 2000 Unicode3.1
𡋽 0xF1F0 U+212FD F0A18BBD 4 𡋽 𡋽 cjk 2000 Unicode3.1
𡌶 0xF1F2 U+21336 F0A18CB6 4 𡌶 𡌶 cjk 2000 Unicode3.1
𡍄 0xF1F3 U+21344 F0A18D84 4 𡍄 𡍄 cjk 2000 Unicode3.1
𡏄 0xF244 U+213C4 F0A18F84 4 𡏄 𡏄 cjk 2000 Unicode3.1
𡑭 0xF251 U+2146D F0A191AD 4 𡑭 𡑭 cjk 2000 Unicode3.1
𡗗 0xF25D U+215D7 F0A19797 4 𡗗 𡗗 cjk 2000 Unicode3.1
𦰩 0xF263 U+26C29 F0A6B0A9 4 𦰩 𦰩 cjk 2000 Unicode3.1
𡙇 0xF266 U+21647 F0A19987 4 𡙇 𡙇 cjk 2000 Unicode3.1
𡜆 0xF274 U+21706 F0A19C86 4 𡜆 𡜆 cjk 2000 Unicode3.1
𡝂 0xF275 U+21742 F0A19D82 4 𡝂 𡝂 cjk 2000 Unicode3.1
𡧃 0xF29E U+219C3 F0A1A783 4 𡧃 𡧃 cjk 2000 Unicode3.1
𡱖 0xF0AE U+21C56 F0A1B196 4 𡱖 𡱖 cjk 2000 Unicode3.1
𡴭 0xF0B5 U+21D2D F0A1B4AD 4 𡴭 𡴭 cjk 2000 Unicode3.1
𡵅 0xF0B6 U+21D45 F0A1B585 4 𡵅 𡵅 cjk 2000 Unicode3.1
𡵸 0xF0B8 U+21D78 F0A1B5B8 4 𡵸 𡵸 cjk 2000 Unicode3.1
𡵢 0xF0B9 U+21D62 F0A1B5A2 4 𡵢 𡵢 cjk 2000 Unicode3.1
𡶡 0xF0BD U+21DA1 F0A1B6A1 4 𡶡 𡶡 cjk 2000 Unicode3.1
𡶜 0xF0BE U+21D9C F0A1B69C 4 𡶜 𡶜 cjk 2000 Unicode3.1
𡶒 0xF0C3 U+21D92 F0A1B692 4 𡶒 𡶒 cjk 2000 Unicode3.1
𡶷 0xF0C6 U+21DB7 F0A1B6B7 4 𡶷 𡶷 cjk 2000 Unicode3.1
𡷠 0xF0C8 U+21DE0 F0A1B7A0 4 𡷠 𡷠 cjk 2000 Unicode3.1
𡸳 0xF0C9 U+21E33 F0A1B8B3 4 𡸳 𡸳 cjk 2000 Unicode3.1
𡼞 0xF0D9 U+21F1E F0A1BC9E 4 𡼞 𡼞 cjk 2000 Unicode3.1
𡽶 0xF0E4 U+21F76 F0A1BDB6 4 𡽶 𡽶 cjk 2000 Unicode3.1
𡿺 0xF0EA U+21FFA F0A1BFBA 4 𡿺 𡿺 cjk 2000 Unicode3.1
𢅻 0xF2A0 U+2217B F0A285BB 4 𢅻 𢅻 cjk 2000 Unicode3.1
𢌞 0xF2A9 U+2231E F0A28C9E 4 𢌞 𢌞 cjk 2000 Unicode3.1
𢎭 0xF2AE U+223AD F0A28EAD 4 𢎭 𢎭 cjk 2000 Unicode3.1
𢛳 0xF2CE U+226F3 F0A29BB3 4 𢛳 𢛳 cjk 2000 Unicode3.1
𢡛 0xF2E3 U+2285B F0A2A19B 4 𢡛 𢡛 cjk 2000 Unicode3.1
𢢫 0xF2EB U+228AB F0A2A2AB 4 𢢫 𢢫 cjk 2000 Unicode3.1
𢦏 0xF2F0 U+2298F F0A2A68F 4 𢦏 𢦏 cjk 2000 Unicode3.1
𢪸 0xF343 U+22AB8 F0A2AAB8 4 𢪸 𢪸 cjk 2000 Unicode3.1
𢭏 0xF348 U+22B4F F0A2AD8F 4 𢭏 𢭏 cjk 2000 Unicode3.1
𢭐 0xF349 U+22B50 F0A2AD90 4 𢭐 𢭐 cjk 2000 Unicode3.1
𢭆 0xF351 U+22B46 F0A2AD86 4 𢭆 𢭆 cjk 2000 Unicode3.1
𢰝 0xF353 U+22C1D F0A2B09D 4 𢰝 𢰝 cjk 2000 Unicode3.1
𢮦 0xF354 U+22BA6 F0A2AEA6 4 𢮦 𢮦 cjk 2000 Unicode3.1
𢰤 0xF358 U+22C24 F0A2B0A4 4 𢰤 𢰤 cjk 2000 Unicode3.1
𢷡 0xF375 U+22DE1 F0A2B7A1 4 𢷡 𢷡 cjk 2000 Unicode3.1
𣇃 0xF39D U+231C3 F0A38783 4 𣇃 𣇃 cjk 2000 Unicode3.1
𣇵 0xF3A1 U+231F5 F0A387B5 4 𣇵 𣇵 cjk 2000 Unicode3.1
𣆶 0xF3A2 U+231B6 F0A386B6 4 𣆶 𣆶 cjk 2000 Unicode3.1
𣍲 0xF3B8 U+23372 F0A38DB2 4 𣍲 𣍲 cjk 2000 Unicode3.1
𣏓 0xF3BA U+233D3 F0A38F93 4 𣏓 𣏓 cjk 2000 Unicode3.1
𣏒 0xF3BB U+233D2 F0A38F92 4 𣏒 𣏒 cjk 2000 Unicode3.1
𣏐 0xF3C0 U+233D0 F0A38F90 4 𣏐 𣏐 cjk 2000 Unicode3.1
𣏤 0xF3C1 U+233E4 F0A38FA4 4 𣏤 𣏤 cjk 2000 Unicode3.1
𣏕 0xF3C2 U+233D5 F0A38F95 4 𣏕 𣏕 cjk 2000 Unicode3.1
𣏚 0xF3C5 U+233DA F0A38F9A 4 𣏚 𣏚 cjk 2000 Unicode3.1
𣏟 0xF3C7 U+233DF F0A38F9F 4 𣏟 𣏟 cjk 2000 Unicode3.1
𣑊 0xF3D3 U+2344A F0A3918A 4 𣑊 𣑊 cjk 2000 Unicode3.1
𣑑 0xF3D4 U+23451 F0A39191 4 𣑑 𣑑 cjk 2000 Unicode3.1
𣑋 0xF3D5 U+2344B F0A3918B 4 𣑋 𣑋 cjk 2000 Unicode3.1
𣑥 0xF3D9 U+23465 F0A391A5 4 𣑥 𣑥 cjk 2000 Unicode3.1
𣓤 0xF3F5 U+234E4 F0A393A4 4 𣓤 𣓤 cjk 2000 Unicode3.1
𣕚 0xF3F6 U+2355A F0A3959A 4 𣕚 𣕚 cjk 2000 Unicode3.1
𣖔 0xF449 U+23594 F0A39694 4 𣖔 𣖔 cjk 2000 Unicode3.1
𣘹 0xF45E U+23639 F0A398B9 4 𣘹 𣘹 cjk 2000 Unicode3.1
𣙇 0xF45F U+23647 F0A39987 4 𣙇 𣙇 cjk 2000 Unicode3.1
𣘸 0xF461 U+23638 F0A398B8 4 𣘸 𣘸 cjk 2000 Unicode3.1
𣘺 0xF462 U+2363A F0A398BA 4 𣘺 𣘺 cjk 2000 Unicode3.1
𣜜 0xF46D U+2371C F0A39C9C 4 𣜜 𣜜 cjk 2000 Unicode3.1
𣜌 0xF478 U+2370C F0A39C8C 4 𣜌 𣜌 cjk 2000 Unicode3.1
𣝤 0xF481 U+23764 F0A39DA4 4 𣝤 𣝤 cjk 2000 Unicode3.1
𣟿 0xF489 U+237FF F0A39FBF 4 𣟿 𣟿 cjk 2000 Unicode3.1
𣟧 0xF48A U+237E7 F0A39FA7 4 𣟧 𣟧 cjk 2000 Unicode3.1
𣠤 0xF490 U+23824 F0A3A0A4 4 𣠤 𣠤 cjk 2000 Unicode3.1
𣠽 0xF495 U+2383D F0A3A0BD 4 𣠽 𣠽 cjk 2000 Unicode3.1
𣪘 0xF4A1 U+23A98 F0A3AA98 4 𣪘 𣪘 cjk 2000 Unicode3.1
𣱿 0xF4B2 U+23C7F F0A3B1BF 4 𣱿 𣱿 cjk 2000 Unicode3.1
𣴀 0xF4C7 U+23D00 F0A3B480 4 𣴀 𣴀 cjk 2000 Unicode3.1
𣵀 0xF4DA U+23D40 F0A3B580 4 𣵀 𣵀 cjk 2000 Unicode3.1
𣷺 0xF4DC U+23DFA F0A3B7BA 4 𣷺 𣷺 cjk 2000 Unicode3.1
𣷹 0xF4DD U+23DF9 F0A3B7B9 4 𣷹 𣷹 cjk 2000 Unicode3.1
𣷓 0xF4DE U+23DD3 F0A3B793 4 𣷓 𣷓 cjk 2000 Unicode3.1
𣽾 0xF551 U+23F7E F0A3BDBE 4 𣽾 𣽾 cjk 2000 Unicode3.1
𤂖 0xF566 U+24096 F0A48296 4 𤂖 𤂖 cjk 2000 Unicode3.1
𤄃 0xF56C U+24103 F0A48483 4 𤄃 𤄃 cjk 2000 Unicode3.1
𤇆 0xF581 U+241C6 F0A48786 4 𤇆 𤇆 cjk 2000 Unicode3.1
𤇾 0xF584 U+241FE F0A487BE 4 𤇾 𤇾 cjk 2000 Unicode3.1
𤎼 0xF5A0 U+243BC F0A48EBC 4 𤎼 𤎼 cjk 2000 Unicode3.1
𤘩 0xF5B1 U+24629 F0A498A9 4 𤘩 𤘩 cjk 2000 Unicode3.1
𤚥 0xF5B7 U+246A5 F0A49AA5 4 𤚥 𤚥 cjk 2000 Unicode3.1
𤢖 0xF5D1 U+24896 F0A4A296 4 𤢖 𤢖 cjk 2000 Unicode3.1
𤩍 0xF5F9 U+24A4D F0A4A98D 4 𤩍 𤩍 cjk 2000 Unicode3.1
𤭖 0xF64D U+24B56 F0A4AD96 4 𤭖 𤭖 cjk 2000 Unicode3.1
𤭯 0xF64F U+24B6F F0A4ADAF 4 𤭯 𤭯 cjk 2000 Unicode3.1
𤰖 0xF654 U+24C16 F0A4B096 4 𤰖 𤰖 cjk 2000 Unicode3.1
𤴔 0xF663 U+24D14 F0A4B494 4 𤴔 𤴔 cjk 2000 Unicode3.1
𤸎 0xF67C U+24E0E F0A4B88E 4 𤸎 𤸎 cjk 2000 Unicode3.1
𤸷 0xF681 U+24E37 F0A4B8B7 4 𤸷 𤸷 cjk 2000 Unicode3.1
𤹪 0xF686 U+24E6A F0A4B9AA 4 𤹪 𤹪 cjk 2000 Unicode3.1
𤺋 0xF689 U+24E8B F0A4BA8B 4 𤺋 𤺋 cjk 2000 Unicode3.1
𥁊 0xF695 U+2504A F0A5818A 4 𥁊 𥁊 cjk 2000 Unicode3.1
𥁕 0xF697 U+25055 F0A58195 4 𥁕 𥁕 cjk 2000 Unicode3.1
𥄢 0xF69A U+25122 F0A584A2 4 𥄢 𥄢 cjk 2000 Unicode3.1
𥆩 0xF69F U+251A9 F0A586A9 4 𥆩 𥆩 cjk 2000 Unicode3.1
𥇥 0xF6A1 U+251E5 F0A587A5 4 𥇥 𥇥 cjk 2000 Unicode3.1
𥇍 0xF6A2 U+251CD F0A5878D 4 𥇍 𥇍 cjk 2000 Unicode3.1
𥈞 0xF6A6 U+2521E F0A5889E 4 𥈞 𥈞 cjk 2000 Unicode3.1
𥉌 0xF6AA U+2524C F0A5898C 4 𥉌 𥉌 cjk 2000 Unicode3.1
𥐮 0xF6BB U+2542E F0A590AE 4 𥐮 𥐮 cjk 2000 Unicode3.1
𥓙 0xF6C6 U+254D9 F0A59399 4 𥓙 𥓙 cjk 2000 Unicode3.1
𥖧 0xF6D9 U+255A7 F0A596A7 4 𥖧 𥖧 cjk 2000 Unicode3.1
𥞩 0xF6F3 U+257A9 F0A59EA9 4 𥞩 𥞩 cjk 2000 Unicode3.1
𥞴 0xF6F4 U+257B4 F0A59EB4 4 𥞴 𥞴 cjk 2000 Unicode3.1
𥧔 0xF751 U+259D4 F0A5A794 4 𥧔 𥧔 cjk 2000 Unicode3.1
𥫤 0xF75C U+25AE4 F0A5ABA4 4 𥫤 𥫤 cjk 2000 Unicode3.1
𥫣 0xF75D U+25AE3 F0A5ABA3 4 𥫣 𥫣 cjk 2000 Unicode3.1
𥫱 0xF75F U+25AF1 F0A5ABB1 4 𥫱 𥫱 cjk 2000 Unicode3.1
𥮲 0xF771 U+25BB2 F0A5AEB2 4 𥮲 𥮲 cjk 2000 Unicode3.1
𥱋 0xF77C U+25C4B F0A5B18B 4 𥱋 𥱋 cjk 2000 Unicode3.1
𥱤 0xF77D U+25C64 F0A5B1A4 4 𥱤 𥱤 cjk 2000 Unicode3.1
𥸮 0xF793 U+25E2E F0A5B8AE 4 𥸮 𥸮 cjk 2000 Unicode3.1
𥹖 0xF794 U+25E56 F0A5B996 4 𥹖 𥹖 cjk 2000 Unicode3.1
𥹥 0xF795 U+25E65 F0A5B9A5 4 𥹥 𥹥 cjk 2000 Unicode3.1
𥹢 0xF797 U+25E62 F0A5B9A2 4 𥹢 𥹢 cjk 2000 Unicode3.1
𥻘 0xF79B U+25ED8 F0A5BB98 4 𥻘 𥻘 cjk 2000 Unicode3.1
𥻂 0xF79D U+25EC2 F0A5BB82 4 𥻂 𥻂 cjk 2000 Unicode3.1
𥻨 0xF7A0 U+25EE8 F0A5BBA8 4 𥻨 𥻨 cjk 2000 Unicode3.1
𥼣 0xF7A2 U+25F23 F0A5BCA3 4 𥼣 𥼣 cjk 2000 Unicode3.1
𥽜 0xF7A5 U+25F5C F0A5BD9C 4 𥽜 𥽜 cjk 2000 Unicode3.1
𥿠 0xF7AC U+25FE0 F0A5BFA0 4 𥿠 𥿠 cjk 2000 Unicode3.1
𥿔 0xF7AD U+25FD4 F0A5BF94 4 𥿔 𥿔 cjk 2000 Unicode3.1
𦀌 0xF7B2 U+2600C F0A6808C 4 𦀌 𦀌 cjk 2000 Unicode3.1
𥿻 0xF7B3 U+25FFB F0A5BFBB 4 𥿻 𥿻 cjk 2000 Unicode3.1
𦀗 0xF7BB U+26017 F0A68097 4 𦀗 𦀗 cjk 2000 Unicode3.1
𦁠 0xF7C0 U+26060 F0A681A0 4 𦁠 𦁠 cjk 2000 Unicode3.1
𦃭 0xF7CD U+260ED F0A683AD 4 𦃭 𦃭 cjk 2000 Unicode3.1
𦉰 0xF7E7 U+26270 F0A689B0 4 𦉰 𦉰 cjk 2000 Unicode3.1
𦊆 0xF7E9 U+26286 F0A68A86 4 𦊆 𦊆 cjk 2000 Unicode3.1
𦍌 0xF7F0 U+2634C F0A68D8C 4 𦍌 𦍌 cjk 2000 Unicode3.1
𣴎 0xF7F3 U+23D0E F0A3B48E 4 𣴎 𣴎 cjk 2000 Unicode3.1
𦐂 0xF7F7 U+26402 F0A69082 4 𦐂 𦐂 cjk 2000 Unicode3.1
𦙾 0xF854 U+2667E F0A699BE 4 𦙾 𦙾 cjk 2000 Unicode3.1
𦚰 0xF859 U+266B0 F0A69AB0 4 𦚰 𦚰 cjk 2000 Unicode3.1
𦜝 0xF865 U+2671D F0A69C9D 4 𦜝 𦜝 cjk 2000 Unicode3.1
𦣝 0xF875 U+268DD F0A6A39D 4 𦣝 𦣝 cjk 2000 Unicode3.1
𦣪 0xF877 U+268EA F0A6A3AA 4 𦣪 𦣪 cjk 2000 Unicode3.1
𦥑 0xF879 U+26951 F0A6A591 4 𦥑 𦥑 cjk 2000 Unicode3.1
𦥯 0xF87C U+2696F F0A6A5AF 4 𦥯 𦥯 cjk 2000 Unicode3.1
𦧝 0xF87E U+269DD F0A6A79D 4 𦧝 𦧝 cjk 2000 Unicode3.1
𦨞 0xF883 U+26A1E F0A6A89E 4 𦨞 𦨞 cjk 2000 Unicode3.1
𦩘 0xF88A U+26A58 F0A6A998 4 𦩘 𦩘 cjk 2000 Unicode3.1
𦪌 0xF890 U+26A8C F0A6AA8C 4 𦪌 𦪌 cjk 2000 Unicode3.1
𦪷 0xF893 U+26AB7 F0A6AAB7 4 𦪷 𦪷 cjk 2000 Unicode3.1
𦱳 0xF8C2 U+26C73 F0A6B1B3 4 𦱳 𦱳 cjk 2000 Unicode3.1
𦳝 0xF8CC U+26CDD F0A6B39D 4 𦳝 𦳝 cjk 2000 Unicode3.1
𦹥 0xF8DB U+26E65 F0A6B9A5 4 𦹥 𦹥 cjk 2000 Unicode3.1
𦾔 0xF8F3 U+26F94 F0A6BE94 4 𦾔 𦾔 cjk 2000 Unicode3.1
𦿸 0xF8FC U+26FF8 F0A6BFB8 4 𦿸 𦿸 cjk 2000 Unicode3.1
𦿶 0xF940 U+26FF6 F0A6BFB6 4 𦿶 𦿶 cjk 2000 Unicode3.1
𦿷 0xF941 U+26FF7 F0A6BFB7 4 𦿷 𦿷 cjk 2000 Unicode3.1
𧄍 0xF952 U+2710D F0A7848D 4 𧄍 𧄍 cjk 2000 Unicode3.1
𧄹 0xF955 U+27139 F0A784B9 4 𧄹 𧄹 cjk 2000 Unicode3.1
𧏛 0xF984 U+273DB F0A78F9B 4 𧏛 𧏛 cjk 2000 Unicode3.1
𧏚 0xF985 U+273DA F0A78F9A 4 𧏚 𧏚 cjk 2000 Unicode3.1
𧏾 0xF98B U+273FE F0A78FBE 4 𧏾 𧏾 cjk 2000 Unicode3.1
𧐐 0xF98E U+27410 F0A79090 4 𧐐 𧐐 cjk 2000 Unicode3.1
𧑉 0xF993 U+27449 F0A79189 4 𧑉 𧑉 cjk 2000 Unicode3.1
𧘕 0xF9A7 U+27615 F0A79895 4 𧘕 𧘕 cjk 2000 Unicode3.1
𧘔 0xF9A8 U+27614 F0A79894 4 𧘔 𧘔 cjk 2000 Unicode3.1
𧘱 0xF9AA U+27631 F0A798B1 4 𧘱 𧘱 cjk 2000 Unicode3.1
𧚓 0xF9B2 U+27693 F0A79A93 4 𧚓 𧚓 cjk 2000 Unicode3.1
𧜎 0xF9BA U+2770E F0A79C8E 4 𧜎 𧜎 cjk 2000 Unicode3.1
𧜣 0xF9BC U+27723 F0A79CA3 4 𧜣 𧜣 cjk 2000 Unicode3.1
𧝒 0xF9C0 U+27752 F0A79D92 4 𧝒 𧝒 cjk 2000 Unicode3.1
𧦅 0xF9D4 U+27985 F0A7A685 4 𧦅 𧦅 cjk 2000 Unicode3.1
𧪄 0xF9E1 U+27A84 F0A7AA84 4 𧪄 𧪄 cjk 2000 Unicode3.1
𧮳 0xF9F5 U+27BB3 F0A7AEB3 4 𧮳 𧮳 cjk 2000 Unicode3.1
𧮾 0xF9F7 U+27BBE F0A7AEBE 4 𧮾 𧮾 cjk 2000 Unicode3.1
𧯇 0xF9F8 U+27BC7 F0A7AF87 4 𧯇 𧯇 cjk 2000 Unicode3.1
𧲸 0xFA44 U+27CB8 F0A7B2B8 4 𧲸 𧲸 cjk 2000 Unicode3.1
𧶠 0xFA4E U+27DA0 F0A7B6A0 4 𧶠 𧶠 cjk 2000 Unicode3.1
𧸐 0xFA51 U+27E10 F0A7B890 4 𧸐 𧸐 cjk 2000 Unicode3.1
𧾷 0xFA58 U+27FB7 F0A7BEB7 4 𧾷 𧾷 cjk 2000 Unicode3.1
𨂊 0xFA61 U+2808A F0A8828A 4 𨂊 𨂊 cjk 2000 Unicode3.1
𨂻 0xFA67 U+280BB F0A882BB 4 𨂻 𨂻 cjk 2000 Unicode3.1
𨊂 0xFA78 U+28282 F0A88A82 4 𨊂 𨊂 cjk 2000 Unicode3.1
𨋳 0xFA7D U+282F3 F0A88BB3 4 𨋳 𨋳 cjk 2000 Unicode3.1
𨐌 0xFA86 U+2840C F0A8908C 4 𨐌 𨐌 cjk 2000 Unicode3.1
𨑕 0xFA8B U+28455 F0A89195 4 𨑕 𨑕 cjk 2000 Unicode3.1
𨕫 0xFA9A U+2856B F0A895AB 4 𨕫 𨕫 cjk 2000 Unicode3.1
𨗈 0xFA9E U+285C8 F0A89788 4 𨗈 𨗈 cjk 2000 Unicode3.1
𨗉 0xFA9F U+285C9 F0A89789 4 𨗉 𨗉 cjk 2000 Unicode3.1
𨛗 0xFAAA U+286D7 F0A89B97 4 𨛗 𨛗 cjk 2000 Unicode3.1
𨛺 0xFAAD U+286FA F0A89BBA 4 𨛺 𨛺 cjk 2000 Unicode3.1
𨥉 0xFACD U+28949 F0A8A589 4 𨥉 𨥉 cjk 2000 Unicode3.1
𨥆 0xFACE U+28946 F0A8A586 4 𨥆 𨥆 cjk 2000 Unicode3.1
𨥫 0xFAD5 U+2896B F0A8A5AB 4 𨥫 𨥫 cjk 2000 Unicode3.1
𨦇 0xFAE3 U+28987 F0A8A687 4 𨦇 𨦇 cjk 2000 Unicode3.1
𨦈 0xFAE4 U+28988 F0A8A688 4 𨦈 𨦈 cjk 2000 Unicode3.1
𨦺 0xFAEF U+289BA F0A8A6BA 4 𨦺 𨦺 cjk 2000 Unicode3.1
𨦻 0xFAF0 U+289BB F0A8A6BB 4 𨦻 𨦻 cjk 2000 Unicode3.1
𨨞 0xFAFC U+28A1E F0A8A89E 4 𨨞 𨨞 cjk 2000 Unicode3.1
𨨩 0xFB40 U+28A29 F0A8A8A9 4 𨨩 𨨩 cjk 2000 Unicode3.1
𨩱 0xFB4B U+28A71 F0A8A9B1 4 𨩱 𨩱 cjk 2000 Unicode3.1
𨩃 0xFB4C U+28A43 F0A8A983 4 𨩃 𨩃 cjk 2000 Unicode3.1
𨪙 0xFB55 U+28A99 F0A8AA99 4 𨪙 𨪙 cjk 2000 Unicode3.1
𨫍 0xFB56 U+28ACD F0A8AB8D 4 𨫍 𨫍 cjk 2000 Unicode3.1
𨫤 0xFB5C U+28AE4 F0A8ABA4 4 𨫤 𨫤 cjk 2000 Unicode3.1
𨫝 0xFB5D U+28ADD F0A8AB9D 4 𨫝 𨫝 cjk 2000 Unicode3.1
𨯁 0xFB6D U+28BC1 F0A8AF81 4 𨯁 𨯁 cjk 2000 Unicode3.1
𨯯 0xFB6E U+28BEF F0A8AFAF 4 𨯯 𨯯 cjk 2000 Unicode3.1
𨴐 0xFB76 U+28D10 F0A8B490 4 𨴐 𨴐 cjk 2000 Unicode3.1
𨵱 0xFB79 U+28D71 F0A8B5B1 4 𨵱 𨵱 cjk 2000 Unicode3.1
𨷻 0xFB7B U+28DFB F0A8B7BB 4 𨷻 𨷻 cjk 2000 Unicode3.1
𨸟 0xFB7C U+28E1F F0A8B89F 4 𨸟 𨸟 cjk 2000 Unicode3.1
𨸶 0xFB81 U+28E36 F0A8B8B6 4 𨸶 𨸶 cjk 2000 Unicode3.1
𨺉 0xFB85 U+28E89 F0A8BA89 4 𨺉 𨺉 cjk 2000 Unicode3.1
𨻫 0xFB87 U+28EEB F0A8BBAB 4 𨻫 𨻫 cjk 2000 Unicode3.1
𨼲 0xFB89 U+28F32 F0A8BCB2 4 𨼲 𨼲 cjk 2000 Unicode3.1
𨿸 0xFB91 U+28FF8 F0A8BFB8 4 𨿸 𨿸 cjk 2000 Unicode3.1
𩊠 0xFBA0 U+292A0 F0A98AA0 4 𩊠 𩊠 cjk 2000 Unicode3.1
𩊱 0xFBA1 U+292B1 F0A98AB1 4 𩊱 𩊱 cjk 2000 Unicode3.1
𩒐 0xFBB6 U+29490 F0A99290 4 𩒐 𩒐 cjk 2000 Unicode3.1
𩗏 0xFBC0 U+295CF F0A9978F 4 𩗏 𩗏 cjk 2000 Unicode3.1
𩙿 0xFBCA U+2967F F0A999BF 4 𩙿 𩙿 cjk 2000 Unicode3.1
𩛰 0xFBD4 U+296F0 F0A99BB0 4 𩛰 𩛰 cjk 2000 Unicode3.1
𩜙 0xFBD7 U+29719 F0A99C99 4 𩜙 𩜙 cjk 2000 Unicode3.1
𩝐 0xFBDB U+29750 F0A99D90 4 𩝐 𩝐 cjk 2000 Unicode3.1
𩣆 0xFBF4 U+298C6 F0A9A386 4 𩣆 𩣆 cjk 2000 Unicode3.1
𩩲 0xFC4B U+29A72 F0A9A9B2 4 𩩲 𩩲 cjk 2000 Unicode3.1
𩷛 0xFC6A U+29DDB F0A9B79B 4 𩷛 𩷛 cjk 2000 Unicode3.1
𩸽 0xFC6B U+29E3D F0A9B8BD 4 𩸽 𩸽 cjk 2000 Unicode3.1
𩸕 0xFC78 U+29E15 F0A9B895 4 𩸕 𩸕 cjk 2000 Unicode3.1
𩺊 0xFC7A U+29E8A F0A9BA8A 4 𩺊 𩺊 cjk 2000 Unicode3.1
𩹉 0xFC7C U+29E49 F0A9B989 4 𩹉 𩹉 cjk 2000 Unicode3.1
𩻄 0xFC87 U+29EC4 F0A9BB84 4 𩻄 𩻄 cjk 2000 Unicode3.1
𩻩 0xFC8D U+29EE9 F0A9BBA9 4 𩻩 𩻩 cjk 2000 Unicode3.1
𩻛 0xFC90 U+29EDB F0A9BB9B 4 𩻛 𩻛 cjk 2000 Unicode3.1
𩿎 0xFCA3 U+29FCE F0A9BF8E 4 𩿎 𩿎 cjk 2000 Unicode3.1
𪀯 0xFCA7 U+2A02F F0AA80AF 4 𪀯 𪀯 cjk 2000 Unicode3.1
𪀚 0xFCA9 U+2A01A F0AA809A 4 𪀚 𪀚 cjk 2000 Unicode3.1
𪃹 0xFCB0 U+2A0F9 F0AA83B9 4 𪃹 𪃹 cjk 2000 Unicode3.1
𪂂 0xFCB3 U+2A082 F0AA8282 4 𪂂 𪂂 cjk 2000 Unicode3.1
𢈘 0xFCD1 U+22218 F0A28898 4 𢈘 𢈘 cjk 2000 Unicode3.1
𪎌 0xFCD6 U+2A38C F0AA8E8C 4 𪎌 𪎌 cjk 2000 Unicode3.1
𪐷 0xFCD8 U+2A437 F0AA90B7 4 𪐷 𪐷 cjk 2000 Unicode3.1
𪗱 0xFCEC U+2A5F1 F0AA97B1 4 𪗱 𪗱 cjk 2000 Unicode3.1
𪘂 0xFCEE U+2A602 F0AA9882 4 𪘂 𪘂 cjk 2000 Unicode3.1
𪘚 0xFCF0 U+2A61A F0AA989A 4 𪘚 𪘚 cjk 2000 Unicode3.1
𪚲 0xFCF4 U+2A6B2 F0AA9AB2 4 𪚲 𪚲 cjk 2000 Unicode3.1

Shift_JIS-2004(JIS X 0213:2004)で4バイトのUTF-8 文字のみ

𠀋 𡈽 𡌛 𡑮 𡢽 𠮟 𡚴 𡸴 𣇄 𣗄 𣜿 𣝣 𣳾 𤟱 𥒎 𥔎 𥝱 𥧄 𥶡 𦫿 𦹀 𧃴 𧚄 𨉷 𨏍 𪆐 𠂉 𠂢 𠂤 𠆢 𠈓 𠌫 𠎁 𠍱 𠏹 𠑊 𠔉 𠗖 𠘨 𠝏 𠠇 𠠺 𠢹 𠥼 𠦝 𠫓 𠬝 𠵅 𠷡 𠺕 𠹭 𠹤 𠽟 𡈁 𡉕 𡉻 𡉴 𡋤 𡋗 𡋽 𡌶 𡍄 𡏄 𡑭 𡗗 𦰩 𡙇 𡜆 𡝂 𡧃 𡱖 𡴭 𡵅 𡵸 𡵢 𡶡 𡶜 𡶒 𡶷 𡷠 𡸳 𡼞 𡽶 𡿺 𢅻 𢌞 𢎭 𢛳 𢡛 𢢫 𢦏 𢪸 𢭏 𢭐 𢭆 𢰝 𢮦 𢰤 𢷡 𣇃 𣇵 𣆶 𣍲 𣏓 𣏒 𣏐 𣏤 𣏕 𣏚 𣏟 𣑊 𣑑 𣑋 𣑥 𣓤 𣕚 𣖔 𣘹 𣙇 𣘸 𣘺 𣜜 𣜌 𣝤 𣟿 𣟧 𣠤 𣠽 𣪘 𣱿 𣴀 𣵀 𣷺 𣷹 𣷓 𣽾 𤂖 𤄃 𤇆 𤇾 𤎼 𤘩 𤚥 𤢖 𤩍 𤭖 𤭯 𤰖 𤴔 𤸎 𤸷 𤹪 𤺋 𥁊 𥁕 𥄢 𥆩 𥇥 𥇍 𥈞 𥉌 𥐮 𥓙 𥖧 𥞩 𥞴 𥧔 𥫤 𥫣 𥫱 𥮲 𥱋 𥱤 𥸮 𥹖 𥹥 𥹢 𥻘 𥻂 𥻨 𥼣 𥽜 𥿠 𥿔 𦀌 𥿻 𦀗 𦁠 𦃭 𦉰 𦊆 𦍌 𣴎 𦐂 𦙾 𦚰 𦜝 𦣝 𦣪 𦥑 𦥯 𦧝 𦨞 𦩘 𦪌 𦪷 𦱳 𦳝 𦹥 𦾔 𦿸 𦿶 𦿷 𧄍 𧄹 𧏛 𧏚 𧏾 𧐐 𧑉 𧘕 𧘔 𧘱 𧚓 𧜎 𧜣 𧝒 𧦅 𧪄 𧮳 𧮾 𧯇 𧲸 𧶠 𧸐 𧾷 𨂊 𨂻 𨊂 𨋳 𨐌 𨑕 𨕫 𨗈 𨗉 𨛗 𨛺 𨥉 𨥆 𨥫 𨦇 𨦈 𨦺 𨦻 𨨞 𨨩 𨩱 𨩃 𨪙 𨫍 𨫤 𨫝 𨯁 𨯯 𨴐 𨵱 𨷻 𨸟 𨸶 𨺉 𨻫 𨼲 𨿸 𩊠 𩊱 𩒐 𩗏 𩙿 𩛰 𩜙 𩝐 𩣆 𩩲 𩷛 𩸽 𩸕 𩺊 𩹉 𩻄 𩻩 𩻛 𩿎 𪀯 𪀚 𪃹 𪂂 𢈘 𪎌 𪐷 𪗱 𪘂 𪘚 𪚲

Shift_JIS-2004(JIS X 0213:2004)で4バイトのUTF-8 数値文字参照(10進)

𠀋𡈽𡌛𡑮𡢽𠮟𡚴𡸴𣇄𣗄𣜿𣝣𣳾𤟱𥒎𥔎𥝱𥧄𥶡𦫿𦹀𧃴𧚄𨉷𨏍𪆐𠂉𠂢𠂤𠆢𠈓𠌫𠎁𠍱𠏹𠑊𠔉𠗖𠘨𠝏𠠇𠠺𠢹𠥼𠦝𠫓𠬝𠵅𠷡𠺕𠹭𠹤𠽟𡈁𡉕𡉻𡉴𡋤𡋗𡋽𡌶𡍄𡏄𡑭𡗗𦰩𡙇𡜆𡝂𡧃𡱖𡴭𡵅𡵸𡵢𡶡𡶜𡶒𡶷𡷠𡸳𡼞𡽶𡿺𢅻𢌞𢎭𢛳𢡛𢢫𢦏𢪸𢭏𢭐𢭆𢰝𢮦𢰤𢷡𣇃𣇵𣆶𣍲𣏓𣏒𣏐𣏤𣏕𣏚𣏟𣑊𣑑𣑋𣑥𣓤𣕚𣖔𣘹𣙇𣘸𣘺𣜜𣜌𣝤𣟿𣟧𣠤𣠽𣪘𣱿𣴀𣵀𣷺𣷹𣷓𣽾𤂖𤄃𤇆𤇾𤎼𤘩𤚥𤢖𤩍𤭖𤭯𤰖𤴔𤸎𤸷𤹪𤺋𥁊𥁕𥄢𥆩𥇥𥇍𥈞𥉌𥐮𥓙𥖧𥞩𥞴𥧔𥫤𥫣𥫱𥮲𥱋𥱤𥸮𥹖𥹥𥹢𥻘𥻂𥻨𥼣𥽜𥿠𥿔𦀌𥿻𦀗𦁠𦃭𦉰𦊆𦍌𣴎𦐂𦙾𦚰𦜝𦣝𦣪𦥑𦥯𦧝𦨞𦩘𦪌𦪷𦱳𦳝𦹥𦾔𦿸𦿶𦿷𧄍𧄹𧏛𧏚𧏾𧐐𧑉𧘕𧘔𧘱𧚓𧜎𧜣𧝒𧦅𧪄𧮳𧮾𧯇𧲸𧶠𧸐𧾷𨂊𨂻𨊂𨋳𨐌𨑕𨕫𨗈𨗉𨛗𨛺𨥉𨥆𨥫𨦇𨦈𨦺𨦻𨨞𨨩𨩱𨩃𨪙𨫍𨫤𨫝𨯁𨯯𨴐𨵱𨷻𨸟𨸶𨺉𨻫𨼲𨿸𩊠𩊱𩒐𩗏𩙿𩛰𩜙𩝐𩣆𩩲𩷛𩸽𩸕𩺊𩹉𩻄𩻩𩻛𩿎𪀯𪀚𪃹𪂂𢈘𪎌𪐷𪗱𪘂𪘚𪚲

やっとデータが揃ったので、MySQLでテストしてみよう。
※今後、絵文字なども調査してみたい。