中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么實現ut8數據庫過濾特殊字符

發布時間:2021-11-16 11:54:24 來源:億速云 閱讀:145 作者:iii 欄目:大數據

本篇內容介紹了“怎么實現ut8數據庫過濾特殊字符”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

ut8數據庫無法保存超多3個字節的utf字符,手寫了一個過濾器,可指定過濾最大字符長度

UTF-8編碼規則 1字節 0xxxxxxx 2字節 110xxxxx 10xxxxxx 3字節 1110xxxx 10xxxxxx 10xxxxxx 4字節 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 5字節 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 6字節 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

實現

public static String utf8M(String str, int m) {
        byte[] bytes = str.getBytes(KtIo.utf8());
        int len = bytes.length;
        int off = 0;
        byte[] buffer = null;
        byte b;
        int s;
        int j, k;
        int lst = len - 1;
        for (int i = 0; i < len; i++) {
            b = bytes[i];
            s = b & 0XFF;
            if (s < 192) {
                if (buffer != null) {
                    buffer[off++] = b;
                }

            } else {
                if (s < 224) {
                    j = 1;

                } else if (s < 240) {
                    j = 2;

                } else if (s < 248) {
                    j = 3;

                } else if (s < 252) {
                    j = 4;

                } else if (b < 254) {
                    j = 5;

                } else {
                    i += 6;
                    continue;
                }

                if (j < m) {
                    // 允許字符長度
                    j += i;
                    if (buffer != null) {
                        buffer[off++] = b;
                        k = j < lst ? j : lst;
                        for (i++; i <= k; i++) {
                            buffer[off++] = bytes[i];
                        }
                    }

                    i = j;

                } else {
                    // 過濾字符長度
                    if (buffer == null) {
                        buffer = bytes;
                        off = i;
                    }

                    i += j;
                }
            }
        }

        return buffer == null ? str : new String(buffer, 0, off, KtIo.charset());
    }

測試

public void test() throws IOException {
        System.out.println(KtStr.utf8M("sda\uD83D\uDC16????大啊\uD83D\uDC01\uD83D\uDC02\uD83D\uDC05\uD83D\uDC07\uD83D\uDC09\uD83D\uDC0D\uD83D\uDC0E\uD83D\uDC10\uD83D\uDC12\uD83D\uDC13\uD83D\uDC15\uD83D\uDC16子\uD83C\uDF40木\uD83C\uDF40青\uD83C\uDF40澄\uD83C\uDF40", 3));
    }

“怎么實現ut8數據庫過濾特殊字符”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

禄丰县| 五常市| 渭源县| 阿瓦提县| 丁青县| 泸州市| 潮州市| 四平市| 扎囊县| 湖州市| 云浮市| 托克逊县| 凤台县| 红原县| 东乌珠穆沁旗| 吴忠市| 本溪市| 长汀县| 连江县| 桂东县| 上饶县| 桦川县| 集贤县| 涿鹿县| 大厂| 普定县| 齐河县| 靖江市| 安吉县| 墨竹工卡县| 石门县| 政和县| 玉门市| 龙南县| 绥阳县| 禹州市| 孟村| 绥棱县| 修武县| 定日县| 道真|