iOS 中英文字符串的字数

2019-01-03  本文已影响7人  冰奇

       开发类似输入框输入或者显示固定文本的 label 时候,可能遇到需要限制显示的字符串字数

NSString *contentString = @"新年快乐";
NSUInteger contentLength = contentString.length;
NSLog(@"%lu", (unsigned long)contentLength);
//输出: 4

NSString *contentString2 = @"HappyNewYear";
NSUInteger contentLength2 = contentString2.length;
NSLog(@"%lu", (unsigned long)contentLength2);
// 输出:12

       然后当需要对限制输入的字数,如前四个

NSString *contentString22 = [contentString2 substringToIndex:4];

       会发现 contentString2 输出 “Happ”,到这里其实问题不大,可是产品会提出,英文应该是两个数一个,因此截出来的应该得是“HappyNew”。
问题就在于使用 @property (readonly) NSUInteger length; 获取到的是不论是中文字符还是英文字符,或者其他,都是一个个算。而在 Unicode 编码中:一个中文字符=2个Unicode,一个英文字符=1个Unicode。所以可以采用 Unicode 的个数来计算字符串长度,如下两种方法:

// 方法一、
NSUInteger contentLength = 0;
char* p = (char*)[contentString cStringUsingEncoding:NSUnicodeStringEncoding];
for (int i = 0; i < [contentString lengthOfBytesUsingEncoding:NSUnicodeStringEncoding]; i++) {
    if (*p) {
        p++;
        contentLength++;
    }
    else {
        p++;
    }
}
NSLog(@"%ld", contentLength);
// 方法二、
NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
NSData *data = [contentString dataUsingEncoding:enc];
NSUInteger contentLength2 = [data length];
NSLog(@"%ld", contentLength2);

       通过上面计算出来会多两倍的 length,然后通过向上取整

NSUInteger contentLength3 = ceilf(contentLength/2.0f);

       到这里还有个问题,当字符串里面有“一”时,使用方法一计算出来的 Unicode 个数是1,而“二、三、四”这些分别是2,也就是类似这种“一”需要特殊处理,如此。方法二测试正常。

NSUInteger count = [contentString countWithString:@"一"];
contentLength += count;

注意:这里只针对中英文字符串,即不包括这种 Emoji 这种是4个 Unicode,建议删除,或者扩展计算

       最后对于中英文的截断,按 Unicode 计算,即两个英文按一个字数计算,补足的向后不一个字数,也就是可能出现一个英文(或者说奇数个英文),即不足一个字数,下面的算法是不算在字数里面。

NSString *contentString = @"新年aaa快乐aaa";
NSString *finalContentString = contentString;
NSUInteger unicodeCount = 0;
NSUInteger unicodeLength = [contentString lengthOfBytesUsingEncoding:NSUnicodeStringEncoding];
NSUInteger maxLenght = 4 * 2;
if (unicodeLength > maxLenght) {
    NSUInteger subLength = 0;
    char* p = (char*)[contentString cStringUsingEncoding:NSUnicodeStringEncoding];
    p++;
    for (int i = 0; i < unicodeLength; i+=2) {
        if (*p) {
            subLength+=2;
            p+=2;
        }
        else {
            subLength++;
            p+=2;
        }
        unicodeCount++;
        if (subLength >= maxLenght) {
            break;
        }
    }
    finalContentString = [contentString substringToIndex:unicodeCount];
}
NSLog(@"%@", finalContentString);
上一篇下一篇

猜你喜欢

热点阅读