iOS字符串中去除\xed\xa0\xbc

2022-04-09  本文已影响0人  大大东

最近开业务迭代中,QA发现一个崩溃,在输入各种emoji表情后,点击发送会崩溃。
通过对crash日志分析,发现崩溃在堆栈如下图,在imSDK内部,最后一个函数是对字符串取长度,而一般此函数当字符串为null时会出现异常。

image.png
排查

经过多次代码确认,传递给imSDK一定是有效的字符串,可能是imSDK后续进行了编码,编码失败得到了null,而imSDK内部没有做相应容错,因此只能从上层排查问题并修复。

多次观察QA的操作录屏,发现崩溃前最后输入内容中有类似字母A的奇怪符号 image.png

在emoji表情并不能找到这个符号,正常也无法输入这个表情,怀疑是字数限制截取子串时,截断了一个表情的完整编码,但取消截断代码依然会出现。
再次观察操作录屏,发现一个奇怪的字符串选中现象如下图,第一个表情好像选中了, 又好像没选中...,而这个文字选中区域是双击屏幕时,系统自动选定的。

// 把下列内容粘贴到UITextView,双击“哦哦哦“这三个字的区域,系统就会选中最后一个表情的一半
// 经测试,在微信里也是会出现,但是不会崩溃,只是消息永远发送失败
😍🤬🤬🌫🤬🤬🤬🌫🌫🤬🌫🌫🤬哦哦哦
image.png

调试发现,上图这时点击粘贴替换部分文字,输入内容在控制台打印就多出了\xed\xa0\xbc 这几个奇怪的字符如下图,并且无法转换为UTF8编码。

image.png
解决

通过分析,应该是系统在选中字符时,选中了半个emoji,导致粘贴后,emoji编码变的不完整。
不完整的emoji在Unicode(utf16)时正常,但转码为utf8时会失败。
方案主要有两个,要么最后提交时剔除异常编码字符,要么在输入时就避免出现表情割裂,经测试下列两个方案均可解决问题。

  1. 修改选中范围,避免表情选中不完整(推荐)
// 当选中不完整时,自动修复选中区域
- (void)textViewDidChangeSelection:(UITextView *)textView {
    NSRange selRange = textView.selectedRange;
    
    if (selRange.length > 0) {
        NSInteger locationIdx = selRange.location;
        NSInteger endIdx = MAX(0, (selRange.location + selRange.length - 1));
        
        NSRange beginCharComposedRange = [textView.text rangeOfComposedCharacterSequenceAtIndex:locationIdx];
        NSInteger beginCharIndex = beginCharComposedRange.location;
        
        NSRange endCharComposedRange = [textView.text rangeOfComposedCharacterSequenceAtIndex:endIdx];
        NSInteger endCharIndex = MAX(0, (endCharComposedRange.location + endCharComposedRange.length - 1));
        
        BOOL needReset = NO;
        if (locationIdx != beginCharIndex) {
            locationIdx = beginCharIndex;
            needReset = YES;
        }
        if (endIdx != endCharIndex) {
            endIdx = endCharIndex;
            needReset = YES;
        }
        if (needReset && endIdx >= locationIdx) {
            textView.selectedRange = NSMakeRange(locationIdx, endIdx - locationIdx + 1);
        }
    }
}
  1. 输入完成后&提交前,剔除异常字符

- (NSString *)repairInputText:(NSString *)sendText {
    
    NSMutableString *newmstr = [NSMutableString stringWithCapacity:sendText.length];
    [sendText enumerateSubstringsInRange:NSMakeRange(0, sendText.length)
                                 options:NSStringEnumerationByComposedCharacterSequences
                              usingBlock:^(NSString * _Nullable substring, NSRange substringRange, NSRange enclosingRange, BOOL * _Nonnull stop) {
        
        NSString *utf8encode = [[NSString alloc] initWithData:[substring dataUsingEncoding:NSUTF8StringEncoding]
                                                     encoding:NSUTF8StringEncoding];
        if (utf8encode.length == 0) {
            NSLog(@"---=:char-> len: %d, %@", (int)substring.length, substring);
            NSLog(@"---=: 编码异常字符");
            return;
        }
        [newmstr appendString:substring];
    }];
    return newmstr;
}
上一篇下一篇

猜你喜欢

热点阅读