制作安卓PDF阅读器:三、实现文本选择

2020-11-11  本文已影响0人  天下第九九八十一

在安卓平台,PDFium 早已开源,第三方阅读器demo破数千赞,然而尽管相关的API已经包含在在SDK的头文件中,这么多年了文本选择基本处于零开发状态。

我为什么要开启这个系列,努力试着从源头开始,用 PDFium 制作一款阅读器?有人喜欢问这个做了有什么用,这个是唯一的吗?

当然不是唯一的,底层技术更不是我的。不过我认为在维护者的推动下,PDFium 越来越完善,功能越来越多,不真正拿来做些什么实在是可惜了。另一个重要原因则是,其他APP要么臃肿或者简陋,要么用着磕手、滑动卡顿、误触频发,而且大多还不免费。( 更正,近年来倒是多了好多免费的PDF阅读器 )

目标期望:

项目地址:https://github.com/KnIfER/PolymPic

一、处理超链接

热身运动:当检测到单击( GestureDetector )时,若点击处存在超链接,则打印出超链接的对象。

头文件:fpdf_doc.h

  1. 获取点击处的超链接
JNI_FUNC(jlong, PdfiumCore, nativeGetLinkAtCoord)(JNI_ARGS, jlong pagePtr, jdouble width, jdouble height, jdouble posX, jdouble posY){
    double px, py;
    FPDF_DeviceToPage((FPDF_PAGE)pagePtr, 0, 0, width, height, 0, posX, posY, &px, &py);
    return (jlong)FPDFLink_GetLinkAtPoint((FPDF_PAGE)pagePtr, px, py);
}

需要将屏幕坐标转换为页面坐标,然后再次在native层转换为所谓的user space、page space。别问我那是啥我也不知道。不过在论坛提问后,有人替我指出了相关文档所在,有时间去看看!

"User space" is defined in section 8.3.2.3 of the PDF 32000-1:2008 specification.

屏幕坐标:[event.getX(), event.getY()]
页面坐标:先前提过将整本PDF当作一张超级大图,subsampling-scale-imageview 有一系列的 viewToSource 坐标转换方法。屏幕转换得到 source 坐标后,减去点击页面的左上角坐标,就是页面坐标。

原始页面坐标需用 FPDF_DeviceToPage 再次转换,才能传给FPDFLink_GetLinkAtPoint,获取坐标处的链接指针。

  1. 链接指针不为空时,可以提取超链接对象。
JNI_FUNC(jstring, PdfiumCore, nativeGetLinkTarget)(JNI_ARGS, jlong docPtr, jlong linkPtr){
    DocumentFile *doc = reinterpret_cast<DocumentFile*>(docPtr);
    FPDF_LINK link = reinterpret_cast<FPDF_LINK>(linkPtr);
    FPDF_DEST dest = FPDFLink_GetDest(doc->pdfDocument, link);
    if (dest != NULL) {
        int pageIdx = FPDFDest_GetDestPageIndex(doc->pdfDocument, dest);
        char buffer[16]={0};
        buffer[0]='@';
        sprintf(buffer+1,"%d",pageIdx);
        return env->NewStringUTF(buffer);
    }
    FPDF_ACTION action = FPDFLink_GetAction(link);
    if (action == NULL) {
        return NULL;
    }
    size_t bufferLen = FPDFAction_GetURIPath(doc->pdfDocument, action, NULL, 0);
    if (bufferLen <= 0) {
        return NULL;
    }
    std::string uri;
    FPDFAction_GetURIPath(doc->pdfDocument, action, WriteInto(&uri, bufferLen), bufferLen);
    return env->NewStringUTF(uri.c_str());
}

超链接对象统一返回字符串,可以是Uri地址,也可以是页码@页码

二、在单击处获取一个单词

热身运动2:在单击处获取一个英文单词或者汉语词组,需要用到安卓的 BreakIterator。

头文件:fpdf_text.h

首先实现 nativeGetCharIndexAtCoord 方法,获取单击附近的文字索引,需进行同样的坐标转换。

JNI_FUNC(jint, PdfiumCore, nativeGetCharIndexAtCoord)(JNI_ARGS, jlong pagePtr, jdouble width, jdouble height, jlong textPtr, jdouble posX, jdouble posY, jdouble tolX, jdouble tolY){
    double px, py;
    FPDF_DeviceToPage((FPDF_PAGE)pagePtr, 0, 0, width, height, 0, posX, posY, &px, &py);
    return FPDFText_GetCharIndexAtPos((FPDF_TEXTPAGE)textPtr, px, py, tolX, tolY);
}

若返回的文字index大于等于零,则此 index 指向该页面全部文本当中的一个字符。全部文本用 FPDFText_GetText 获取(实现 nativeGetText):

JNI_FUNC(jstring, PdfiumCore, nativeGetText)(JNI_ARGS, jlong textPtr) {
    int len = FPDFText_CountChars((FPDF_TEXTPAGE)textPtr);
    //unsigned short* buffer = malloc(len*sizeof(unsigned short));
    unsigned short* buffer = new unsigned short[len+1];
    FPDFText_GetText((FPDF_TEXTPAGE)textPtr, 0, len, buffer);
    jstring ret = env->NewString(buffer, len);
    delete []buffer;
    return ret;
}

接下来就可以用 BreakIterator 分词了:

...   @@@ public void prepareText()

    allText = pdfiumCore.nativeGetText(tid);
    if(pageBreakIterator==null) {
        pageBreakIterator = new BreakIteratorHelper();
    }
    pageBreakIterator.setText(allText);

...   @@@ public String getWordAtPos(float posX, float posY)

    int charIdx = pdfiumCore.nativeGetCharIndexAtCoord(pid.get(), size.getWidth(), size.getHeight(), tid
            , posX, posY, 10.0, 10.0);
    String ret=null;
    
    if(charIdx>=0) {
        int ed=pageBreakIterator.following(charIdx);
        int st=pageBreakIterator.previous();
        获得的单词就是 allText.substring(st, ed)
    }
...

三、实现文本选择

1. 绘制选框

与绘制PDF本身差不多,不过 bitmap 换成 rect 而已。用到的API依次是FPDFText_CountRects、FPDFText_GetRect。

直接将选框覆盖绘制在前。若要绘制在后面的背景上,就需要三层透明视图了,那么加载铺块和缩略图的时候就要用透明色清空 bitmap,页面的白色背景等也需要另外绘制(Google PDF Viewer应该就是这样,还给背景加了阴影)。这些较为复杂,到时候再说。

有个问题可能需要解决:同一行的选框,部分没有合并。

都是小事儿,暂时不在这上面花时间。

2. 绘制控点

之前做过类似的事情,将普通 TextView 自带的文本选择功能禁用了,然后用API自己做出一个来,包括单击选词,长按托选,放大镜等等。所以相关的内容还是熟悉的。

绘制 Selection Handle 可以用 AppCompat 支持库中的图标资源:

        handleLeft=getResources().getDrawable(R.drawable.abc_text_select_handle_left_mtrl_dark);
        handleRight=getResources().getDrawable(R.drawable.abc_text_select_handle_right_mtrl_dark);

控点的触控操作也很简单,在 Action_Down 中检测落点是否在其中一个 handle 内。若是,则在 Action_Move 中一边移动该 handle,一边检测新的字符索引,作为文本选择的新边界。

由于PDF的复杂性,页面上的字符索引可能间杂排列,比如头一段开头是100,下一段开头50,再下一段150。这就造成先前简单的选择系统“失效”了:

没什么解决方案,API 就这么点。而且,静读天下、Google PDF 查看器都是这样的,唯有 ezpdfreader 没有这个问题。

上一篇 下一篇

猜你喜欢

热点阅读