术语提取项目需求分析

2019-03-12  本文已影响0人  小多媛媛

最近,需要抽提术语,已经从研发处获取若干路径下的资源文件,xaml格式,中英各一份(命名相同,文件夹不同)。现在需要把每个文件中的string抽提出来。

简化一下,不考虑有中英文件不对应或者同一个文件中行数错位的情况,准备通过如下步骤实现。

1. 遍历zh文件夹下所有的文件,新建Excel表,将A1赋值为zh。

术语提取项目需求分析

2.打开文件,找到每一行,用正则表达式读取到特定字符串。

术语提取项目需求分析

3.将某一个文件某一行的字符串赋予Ax,然后逐个文件遍历。完成下所有文件遍历和excel读写。

术语提取项目需求分析

4.遍历en文件夹下所有文件,将Excel的B1赋值为en。重复2,3。将读取到的每一行赋予Bx,直至遍历完成。

目前可能遇到的问题

1.Python是否支持xaml格式读写?可以考虑遍历文件后将后缀强制修改成TXT,要验证下是否会有乱码。

术语提取项目需求分析

2.如何对同一个xaml的zh和en进行匹配,保证不错配?

3.如何对同一个key的zh和en的string进行匹配?保证不错行?

上一篇下一篇

猜你喜欢

热点阅读