个人永久性免费-Excel催化剂功能第25波-小白适用的文本处理
翻看各大插件,都不约而同地出现系列文本处理的功能,自己在使用Excel过程中,在临时性的需求时,也会用上这几种文本处理,但仅适用于小范围的使用,使用这些功能不是数据处理的正确的之道,数据处理的核心需求是:不破坏原有数据的情况下,通过逻辑关系处理,生成符合分析需要的目标数据。文本处理系列功能将有违此原则。。另外提供高阶用户的文本处理最爱的正则表达式处理方法,相信此系列功能将老少咸宜,各取所需。
文章出处说明
原文在简书上发表,再同步到Excel催化剂微信公众号或其他平台上,文章后续有修改和更新将在简书上操作, 其他平台不作同步修改更新,因此建议阅读其他出处的文章时,尽可能跳转回简书平台上查看。
此篇提及的功能,其实有违数据处理的原则,尽可能地少范围使用,可能性能也有瓶颈。Excel催化剂的系列功能没有相应的撤销功能,没有后悔药可吃,使用前请记得对文档进行保存。
文本处理功能总览
文本处理的几大快捷操作,小白适用
转换组
文本转数值、数值转文本,不详细解释了,有Excel数据结构基础的都好理解。
因Excel本质是3大类型数据结构:文本、数值、和其他错误、逻辑值等。其中特殊点在于数字可以表示为数值和文本还种,文本型数字不能进行计算汇总,需转换为数值,而身份证类的数字,最好保存为文本,防止15位数据有效性原因丢失数据精度。
显示转文本
有时对数值进行了数字格式的设置,使原本的数字在显示层面表现不同,若想重新存储显示层面的数据,可用显示转文本实现。
数字格式影响数据显示
用显示转文本后的效果
插入组
前面插入、后面插入也好理解,不细说。
中间插入
特意做了个示例效果,花了不少功夫,如果不记得可查看示例效果的展示,为了小白们,我也是拼了!
同时有从右边数起第几位,算是个小特色。
插入后效果
清除和正则提取清除等
文本清除
有按内容类型清除和文本位置清除两种,同样花大力气做了动态示例演示清除的效果。
快速清除,针对特定类型的文本进行清除
清除中文后效果
一般建议用一下清除【非可见字符】就差不多,其他的数据,建议用自定义函数来提取出来或清除,Excel催化剂有一整套非常好用的正则自定义函数,值得你投入时间学习正则的知识。
另外的位置清除,杀伤力较小,也较可控,对规则数据清除效果也不错。
按位置清除,同样可分从左还是从右数起快速清除和位置清除是互斥关系,一次仅能处理其中一类。具体看示例中演示的作用效果。
正则匹配与替换
在字符串处理的世界中,没有比正则表达式处理更合适的了,若想从各种奇葩的文本字符串中找寻想要的信息,最好还是静下心来,学习掌握下正则表达式.
Excel催化剂已经把它实现在自定义函数和界面操作上,学习完知识,就算没有编程技术一样可以使用起来,投资回报率极高。
左侧正则表达式匹配Pattern记录表
方便对曾经使用过,或收集回来有复用价值的Pattern匹配字符进行记录,方便再次调出使用。可以写上自己理解的标识描述文本。填写完内容按回车即可保存。
若需调用,双击Pattern内容的对应的行单元格位置,即可自动把内容存到右则的【正则Pattern参数】区。
正则表达式Options设置
此处的Options,用于辅助Pattern内容的设置,如提取英文时,是否忽略大小写,如果勾上,就可以在[a-z]这样的表达式上,无论大小写都进行匹配,具体可百度学习下细节。
匹配区域选择
因文本处理为破坏性操作,正则也很难一次性保证书写正确,可先用【匹配区域选择】,查看下写的Pattern和Options配置,是否和预期想要匹配的相符,对应到相关的单元格上被选择出来。
保留匹配字符
此处为正则匹配到的内容,重写到单元格内覆盖原内容,并且匹配只会对首次匹配到的内容进行重写,例如:
内容为:中国人真是牛B,能在中国活着就是牛。匹配Pattern为:[\u4e00-\u9fa5]+
只会匹配到【中国人真是牛】,被B隔开的第2组【能在中国活着就是牛】不匹配。
最终重写到单元格中也只有【中国人真是牛】,想更灵活地匹配,建议使用Excel催化剂的正则自定义函数实现。
替换匹配字符
此处为把匹配到的文本,替换为【正则替换参数】,若留空将进行删除操作,替换为空字符就是删除了原匹配到的内容。
替换功能会把所有匹配到的内容组都进行替换,和上面保留匹配字符的仅取首次匹配到的内容不同。如上例中,匹配中文,替换为空,将只剩下【B】字。
正则查询
右侧任务窗格展示保存过的Pattern字符此为快捷操作调出任务窗格显示Pattern字符串列表,可用于自定义函数编写时调用。
只需鼠标双击Pattern内容列的对应行位置,即可把内容保存到剪切板内,写正则自定义函数时可粘贴出来使用。
鼠标左键双击箭头位置即可复制
系列文章
一文带你全面认识Excel催化剂系列功能
安装过程详解及安装失败解决方法
第1波-工作表导航
第2波-数字格式设置
第3波-与PowerbiDesktop互通互联
第4波-一大波自定义函数高级应用,重新定义Excel函数的学习和使用方法
第5波-使用DAX查询从PowerbiDeskTop中获取数据源
第6波-导出PowerbiDesktop模型数据字典
第7波-智能选区功能
第8波-快速可视化数据
第9波-数据透视表自动设置
第10波-快速排列工作表图形对象
第11波-快速批量插入图片
第12波-快速生成、读取、导出条形码二维码
第13波-一键生成自由报表
第14波-一键生成零售购物篮分析
第15波-接入AI人工智能NLP自然语言处理
第16波-N多使用场景的多维表转一维表
第17波-批量文件改名、下载、文件夹创建等
第18波-在Excel上也能玩上词云图
第19波-Excel与Sqlserver零门槛交互-查询篇
第20波-Excel与Sqlserver零门槛交互-数据上传篇
第21波-Excel与Sqlserver零门槛交互-执行SQL
第22波-Excel文件类型、密码批量修改,补齐Power短板
第23波-非同一般地批量拆分工作表
第24波-批量发送邮件并指点不同附件不同变量
关于Excel催化剂
Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!
Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!
Excel催化剂插件下载链接:https://pan.baidu.com/s/1gC6joqGY_SIg_yONga9PaQ
因插件使用VSTO开发技术完成,插件的安装需要电脑满足相关的环境配置才能运行,且需可连接外网的方式实现自动更新机制,若下载安装过程中有任何疑问或需要离线版安装等,尽量不单独私聊询问,加QQ群可高效解决(群内已汇集了VSTO开发、Powerbi技术、Sqlserver商业智能等方面的国内顶尖大牛人物,进群的好处不用多说了)
联系作者.png
公众号.png
取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。
最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!
关于Excel催化剂作者
姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。
服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)
技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。
历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。
擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。
2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。
和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。)