转录组专题

Excel在生物信息分析中的骚操作(4)——查重复数据

2020-10-30  本文已影响0人  医学小蛋散

前言

什么?Excel那么low?!

是的,我是写来救小白的,

大神请点赞后飘开~


场景——需要知道哪个数据重复了,然后要删除(10几20个就算了年轻人,上千几千条数据才用吧。除非你骨骼惊奇火眼金睛,否则不值得给傻缺老板赔上眼睛):

具体场景:当你辛辛苦苦整理好1千多条基因信息之后,然后你的傻缺导师确定并整理了一遍,需要合并到原来的数据集中的时候,去掉重复后发现比之前多了好几行信息!!! 你就意识到,你导师就没有做了人做的事情,如修改了格式,抽风般地多打了一个空格,你想得到的和想不到的行为....总不能1千多条/几千条数据一行一行地看哪个重复了吧?如下:

我需要知道哪个是重复,给我站出来!!!

骚操作:

1.选择你需要查重的范围(本例为第一列,A1:A1285)

2.在“开始”选项卡上的“样式”组中,单击“条件格式”。单击“突出显示单元格规则”,“重复值”。

找到重复值按钮

3.我只要知道是谁!粗暴地点击OK

按OK,管他什么颜色变化啊

4.重复的内容都给我出来!!!

出来啊!!

红色的,都给我 删了!!! (当然你也可以根据颜色排序然后批量删除之类的)

但,

我就要享受把“老板傻缺的证据一条一条删去”的快感!!!

做个人吧

参考文献:

傻老板,你做个人吧!

上一篇下一篇

猜你喜欢

热点阅读