Excel在生物信息分析中的骚操作(4)——查重复数据
2020-10-30 本文已影响0人
医学小蛋散
前言
什么?Excel那么low?!
是的,我是写来救小白的,
大神请点赞后飘开~
场景——需要知道哪个数据重复了,然后要删除(10几20个就算了年轻人,上千几千条数据才用吧。除非你骨骼惊奇火眼金睛,否则不值得给傻缺老板赔上眼睛):
具体场景:当你辛辛苦苦整理好1千多条基因信息之后,然后你的傻缺导师确定并整理了一遍,需要合并到原来的数据集中的时候,去掉重复后发现比之前多了好几行信息!!! 你就意识到,你导师就没有做了人做的事情,如修改了格式,抽风般地多打了一个空格,你想得到的和想不到的行为....总不能1千多条/几千条数据一行一行地看哪个重复了吧?如下:
![](https://img.haomeiwen.com/i15675936/7cc785db751501ee.png)
骚操作:
1.选择你需要查重的范围(本例为第一列,A1:A1285)
![](https://img.haomeiwen.com/i15675936/00cf0370a2b067d5.png)
2.在“开始”选项卡上的“样式”组中,单击“条件格式”。单击“突出显示单元格规则”,“重复值”。
![](https://img.haomeiwen.com/i15675936/3cbfb414aa882e06.png)
3.我只要知道是谁!粗暴地点击OK
![](https://img.haomeiwen.com/i15675936/1d3d8ab131fe0f93.png)
4.重复的内容都给我出来!!!
![](https://img.haomeiwen.com/i15675936/56e905b9d78f1131.png)
红色的,都给我 删了!!! (当然你也可以根据颜色排序然后批量删除之类的)
但,
我就要享受把“老板傻缺的证据一条一条删去”的快感!!!
![](https://img.haomeiwen.com/i15675936/1e80eafc650f4d94.png)