「TBtools」用户输入文件二三小事

2022-03-02  本文已影响0人  生信石头

GFF3 坐标有误....

理论上来说,这个问题不应该存在。但确实出现了。用户使用 TBtools 提取 CDS 序列,遇到报错



从报错信息来看,我以为存在一定的可能是 TBtools 处理有效数字的问题。但事实上,TBtools 完全可以处理几个G就在一条染色体的序列。不过我还是测试了下。
试了下,确实报相同错误,怀疑是输入文件有问题,于是看了下数据文件



Emmm,可以确定,用户下载的这个文件(也就是发布基因组的团队提供的这个文件)本身就存在问题。
无解。

文件编码格式的问题

用户使用 Advanced HMM 的时候,明明输入的就只是 ID ,却一直报错。非常诡异



最后发现,对于文档查看来说,我们看到的是左边,但是计算机看到的是右边。
在 UTF 编码的文本上,有不少空白符符号。这点在 ANSI 编码的不会。对于 TBtools 用户,建议使用 后者编码,如果遇到可能类似问题。



当然,完全可以直接使用 TBtools 的 Invalid Char Clean 功能处理看看,就会发现,转换后的结果如下
上一篇 下一篇

猜你喜欢

热点阅读