脚本批量统计表格

2024-03-18  本文已影响0人  花生学生信

目的:使用脚本统计所有特定格式的表格,无需输入特定参数

统计当前文件夹下所有csv文件第一行以后每一行的和,并生成新的文件

import os
import pandas as pd

# 获取当前文件夹下所有csv文件
files = [file for file in os.listdir() if file.endswith('.csv')]

# 遍历每个csv文件
for file in files:
    data = pd.read_csv(file)
    sum_values = data.iloc[0:].sum()  # 第二行以后每一行的和
    sum_values.to_csv(f'sum_{file}', header=False)  # 生成新文件
统计前,01矩阵 根据位点统计的结果 每个样本的Te数量,第一行第二列为所有位点
整合成一个表格
ps:因为之前写过相似的脚本,所有继续沿用
####csv转xls

#!/usr/bin/perl

use strict;
use warnings;

# 获取当前文件夹下所有csv文件
my @files = glob("*.csv");

# 遍历每个csv文件
foreach my $file (@files) {
    open my $csv_fh, '<', $file or die "Cannot open file: $!";
    open my $xls_fh, '>', "$file.xls" or die "Cannot create file: $!";

    # 跳过第一行
    my $header = <$csv_fh>;


    # 复制csv文件内容到xls文件,使用制表符分隔
    while (my $line = <$csv_fh>) {
        chomp $line;
        my @fields = split(',', $line);
        print $xls_fh join("\t", @fields) . "\n";
    }

    close $csv_fh;
    close $xls_fh;
}

整合的脚本参照:
plantare结果统计 - 简书 (jianshu.com)

最终统计的结果,替换部分字符即可
ps:最后有一个CX10格式不对,实在找不出原因,还要手动整理,囧
上一篇下一篇

猜你喜欢

热点阅读