EXCEL表根据日期范围进行数据筛选的py代码V1.0

2021-04-11 本文已影响0人人艰不扌斥
原数据表共有3份，其中的1份内容如下图：

图片.png
最终实现效果如图：

图片.png
以下为代码部分：
# 加载pandas库并简写为pd
# 关闭警告显示
import warnings

import pandas as pd

warnings.filterwarnings ('ignore')

# ===========================================================================

# 第一步：将日期列设置为索引列；
# 第二步：设置日期这里列的格式：parse_dates=['日期']
# 第三步：进行排序，
原始数据1 = pd.read_excel ('E:/111111111111111/月报案例/A.xlsx',
                       header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
数据1 = 原始数据1.sort_values ('日期')

原始数据2 = pd.read_excel ('E:/111111111111111/月报案例/B.xlsx',
                       header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
数据2 = 原始数据2.sort_values ('日期')

原始数据3 = pd.read_excel ('E:/111111111111111/月报案例/C.xlsx',
                       header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
数据3 = 原始数据3.sort_values ('日期')

# --------------------------------------------------------------------------
# # 查询2020年10月的数据
# print(原始数据1_1['2020-10'])
# print('----------------------------------')
# # 查询某个日期之后的数据，包含当天
# print(原始数据1_1.truncate(before='2020-10-1'))
# print('----------------------------------')
#
# # 查询某个日期之前的数据，包含当天
# print(原始数据1_1.truncate(after='2020-10-1'))
# print('----------------------------------')
# ----------------------------------------------------------------------------


# 查询某个 开始日期:结束日期 之间的数据，包含当天
开始日期 = input('请输入开始日期，格式为：YYYY-MM-DD')
结束日期 = input('请输入结束日期，格式为：YYYY-MM-DD')


筛选结果1 = 数据1.loc[开始日期:结束日期]
筛选结果2 = 数据2.loc[开始日期:结束日期]
筛选结果3 = 数据3.loc[开始日期:结束日期]

# 参数axis=0表示上下合并，1表示左右合并，ignore_index=True表示忽略原来的索引
# 筛选结果 = pd.concat([筛选结果1,筛选结果2,筛选结果3],axis=0,ignore_index=False).sort_values('日期')

# 或者使用append方法合并，如下：
筛选结果 = 筛选结果1.append ([筛选结果2, 筛选结果3], ignore_index=False)





# 删除指定列数据
数据清洗 = 筛选结果.drop (columns=['序号', '结束日期', '事件\n状态', '事件\n级别', '备  注'])

# print(数据清洗)


# ------------------------------------

#
# 筛选结果1_1 = 筛选结果1.reset_index()
# print(筛选结果1_1)
# print(筛选结果1_1['日期'])
#
# print(type(筛选结果1_1['日期']))


# ------------------------------------

# # 用query方式设置条件筛选时，不能将‘日期’设置为索引列
# # 日期筛选条件与其他条件同时设置，请注意 and 的位置
# 条件5 = (
#     '@数据.日期.dt.year == 2020 and'
#     '@数据.日期.dt.month >= 9 '
#     'and 部门 == "少儿部"'
#
# )
# print(数据.query(条件5))
# ------------------------------------

# print(数据清洗)



# 将筛选结果保存工作簿，index=False表示不写入索引列
数据清洗.to_excel ('筛选完成.xlsx', index=True)


新数据 = pd.read_excel ('E:/111111111111111/月报案例/筛选完成.xlsx')

print(新数据)

#将date列中的日期转换为没有时分秒的日期
新数据["日期"] = 新数据["日期"].dt.date


新数据.to_excel("筛选完成.xlsx", index=False)



print('==================================================')

# 加载openpyxl库
from openpyxl import load_workbook

# 打开筛选后的工作簿
工作簿 = load_workbook ('筛选完成.xlsx')

# 获取活动工作表
工作表 = 工作簿.active


# ---------------------------------------------------------
# 设置并添加表头
# late_header = ['日期', '部门', '房号', '联系人', '运维类型', '事件级别', '事件类型', '故障对象',
#                '事件现象', '详细处理过程', '事件状态', '结束日期', '受理人', '备注']

# 新建工作簿
# new_wb = Workbook()
# 获取新工作簿中的工作表
# 工作表 = new_wb.active
# 将表头写入新工作簿的工作表中
# 工作表.append(late_header)

# 返回三份表的第2行至末行，第2列（B列）至第15列（M列）这个范围的所有单元格对象，将其写入新工作簿的工作表内
# for row in 工作表.iter_rows(min_row=2, min_col=2, max_col=15, values_only=True):
#     工作表.append(row)
# ---------------------------------------------------------

# 加载表格样式
from openpyxl.styles import PatternFill, Alignment, Side, Border

# 定义表头颜色样式
header_fill = PatternFill ('solid', fgColor='c8e6c6')

# 定义表中颜色样式为淡黄色
# content_fill = PatternFill('solid', fgColor='FFFFE0')

# 定义对齐样式横向居中、纵向居中
align = Alignment (horizontal='center', vertical='center')

# 定义边样式为细条
side = Side('thin')

# 定义表头边框样式，有底边、顶部、和左边、右边
border = Border(bottom=side, top=side, right=side, left=side)

# 调整列宽
工作表.column_dimensions['A'].width = 14
工作表.column_dimensions['B'].width = 16
工作表.column_dimensions['C'].width = 16
工作表.column_dimensions['D'].width = 8
工作表.column_dimensions['E'].width = 25
工作表.column_dimensions['F'].width = 10
工作表.column_dimensions['G'].width = 16
工作表.column_dimensions['H'].width = 40
工作表.column_dimensions['I'].width = 40
工作表.column_dimensions['J'].width = 8

# 循环第一行单元格，调整表头样式
for cell in 工作表[1]:
    # 设置单元格填充颜色
    cell.fill = header_fill
    # 设置单元格对齐方式
    cell.alignment = align
    # 设置单元格边框
    cell.border = border

# 获取最后一行行号
row_num = 工作表.max_row

# 循环读取行，并设置行高
for n in range (row_num + 1):
    工作表.row_dimensions[n].height = 30

# 从第二行开始，循环到末行
for row in 工作表.iter_rows (min_row=2, max_row=row_num):
    # 循环取出单元格，调整表中样式
    for cell in row:
        cell.alignment = align
        cell.border = border

# 保存工作簿为【append_demo.xlsx】
工作簿.save ('筛选完成.xlsx')
print('保存完毕！')
此代码还有不少可以优化的地方，欢迎大家相互交流指导
EXCEL表根据日期范围进行数据筛选的py代码V1.0

猜你喜欢

热点阅读