EXCEL表根据日期范围进行数据筛选的py代码V1.0
2021-04-11 本文已影响0人
人艰不扌斥
-
原数据表共有3份,其中的1份内容如下图:
图片.png
-
最终实现效果如图:
图片.png
- 以下为代码部分:
# 加载pandas库并简写为pd
# 关闭警告显示
import warnings
import pandas as pd
warnings.filterwarnings ('ignore')
# ===========================================================================
# 第一步:将日期列设置为索引列;
# 第二步:设置日期这里列的格式:parse_dates=['日期']
# 第三步:进行排序,
原始数据1 = pd.read_excel ('E:/111111111111111/月报案例/A.xlsx',
header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
数据1 = 原始数据1.sort_values ('日期')
原始数据2 = pd.read_excel ('E:/111111111111111/月报案例/B.xlsx',
header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
数据2 = 原始数据2.sort_values ('日期')
原始数据3 = pd.read_excel ('E:/111111111111111/月报案例/C.xlsx',
header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
数据3 = 原始数据3.sort_values ('日期')
# --------------------------------------------------------------------------
# # 查询2020年10月的数据
# print(原始数据1_1['2020-10'])
# print('----------------------------------')
# # 查询某个日期之后的数据,包含当天
# print(原始数据1_1.truncate(before='2020-10-1'))
# print('----------------------------------')
#
# # 查询某个日期之前的数据,包含当天
# print(原始数据1_1.truncate(after='2020-10-1'))
# print('----------------------------------')
# ----------------------------------------------------------------------------
# 查询某个 开始日期:结束日期 之间的数据,包含当天
开始日期 = input('请输入开始日期,格式为:YYYY-MM-DD')
结束日期 = input('请输入结束日期,格式为:YYYY-MM-DD')
筛选结果1 = 数据1.loc[开始日期:结束日期]
筛选结果2 = 数据2.loc[开始日期:结束日期]
筛选结果3 = 数据3.loc[开始日期:结束日期]
# 参数axis=0表示上下合并,1表示左右合并,ignore_index=True表示忽略原来的索引
# 筛选结果 = pd.concat([筛选结果1,筛选结果2,筛选结果3],axis=0,ignore_index=False).sort_values('日期')
# 或者使用append方法合并,如下:
筛选结果 = 筛选结果1.append ([筛选结果2, 筛选结果3], ignore_index=False)
# 删除指定列数据
数据清洗 = 筛选结果.drop (columns=['序号', '结束日期', '事件\n状态', '事件\n级别', '备 注'])
# print(数据清洗)
# ------------------------------------
#
# 筛选结果1_1 = 筛选结果1.reset_index()
# print(筛选结果1_1)
# print(筛选结果1_1['日期'])
#
# print(type(筛选结果1_1['日期']))
# ------------------------------------
# # 用query方式设置条件筛选时,不能将‘日期’设置为索引列
# # 日期筛选条件与其他条件同时设置,请注意 and 的位置
# 条件5 = (
# '@数据.日期.dt.year == 2020 and'
# '@数据.日期.dt.month >= 9 '
# 'and 部门 == "少儿部"'
#
# )
# print(数据.query(条件5))
# ------------------------------------
# print(数据清洗)
# 将筛选结果保存工作簿,index=False表示不写入索引列
数据清洗.to_excel ('筛选完成.xlsx', index=True)
新数据 = pd.read_excel ('E:/111111111111111/月报案例/筛选完成.xlsx')
print(新数据)
#将date列中的日期转换为没有时分秒的日期
新数据["日期"] = 新数据["日期"].dt.date
新数据.to_excel("筛选完成.xlsx", index=False)
print('==================================================')
# 加载openpyxl库
from openpyxl import load_workbook
# 打开筛选后的工作簿
工作簿 = load_workbook ('筛选完成.xlsx')
# 获取活动工作表
工作表 = 工作簿.active
# ---------------------------------------------------------
# 设置并添加表头
# late_header = ['日期', '部门', '房号', '联系人', '运维类型', '事件级别', '事件类型', '故障对象',
# '事件现象', '详细处理过程', '事件状态', '结束日期', '受理人', '备注']
# 新建工作簿
# new_wb = Workbook()
# 获取新工作簿中的工作表
# 工作表 = new_wb.active
# 将表头写入新工作簿的工作表中
# 工作表.append(late_header)
# 返回三份表的第2行至末行,第2列(B列)至第15列(M列)这个范围的所有单元格对象,将其写入新工作簿的工作表内
# for row in 工作表.iter_rows(min_row=2, min_col=2, max_col=15, values_only=True):
# 工作表.append(row)
# ---------------------------------------------------------
# 加载表格样式
from openpyxl.styles import PatternFill, Alignment, Side, Border
# 定义表头颜色样式
header_fill = PatternFill ('solid', fgColor='c8e6c6')
# 定义表中颜色样式为淡黄色
# content_fill = PatternFill('solid', fgColor='FFFFE0')
# 定义对齐样式横向居中、纵向居中
align = Alignment (horizontal='center', vertical='center')
# 定义边样式为细条
side = Side('thin')
# 定义表头边框样式,有底边、顶部、和左边、右边
border = Border(bottom=side, top=side, right=side, left=side)
# 调整列宽
工作表.column_dimensions['A'].width = 14
工作表.column_dimensions['B'].width = 16
工作表.column_dimensions['C'].width = 16
工作表.column_dimensions['D'].width = 8
工作表.column_dimensions['E'].width = 25
工作表.column_dimensions['F'].width = 10
工作表.column_dimensions['G'].width = 16
工作表.column_dimensions['H'].width = 40
工作表.column_dimensions['I'].width = 40
工作表.column_dimensions['J'].width = 8
# 循环第一行单元格,调整表头样式
for cell in 工作表[1]:
# 设置单元格填充颜色
cell.fill = header_fill
# 设置单元格对齐方式
cell.alignment = align
# 设置单元格边框
cell.border = border
# 获取最后一行行号
row_num = 工作表.max_row
# 循环读取行,并设置行高
for n in range (row_num + 1):
工作表.row_dimensions[n].height = 30
# 从第二行开始,循环到末行
for row in 工作表.iter_rows (min_row=2, max_row=row_num):
# 循环取出单元格,调整表中样式
for cell in row:
cell.alignment = align
cell.border = border
# 保存工作簿为【append_demo.xlsx】
工作簿.save ('筛选完成.xlsx')
print('保存完毕!')
- 此代码还有不少可以优化的地方,欢迎大家相互交流指导