2019-07-09 每天处理时间用的

2019-07-09  本文已影响0人  年画儿
import os 
import numpy as np
import pandas as pd 
from dateutil.parser import parse
import sys

path = '/Users/austin/Desktop/未命名 6.txt'
r = open(path)
text = r.readlines()  # 项目
print(text)
list = []
for i in text:  
    if '到' not in i:
        print('程序停止') #如果缺少“到“直接停止
        sys.exit(0)
    if '点' in i:
        i = i.replace('点',':00')  #把点替换成:00
    mytime = i.split('到')[1]
    mytime = parse(mytime.split('\n')[0]) #把时间转换成datetime
    list.append(mytime)

s = pd.Series(list)
s[len(s)] = 0 #加一行 抵充shift的副作用
s = s.shift(1)
s[0] = pd.Timestamp(str(s[1])[:11] + '00:00:00') #增加起始00:00:00

timespace = []
for i in range(len(s)-1):
    timespace.append(s[i+1]-s[i])    #获得差值
# print(timespace)

timeuse = []
for i in timespace:
    p = str(i).split(' ')[-1]    #转换成str格式
    if p.startswith('+'):
        p = str(int(p[1:3])-12) + p[3:]   #处理掉中午12点到下午1点的突变 
    print(p)
    timeuse.append(p)
print(timeuse)

#整理成表格
data1 = {'name':text, 'timeuse':timeuse}
frame = pd.DataFrame(data1)
frame['name'] = frame['name'].str[:-1]
print(frame)

数据在这里 放在text纯文本里
到0:00
睡觉到7:09
杂事到7:21
看书到8:33
杂事到9:10
听音频到10:20
杂事到10:33
看视频到10:54
看编程到12:18
吃饭到12:37
学习编程到1:53
杂事到5:00
弄金融数据包到7:50
学习数据分析到8:29
杂事到8:44
学习gis到9:14
看老唐文章到9:20
整理到9:26
回家到10:20
弄编程到12点

import os 
import numpy as np
import pandas as pd 
from dateutil.parser import parse
import sys

path = '/Users/austin/Desktop/timeuse.txt'
r = open(path)
text = r.readlines()  # 项目

list = []
for i in text:  
    if '到' not in i:
        print('程序停止') #如果缺少“到“直接停止
        sys.exit(0)
    if '点' in i:
        i = i.replace('点',':00')  #把点替换成:00
    mytime = i.split('到')[1]
    mytime = parse(mytime.split('\n')[0]) #把时间转换成datetime
    list.append(mytime)

s = pd.Series(list)
s[len(s)] = 0 #加一行 抵充shift的副作用
s = s.shift(1)
s[0] = pd.Timestamp(str(s[1])[:11] + '00:00:00') #增加起始00:00:00

timespace = []
for i in range(len(s)-1):
    timespace.append(s[i+1]-s[i])    #获得差值
# print(timespace)

timeuse = []
for i in timespace:
    p = str(i).split(' ')[-1]    #转换成str格式
    if p.startswith('+'):
        p = str(int(p[1:3])-12) + p[3:]   #处理掉中午12点到下午1点的突变 
#     print(p)
    timeuse.append(p)


#整理成表格
data1 = {'name':text, 'timeuse':timeuse}
frame = pd.DataFrame(data1)
frame.loc[:len(frame)-2,'name'] = frame.loc[:len(frame)-2,'name'].str[:-1]
# frame[:-1]['name'] = frame[:-1]['name'].str[:-1]
# frame.loc[:-1]['name']
# frame.loc[:len(frame),'timeuse']
# frame.shape[0]
# len(frame)
frame
上一篇 下一篇

猜你喜欢

热点阅读