个人常用函数

2022-09-04  本文已影响0人  是东东

字段排序

sorted_result = sorted(item.items(),key=lambda x:x[1],reverse=True)

清理字符串中的特殊字符,可用于文件命名

clean_txt = lambda str: re.sub(r'[\/\\\:\*\?\"\<\>\|]' , "_", str) 

节格式化为kb、mb、gb,可用于文件大小转换

def format_size(bytes):
    try:
        bytes = float(bytes)
        kb = bytes / 1024
        if kb > 1024:
            mb = kb / 1024
            if mb > 1024:
                gb = mb / 1024
                return '%.2fGB' % gb
            else:
                return '%.2fMB' % mb
        else:
            return '%.2fKB' % kb
    except:
        return 'error'

PC UA随机生成

def get_ua():
    first_num = random.randint(55, 62)
    third_num = random.randint(0, 3200)
    fourth_num = random.randint(0, 140)
    os_type = [
        '(Windows NT 6.1; WOW64)', '(Windows NT 10.0; WOW64)', '(X11; Linux x86_64)',
        '(Macintosh; Intel Mac OS X 10_12_6)'
    ]
    chrome_version = 'Chrome/{}.0.{}.{}'.format(first_num, third_num, fourth_num)
    ua = ' '.join(
        [
            'Mozilla/5.0', random.choice(os_type), 'AppleWebKit/537.36',
            '(KHTML, like Gecko)', chrome_version, 'Safari/537.36'
        ]
    )
    return ua

正则匹配汉字

match_zh_words = lambda text: re.findall(r'[\u4e00-\u9fa5]+',text)

输出彩色字体

print('\033[35;46m正常\033[0m')
print('\033[31;43m警告\033[0m')
print('\033[31;44m错误\033[0m')
彩色字体效果图

判断关键字是否在文本中出现

keyword_list=['a','b','c',]
flag=any(True if keyword in text else False for keyword in keyword_list)

谷歌翻译语言表

language_table={'auto': '自动选择', 'af': '南非荷兰语', 'sq': '阿尔巴尼亚语', 'am': '阿姆哈拉语', 'ar': '阿拉伯语', 'hy': '亚美尼亚语', 'az': '阿塞拜疆语', 'eu': '巴斯克语', 'be': '白俄罗斯语', 'bn': '孟加拉语', 'bs': '波斯尼亚语', 'bg': '保加利亚语', 'ca': '加泰罗尼亚语', 'ceb': '宿务语', 'zh': '中文(简体)', 'zh-TW': '中文(繁体)', 'co': '科西嘉语', 'hr': '克罗地亚语', 'cs': '捷克语', 'da': '丹麦语', 'nl': '荷兰语', 'en': '英语', 'eo': '世界语', 'et': '爱沙尼亚语', 'fi': '芬兰语', 'fr': '法语', 'fy': '弗里西语', 'gl': '加利西亚语', 'ka': '格鲁吉亚语', 'de': '德语', 'el': '希腊语', 'gu': '古吉拉特语', 'ht': '海地克里奥尔语', 'ha': '豪萨语', 'haw': '夏威夷语', 'he': '希伯来语', 'hi': '印地语', 'hmn': '苗语', 'hu': '匈牙利语', 'is': '冰岛语', 'ig': '伊博语', 'id': '印尼语', 'ga': '爱尔兰语', 'it': '意大利语', 'ja': '日语', 'jw': '爪哇语', 'kn': '卡纳达语', 'kk': '哈萨克语', 'km': '高棉语', 'ko': '韩语', 'ku': '库尔德语', 'ky': '吉尔吉斯语', 'lo': '老挝语', 'la': '拉丁语', 'lv': '拉脱维亚语', 'lt': '立陶宛语', 'lb': '卢森堡语', 'mk': '马其顿语', 'mg': '马尔加什语', 'ms': '马来语', 'ml': '马拉雅拉姆语', 'mt': '马耳他语', 'mi': '毛利语', 'mr': '马拉地语', 'mn': '蒙古语', 'my': '缅甸语', 'ne': '尼泊尔语', 'no': '挪威语', 'ny': '尼杨扎语(齐切瓦语)', 'ps': '普什图语', 'fa': '波斯语', 'pl': '波兰语', 'pt': '葡萄牙语', 'pa': '旁遮普语', 'ro': '罗马尼亚语', 'ru': '俄语', 'sm': '萨摩亚语', 'gd': '苏格兰盖尔语', 'sr': '塞尔维亚语', 'st': '塞索托语', 'sn': '修纳语', 'sd': '信德语', 'si': '僧伽罗语', 'sl': '斯洛文尼亚语', 'so': '索马里语', 'es': '西班牙语', 'su': '巽他语', 'sw': '斯瓦希里语', 'sv': '瑞典语', 'tl': '塔加洛语(菲律宾语)', 'tg': '塔吉克语', 'ta': '泰米尔语', 'te': '泰卢固语', 'th': '泰语', 'tr': '土耳其语', 'uk': '乌克兰语', 'ur': '乌尔都语', 'uz': '乌兹别克语', 'vi': '越南语', 'cy': '威尔士语', 'xh': '班图语', 'yi': '意第绪语', 'yo': '约鲁巴语', 'zu': '祖鲁语'}

时间戳转日期时间

get_date = lambda n: time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time() - 60 * 60 * 24 * n))

def convert_to_datetime(timestamp):
    timeArray = time.localtime(timestamp)
    datetime= time.strftime("%Y-%m-%d %H:%M:%S", timeArray)
    return datetime

B站AV号转BV号

alphabet = 'fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF'
def dec(x):
    # bv to av
    r = 0
    for i, v in enumerate([11, 10, 3, 8, 4, 6]):
        r += alphabet.find(x[v]) * 58 ** i
    return (r - 0x2_0840_07c0) ^ 0x0a93_b324
def enc(x):
    # av to bv
    x = (x ^ 0x0a93_b324) + 0x2_0840_07c0
    r = list('BV1**4*1*7**')
    for v in [11, 10, 3, 8, 4, 6]:
        x, d = divmod(x, 58)
        r[v] = alphabet[d]
    return ''.join(r)
print(dec(alphabet))  # -4566132193
print(enc(dec(alphabet)))  # BV1dR4X1D7Um

展示日期信息,便于天气展示

import datetime
def show_date():
    """
    展示日期信息,便于天气展示
    :return:
    """
    date = str(datetime.date.today())
    year, month, day = date.split('-')
    week_day_dict = {
        0: '星期一',
        1: '星期二',
        2: '星期三',
        3: '星期四',
        4: '星期五',
        5: '星期六',
        6: '星期日 ',
    }
    now = datetime.datetime.now()
    date_index = now.weekday()
    date_time = f'{year}年{month}月{day}日 {week_day_dict[date_index]}'
    return date_time
print(show_date())  # 2022年09月03日 星期六

解决最新Pyecharts无Map

pip install pyecharts==0.5.1

图片base64硬编码

import base64
def img_to_base64(filename):
    with open(filename, 'rb') as open_icon:
        b64str = base64.b64encode(open_icon.read())
        return b64str

提取url中的参数

import urllib.parse
def extractParams(url):
    parsed = urllib.parse. urlparse(url)
    querys = urllib.parse.parse_qs(parsed.query)
    querys = {k: v[0] for k, v in querys.items()}
    return querys
print(extractParams('https://www.baidu.com/s?ie=UTF-8&wd=python'))  # {'ie': 'UTF-8', 'wd': 'python'}

分块下载文件

import requests

link="http://www.xxxx/com/video/123.mp4"
file_name="123.mp4"
rsp = requests.get(link, stream=True)
chunk = 2048  # 每次读取2M,分块读取
with open(file_name, 'wb') as f:
    for i in rsp.iter_content(chunk):
         f.write(i)

自动解码text,用于requests得到的response.content二进制解码

def text_encoding(text):
    try:
        import cchardet
        if isinstance(text, bytes):
            encoding = cchardet.detect(text)['encoding']
            print('encoding', encoding)
            if encoding is None:
                encoding = 'UTF-8'
            text = text.decode(encoding, 'ignore')
    except ModuleNotFoundError as e:
        print(e)
        e = repr(e).split("\'")[-2]
        print(f'now install module:{e}')
        import os
        os.system('pip install cchardet')
        return text_encoding(text)
    return text
上一篇下一篇

猜你喜欢

热点阅读