我的个人数据存储与自动备份策略

2021-12-11  本文已影响0人  刘娟娟
image

我以前喜欢直接在公共平台上写东西,也就是打开网站或应用的编辑器直接敲键盘。无论那是只言片语的微博,一段心得感想又或者一篇文章。现在,我已经改掉了这个习惯。

我会先在本地编辑器生产所有数据,然后再拷贝到合适的公共平台发布;本地数据文件我采用 git 生成版本记录,并自动往 github 推送,进行云备份。

我的这些本地数据表现为一个个文件夹和文件。通常是 markdown 文件,少量的 ipynb 或 python 源码文件,以及一些文档文件、图片等。

我通常采用 Obsidian、Vscode 或是 Jupyter Lab 打开这些文件 …… 这些工具可统称为编辑器。前两个适合文本,后两个适合文本和源代码。

这些本地数据需要备份,以防本地设备异常损毁导致数据丢失。由于手动备份到另外一份物理介质上(比如说移动硬盘)非常费神,目前我只是把它们提交到 github 私有仓库上存档。

往 github 私有仓库存档,有 3 种操作方式,这三者的生产效率也越来越高。

最初,我会在 vscode 上访问这些私有仓库的本地文件夹,手动敲出几行命令并执行它。我总是需要等待命令执行完毕,才能切换并处置下一个私有仓库。

后来,我写了一段简单代码来自动执行。它采用 Python 写成:自动生成 git 命令,写入一个批处理的临时文件,然后执行该批处理文件,最后把临时文件删除。

这段 Python 代码长这样:


"""自动提交私有仓库到 github 上备份"""
import os

# 我的私有仓库
repos = [
    "D:\\MY-OBSIDIAN-DATA\\my_Timedata",
    "D:\\MY-OBSIDIAN-DATA\\my_Schedule",
    "D:\\MY-OBSIDIAN-DATA\\my_Writing",
]

# 我对私有仓库的 git 操作
cmds = {
    "status": "git status\n",
    "push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
}

# 生成批量命令并执行
def auto_git(command):
    lines = []
    tempfile = r"D:\MY-OBSIDIAN-DATA\temp.bat"
    for repo in repos:
        lines.append(f"cd {repo}\n")
        lines.append(cmds[command])

    with open(tempfile, "w") as f:
        f.writelines(lines)
    os.system(tempfile)
    os.remove(tempfile)

asku = input("0 byebye.\n1 status\n2 push")
if asku == "0":
    print("byebye.")
elif asku == "1":
    command = "status"
else:
    command = "push"
    
auto_git(command)

它省掉了“打开编辑器、切换到不同仓库、手动敲下命令行、等待执行结束”的重复操作。这些重复操作毫无技术含量,用代码来自动执行正是我自学 Python 的一大成就感所在。

但它依然是一份手动触发的代码,我需要记住:不定期(比如尽量每天)多次执行该代码。想要进一步降低大脑负担,让它每天自动执行,那就可以用到 windows 的任务计划程序。具体如何设置呢?搜索“windows 任务计划程序”,网上有很多详尽的图文攻略。

最初的 Python 代码有 input() 来做人机交互,可以查看仓库状态和提交,还可以扩展更多操作。但如果转为定时任务,则直接执行提交即可。代码稍做调整后变成了:


"""自动提交私有仓库到 github 上备份"""
import os

# 我的私有仓库
repos = [
    "D:\\MY-OBSIDIAN-DATA\\my_Timedata",
    "D:\\MY-OBSIDIAN-DATA\\my_Schedule",
    "D:\\MY-OBSIDIAN-DATA\\my_Writing",
]

# 我对私有仓库的 git 操作
cmds = {
    "status": "git status\n",
    "push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
}

# 生成批量命令并执行
def auto_git(command):
    lines = []
    tempfile = r"D:\MY-OBSIDIAN-DATA\my_auto_task\tempfile.bat"
    for repo in repos:
        lines.append(f"cd {repo}\n")
        lines.append(cmds[command])

    with open(tempfile, "w") as f:
        f.writelines(lines)
    os.system(tempfile)

def asku():
    """交互式获取命令,可查询状态或提交"""
    asku = input("0 byebye.\n1 status\n2 push")
    if asku == "0":
        return print("byebye.")
    elif asku == "1":
        command = "status"
    else:
        command = "push"
    auto_git(command)

auto_git("push")

一条定时任务,对于计算机和人类来说,依然是一份数据。你可以在任务计划程序的图形界面上手动设置,也可以导出已有任务得到一份 xml 文件作为模板,然后修改好参数后,回到任务计划程序的图形界面上导入它。当然,记得在界面上查看和修订参数,以确保参数符合预期。

一条定时任务的 xml 文件长这个样子:


<?xml version="1.0" encoding="UTF-16"?>

<Task version="1.2" xmlns="http://schemas.microsoft.com/windows/2004/02/mit/task">

 <RegistrationInfo>

 <Date>2019-09-17T12:54:56.301647</Date>

 <Author>MSI\75801</Author>

 <URI>\my_github_private_repo_push3</URI>

 </RegistrationInfo>

 <Triggers>

 <CalendarTrigger>

 <StartBoundary>2019-09-17T12:56:00</StartBoundary>

 <Enabled>true</Enabled>

 <ScheduleByDay>

 <DaysInterval>1</DaysInterval>

 </ScheduleByDay>

 </CalendarTrigger>

 </Triggers>

 <Principals>

 <Principal id="Author">

 <UserId>S-1-5-21-4053500361-574701572-2713609324-1001</UserId>

 <LogonType>InteractiveToken</LogonType>

 <RunLevel>LeastPrivilege</RunLevel>

 </Principal>

 </Principals>

 <Settings>

 <MultipleInstancesPolicy>IgnoreNew</MultipleInstancesPolicy>

 <DisallowStartIfOnBatteries>true</DisallowStartIfOnBatteries>

 <StopIfGoingOnBatteries>true</StopIfGoingOnBatteries>

 <AllowHardTerminate>true</AllowHardTerminate>

 <StartWhenAvailable>false</StartWhenAvailable>

 <RunOnlyIfNetworkAvailable>false</RunOnlyIfNetworkAvailable>

 <IdleSettings>

 <Duration>PT10M</Duration>

 <WaitTimeout>PT1H</WaitTimeout>

 <StopOnIdleEnd>true</StopOnIdleEnd>

 <RestartOnIdle>false</RestartOnIdle>

 </IdleSettings>

 <AllowStartOnDemand>true</AllowStartOnDemand>

 <Enabled>true</Enabled>

 <Hidden>false</Hidden>

 <RunOnlyIfIdle>true</RunOnlyIfIdle>

 <WakeToRun>true</WakeToRun>

 <ExecutionTimeLimit>PT0S</ExecutionTimeLimit>

 <Priority>7</Priority>

 <RestartOnFailure>

 <Interval>PT1M</Interval>

 <Count>3</Count>

 </RestartOnFailure>

 </Settings>

 <Actions Context="Author">

 <Exec>

 <Command>C:\ProgramData\Anaconda3\python.exe</Command>

 <Arguments>D:\MY-OBSIDIAN-DATA\my_auto_task\github_private_repo_push.py</Arguments>

 <WorkingDirectory>D:\MY-OBSIDIAN-DATA\</WorkingDirectory>

 </Exec>

 </Actions>

</Task>

现在,我再也不用耗费心力记住自己是否往 github 上提交私有仓库的数据备份,因为它已经被设定了自动执行。

笑来老师最近说到,同样的智能设备,在不同人手中发挥的作用截然不同。痴迷于熟悉自己的生产工具并提高生产效率,总归是件好事。希望我的分享带给你一点启发。

上一篇下一篇

猜你喜欢

热点阅读