我的个人数据存储与自动备份策略
我以前喜欢直接在公共平台上写东西,也就是打开网站或应用的编辑器直接敲键盘。无论那是只言片语的微博,一段心得感想又或者一篇文章。现在,我已经改掉了这个习惯。
我会先在本地编辑器生产所有数据,然后再拷贝到合适的公共平台发布;本地数据文件我采用 git 生成版本记录,并自动往 github 推送,进行云备份。
我的这些本地数据表现为一个个文件夹和文件。通常是 markdown 文件,少量的 ipynb 或 python 源码文件,以及一些文档文件、图片等。
我通常采用 Obsidian、Vscode 或是 Jupyter Lab 打开这些文件 …… 这些工具可统称为编辑器。前两个适合文本,后两个适合文本和源代码。
这些本地数据需要备份,以防本地设备异常损毁导致数据丢失。由于手动备份到另外一份物理介质上(比如说移动硬盘)非常费神,目前我只是把它们提交到 github 私有仓库上存档。
往 github 私有仓库存档,有 3 种操作方式,这三者的生产效率也越来越高。
最初,我会在 vscode 上访问这些私有仓库的本地文件夹,手动敲出几行命令并执行它。我总是需要等待命令执行完毕,才能切换并处置下一个私有仓库。
后来,我写了一段简单代码来自动执行。它采用 Python 写成:自动生成 git 命令,写入一个批处理的临时文件,然后执行该批处理文件,最后把临时文件删除。
这段 Python 代码长这样:
"""自动提交私有仓库到 github 上备份"""
import os
# 我的私有仓库
repos = [
"D:\\MY-OBSIDIAN-DATA\\my_Timedata",
"D:\\MY-OBSIDIAN-DATA\\my_Schedule",
"D:\\MY-OBSIDIAN-DATA\\my_Writing",
]
# 我对私有仓库的 git 操作
cmds = {
"status": "git status\n",
"push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
}
# 生成批量命令并执行
def auto_git(command):
lines = []
tempfile = r"D:\MY-OBSIDIAN-DATA\temp.bat"
for repo in repos:
lines.append(f"cd {repo}\n")
lines.append(cmds[command])
with open(tempfile, "w") as f:
f.writelines(lines)
os.system(tempfile)
os.remove(tempfile)
asku = input("0 byebye.\n1 status\n2 push")
if asku == "0":
print("byebye.")
elif asku == "1":
command = "status"
else:
command = "push"
auto_git(command)
它省掉了“打开编辑器、切换到不同仓库、手动敲下命令行、等待执行结束”的重复操作。这些重复操作毫无技术含量,用代码来自动执行正是我自学 Python 的一大成就感所在。
但它依然是一份手动触发的代码,我需要记住:不定期(比如尽量每天)多次执行该代码。想要进一步降低大脑负担,让它每天自动执行,那就可以用到 windows 的任务计划程序
。具体如何设置呢?搜索“windows 任务计划程序”,网上有很多详尽的图文攻略。
最初的 Python 代码有 input() 来做人机交互,可以查看仓库状态和提交,还可以扩展更多操作。但如果转为定时任务,则直接执行提交即可。代码稍做调整后变成了:
"""自动提交私有仓库到 github 上备份"""
import os
# 我的私有仓库
repos = [
"D:\\MY-OBSIDIAN-DATA\\my_Timedata",
"D:\\MY-OBSIDIAN-DATA\\my_Schedule",
"D:\\MY-OBSIDIAN-DATA\\my_Writing",
]
# 我对私有仓库的 git 操作
cmds = {
"status": "git status\n",
"push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
}
# 生成批量命令并执行
def auto_git(command):
lines = []
tempfile = r"D:\MY-OBSIDIAN-DATA\my_auto_task\tempfile.bat"
for repo in repos:
lines.append(f"cd {repo}\n")
lines.append(cmds[command])
with open(tempfile, "w") as f:
f.writelines(lines)
os.system(tempfile)
def asku():
"""交互式获取命令,可查询状态或提交"""
asku = input("0 byebye.\n1 status\n2 push")
if asku == "0":
return print("byebye.")
elif asku == "1":
command = "status"
else:
command = "push"
auto_git(command)
auto_git("push")
一条定时任务,对于计算机和人类来说,依然是一份数据。你可以在任务计划程序
的图形界面上手动设置,也可以导出已有任务得到一份 xml 文件作为模板,然后修改好参数后,回到任务计划程序
的图形界面上导入它。当然,记得在界面上查看和修订参数,以确保参数符合预期。
一条定时任务的 xml 文件长这个样子:
<?xml version="1.0" encoding="UTF-16"?>
<Task version="1.2" xmlns="http://schemas.microsoft.com/windows/2004/02/mit/task">
<RegistrationInfo>
<Date>2019-09-17T12:54:56.301647</Date>
<Author>MSI\75801</Author>
<URI>\my_github_private_repo_push3</URI>
</RegistrationInfo>
<Triggers>
<CalendarTrigger>
<StartBoundary>2019-09-17T12:56:00</StartBoundary>
<Enabled>true</Enabled>
<ScheduleByDay>
<DaysInterval>1</DaysInterval>
</ScheduleByDay>
</CalendarTrigger>
</Triggers>
<Principals>
<Principal id="Author">
<UserId>S-1-5-21-4053500361-574701572-2713609324-1001</UserId>
<LogonType>InteractiveToken</LogonType>
<RunLevel>LeastPrivilege</RunLevel>
</Principal>
</Principals>
<Settings>
<MultipleInstancesPolicy>IgnoreNew</MultipleInstancesPolicy>
<DisallowStartIfOnBatteries>true</DisallowStartIfOnBatteries>
<StopIfGoingOnBatteries>true</StopIfGoingOnBatteries>
<AllowHardTerminate>true</AllowHardTerminate>
<StartWhenAvailable>false</StartWhenAvailable>
<RunOnlyIfNetworkAvailable>false</RunOnlyIfNetworkAvailable>
<IdleSettings>
<Duration>PT10M</Duration>
<WaitTimeout>PT1H</WaitTimeout>
<StopOnIdleEnd>true</StopOnIdleEnd>
<RestartOnIdle>false</RestartOnIdle>
</IdleSettings>
<AllowStartOnDemand>true</AllowStartOnDemand>
<Enabled>true</Enabled>
<Hidden>false</Hidden>
<RunOnlyIfIdle>true</RunOnlyIfIdle>
<WakeToRun>true</WakeToRun>
<ExecutionTimeLimit>PT0S</ExecutionTimeLimit>
<Priority>7</Priority>
<RestartOnFailure>
<Interval>PT1M</Interval>
<Count>3</Count>
</RestartOnFailure>
</Settings>
<Actions Context="Author">
<Exec>
<Command>C:\ProgramData\Anaconda3\python.exe</Command>
<Arguments>D:\MY-OBSIDIAN-DATA\my_auto_task\github_private_repo_push.py</Arguments>
<WorkingDirectory>D:\MY-OBSIDIAN-DATA\</WorkingDirectory>
</Exec>
</Actions>
</Task>
现在,我再也不用耗费心力记住自己是否往 github 上提交私有仓库的数据备份,因为它已经被设定了自动执行。
笑来老师最近说到,同样的智能设备,在不同人手中发挥的作用截然不同。痴迷于熟悉自己的生产工具并提高生产效率,总归是件好事。希望我的分享带给你一点启发。