Github 2019 年最值得关注的数据科学项目 Virgil
项目地址:https://github.com/clone95/virgilio
目前为止: [7,128] star [1,303] fork,希望你看到之后能给它添加一个 star 。
这个项目首次提交在 2019 年 3 月 12 日,原名叫https://github.com/clone95/Data-Science-Study-Paths-March-2019,一个月的时间就有 6k+ 个 star,经常排在 http://github.com/explorer 的前几位。当然最近被榜单被 996icu 占了。
关于项目改名:
Virgilio.png项目作者把项目名改成维吉尔(Virgilio),这是 13 世纪末意大利诗人但丁所著长诗《神曲》中旦丁的导师。
这是什么地方?
通过互联网进行学习意味着在无限的混乱信息丛林中游泳,在快速变化的创新领域更是如此。
当你试图接近一个没有真正 “路径” 的新主题时,你有没有感到不知所措?你是否妨碍获得深厚的知识和应用它的能力?
嗨,我是 维吉尔(Virgilio) 。
就像几年前我和 但丁(Dante) 一样,在你的互联网旅程中,我将成为你的导师和参考点,为你提供完整的有机学习途径,包括多个领域,工具,技能等。
我是怎么做到的?
我试图简明扼要,以避免信息开销。
我按层次结构和复杂程度组织了内容,以便你对事物的运作方式有一个连贯的想法。
你将学习如何通过实践项目理解和应用理论,并仔细遵循我的提示和技巧,你将从头开始掌握新技能。
你不需要任何先前的主题知识,但对编程和高中数学有信心,以理解和实现大多数概念。
此处列出的每个来源都是免费或开源的。
我最感兴趣的是数据科学,因为我试图预测耶路撒冷的陨落,但是你知道,那时我们没有那么多的计算能力!
你能在这里找到什么?
我为你打包了几种类型的指南:
- 职业:完整的学习路径,指导你从头开始掌握新技能。
- 主题:关于由子领域组织的特定主题,方法和现实应用的综合指南。
- 专业化:个人技能的垂直指南。
- 工具:单一工具或技术的深入指南。
- 研究:对最新论文和技术文件的最新审查和解释。
- 元(Meta):这些主要是关于如何学习和接近新概念的指南。
如果你发现此 repo 有用,我请你 star 一下,与你的朋友和同事分享,然后点击 watch,因为每天都会有更新!
我的目的是什么?
我的目标主要是帮助人们开始使用创新的领域和技术,即使你从未尝试过编写代码,或者你需要深入的数学评介,我也会给你这样的基础。因此,你可以成为一名学生,另一个领域的工作人员或经理,你将在这里找到你需要做好准备,以应对未来几年肯定会发生的破坏性和不可预测的市场和社会转型。
我的价格:我在这里等你,免费。如果你发现我在某种程度上有所帮助,我只要求你留下一个 star ,点击 watch,每次你有机会时请分享我。让我们开始我们的旅程!
新接触数据科学?
基础 Python
基础数学 - 即将推出
高级 Python - 即将推出
高级数学 - 即将推出
Python 数据科学
数学数据科学 - 即将推出
完整的学习路径
机器学习研究路径
商业智能研究路径 - 即将推出
云计算研究路径 - 即将推出
专业化
数据预处理
数据收集 [即将推出 - 下一步]
数据可视化 [即将推出]
有效沟通 [即将推出]
有效陈述 - 新
实用决策 [即将推出]
工具
Latex
Wolfram Alpha
GeoGebra
正则表达式
即将推出
主题
DialogFlow 和 Flask 打造 ChatBot
研究
Zotero
最新论文 [即将推出]
关于专业化
你可以按顺序选择它们或选择最适合你的那个,但我建议你至少要一次把它们都看完。
我计划了两种类型的专业化:硬技能和软技能
前者是关于技术流程,是每个处理数据的人的核心工具包。使用数据是一种艺术形式,经验法则和最佳实践将帮助你了解处理它们的方式。你需要对如何处理数据产生一种 “感觉”,这种 “感觉” 主要是由情况和经验驱动的。因此,这些专业将强烈关注练习和练习。
后者是关于... 所有未写在技术书籍中的东西。使用和掌握它们,因为它们是你真正的价值促成者。你可以成为世界上最好的开发人员或工程师,但如果你无法向受众传达你的建议和发现,或者使用数据来建议现实世界中的实际行动,那么你对公司来说就毫无用处。
关于主题
单个主题将按字段分割,它们可以触及实际应用程序,方法,技术栈,最佳实践等。
关于工具
“工具” 部分将提供有关你需要了解的特定技术 / 语言 / 方法的所有指南!它们将为你提供彻底探索和掌握手头工具的方法。
订阅我们新闻发布和更新的FACEBOOK组
翻译人员
@jiaxianhua (iOSDevLog)
在我准备翻译之前就已经有中国人准备翻译成中文,后来共有 4 个中国人想要翻译成中文。
我们重新建了一个 https://telegram.org/ 中文聊天群 Virgilio_cn,并把 @Clone95 拉进群,准备我们的翻译计划。
一开始人打算可以使用有团队协作功能的 蚂蚁笔记 Leanote,它具有以下特性。
- Markdown 编辑器
实时同步预览,你只需使用键盘专注于书写文本内容,就可以生成印刷级的排版格式。 - 详细历史纪录
每次保存都在后端备份,轻松查找,一键恢复。 - 实时同步 - 云协作版
丰富的团队权限管理完整的文档树型结构
支持Docker,私有云部署实时IM群聊讨论
最重要的是它是开源的:https://github.com/leanote
于是我把它部署在服务器。
后来 @Clone95 找到了 WebLate。
Weblate 是一个基于网络自由软件持续本地化系统。
WebLate这个也是开源的,我把它也部署在服务器上http://67.218.132.50/。
部署过程:https://www.jianshu.com/p/f3cd7dfd48d1
Weblate 支持多种翻译格式,我选择把 md 文件改换成 xliff 再上传。
Weblate 还支持机器翻译https://docs.weblate.org/en/latest/admin/machine.html。
大多数翻译 API 要收费,也包括流行的 Google Translate。最终我选用了 Baidu API machine translation ,每月翻译字符数低于200万,享免费服务;超过200万字符,需按照49元人民币/百万字符支付当月全部翻译字符数费用(包括之前免费的200万字符)。
转换几个文件后,翻译群里的小伙伴们就开始翻译。之后又发现 Xliff 要把 md 文件里的 "<>&" 这些符号替换成占位符。好麻烦,还不如直接用 json 格式。
转换方式:https://www.jianshu.com/p/323a5d033767
最终还是用 google translate api 直接翻译 md 文件。
转换过程:https://www.jianshu.com/p/5835eb34cbb1
用 vscode 一边英文,一边中文对照着改通顺。
vscode.png翻译中肯定有许多不专业的地方,特别是 WolframAlpha 的翻译,请大家将不准确的地方提出,或者加入我们的 Telegram / 微信翻译群。
微信公众号:AI开发日志(AIDevLog)
AI开发日志最后还是请大家 star 并分享给你的好友们!