什么值得看 | 最新论文、硬核项目、优质资源
以下文章来源于NewBeeNLP ,作者kaiyuan
NewBeeNLP
永远有料,永远有趣
哈喽朋友们,欢迎来到本期『什么值得看』,如果你还不知道这是干啥的,可以戳往期内容:
什么值得看 | 0102——0109
什么值得看 | 0110——0116
每周日定期分享,内容可能会比较多比较杂,仅供参考,善用你的人脑过滤系统
微信文章不允许直接外链跳转,所以大家看到感兴趣的内容,直接去文末找链接即可。希望 NewBeeNLP 的读者可以接触到更多更有料的内容
当然,如果你想分享自己的超赞项目,随时与我联系喔!
Papers
Towards Understanding Ensemble, Knowledge Distillation, and Self-Distillation in Deep Learning
Learning to Augment for Data-Scarce Domain BERT Knowledge Distillation
Is Attention Better Than Matrix Decomposition
A Unifying Generative Model for Graph Learning Algorithms: Label Propagation, Graph Convolutions, and Combinations
GENIE: A Leaderboard for Human-in-the-Loop Evaluation of Text Generation
What Makes Good In-Context Examples for GPT-3?
Can a Fruit Fly Learn Word Embeddings?
Blogs
Transformers的遍地开花:十个新应用[1]
深度学习的三个秘密:集成、知识蒸馏和自蒸馏[2]
Keras实例:概率贝叶斯神经网络[3]
Keras实例:Vision Transformer图像分类[4]
2020年十篇有趣的深度学习/机器学习论文[5]
2020机器学习与自然语言处理亮点回顾[6]
应用机器学习线性代数Python实战入门[7]
ICLR 2021接收论文统计[8]
Bash手册(中文)[9]
《PyTorch深度学习》点评:聚焦计算机视觉、结构有趣的深度学习实用指南[10]
Educational
哈佛大学《数据科学:概率》[11]
开源书《数据工程》[12]
等变神经网络文献列表[13]
视频描述生成相关文献列表[14]
Tools & Github
50个机器学习/数据科学最佳开放数据集[15]
Financial Timeseries Patterns library:金融时序模式库[16]
fpdf2:Python简单PDF生成库[17]
基于Unilm模型的夸夸式闲聊机器人[18]
Superset:商用级数据可视化和数据探索平台[19]
Python流可视化脚本运行环境[20]
FACET:人工可解释AI库[21]
无人驾驶相关资源大列表[22]
Python Autocomplete:基于Transformer和LSTM的Python代码自动补全[23]
贝壳找房-房产行业聊天问答匹配比赛第一名方案[24]
CC-Aligned:137种语言的网页文档平行语料库[25]
BioGrakn:生物医学数据知识图谱集[26]
LabML Neural Networks:带有分析笔记的深度学习论文复现集[27]
NNI 2.0发布:微软的开源轻量AutoML包[28]
本文参考资料
[1]Transformers的遍地开花:十个新应用: https://paperswithcode.com/newsletter/3
[2]深度学习的三个秘密:集成、知识蒸馏和自蒸馏: https://www.microsoft.com/en-us/research/blog/three-mysteries-in-deep-learning-ensemble-knowledge-distillation-and-self-distillation/
[3]Keras实例:概率贝叶斯神经网络: https://keras.io/examples/keras_recipes/bayesian_neural_networks/
[4]Keras实例:Vision Transformer图像分类: https://keras.io/examples/vision/image_classification_with_vision_transformer/
[5]2020年十篇有趣的深度学习/机器学习论文: https://qiita.com/shionhonda/items/ca859d68b1ee8edcf0fb
[6]2020机器学习与自然语言处理亮点回顾: https://ruder.io/research-highlights-2020/
[7]应用机器学习线性代数Python实战入门: https://pabloinsente.github.io/intro-linear-algebra
[8]ICLR 2021接收论文统计: https://github.com/sharonzhou/ICLR2021-Stats
[9]Bash手册(中文): https://github.com/denysdovhan/bash-handbook/blob/master/translations/zh-CN/README.md
[10]《PyTorch深度学习》点评:聚焦计算机视觉、结构有趣的深度学习实用指南: https://sebastianraschka.com/blog/2021/pytorch-deeplearning-review.html
[11]哈佛大学《数据科学:概率》: https://www.edx.org/course/data-science-probability
[12]开源书《数据工程》: https://github.com/oleg-agapov/data-engineering-book
[13]等变神经网络文献列表: https://github.com/Chen-Cai-OSU/awesome-equivariant-network
[14]视频描述生成相关文献列表: https://github.com/tgc1997/Awesome-Video-Captioning
[15]50个机器学习/数据科学最佳开放数据集: https://medium.com/towards-artificial-intelligence/the-50-best-public-datasets-for-machine-learning-d80e9f030279
[16]Financial Timeseries Patterns library:金融时序模式库: https://github.com/tr8dr/tseries-patterns
[17]fpdf2:Python简单PDF生成库: https://github.com/PyFPDF/fpdf2
[18]基于Unilm模型的夸夸式闲聊机器人: https://github.com/liucongg/UnilmChatchitRobot
[19]Superset:商用级数据可视化和数据探索平台: https://github.com/apache/superset
[20]Python流可视化脚本运行环境: https://github.com/leon-thomm/Ryven
[21]FACET:人工可解释AI库: https://github.com/BCG-Gamma/facet
[22]无人驾驶相关资源大列表: https://github.com/daohu527/awesome-self-driving-car
[23]Python Autocomplete:基于Transformer和LSTM的Python代码自动补全: https://github.com/lab-ml/python_autocomplete
[24]贝壳找房-房产行业聊天问答匹配比赛第一名方案: https://github.com/xv44586/ccf_2020_qa_match
[25]CC-Aligned:137种语言的网页文档平行语料库: http://www.statmt.org/cc-aligned/
[26]BioGrakn:生物医学数据知识图谱集: https://github.com/graknlabs/biograkn
[27]LabML Neural Networks:带有分析笔记的深度学习论文复现集: https://github.com/lab-ml/nn
[28]NNI 2.0发布:微软的开源轻量AutoML包: https://github.com/microsoft/nni
如果喜欢请点赞,或关注我交流