缘界信闻录第一期

2022-08-27  本文已影响0人  可能性之兽

受到阮一峰大佬和王诗翔大佬,还有北野茶缸子的启发,又看了看自己堆积如山,基本懒得回头看的收藏夹,决定开一个更混乱的,不怎么分类的互联网漫游周刊。。。嗯嗯,我给自己挖了多少个坑?3D百文和论文图鉴还没有弄完。。这个也会在wechat公众号更新。不过,相比于wechat,会少一点东西

生信爱好者周刊 | weekly (shixiangwang.github.io)
科技爱好者周刊(第 219 期):如何防止帐号被黑 - 阮一峰的网络日志 (ruanyifeng.com)

机器学习资源

区区几行Python代码,就能实现全面自动探索性数据分析! (qq.com)

探索性数据分析是数据科学模型开发和数据集研究的重要组成部分之一。在拿到一个新数据集时首先就需要花费大量时间进行EDA来研究数据集中内在的信息。自动化的EDA Python包可以用几行Python代码执行EDA。在本文中整理了10个可以自动执行EDA并生成有关数据的见解的Python包,看看他们都有什么功能,能在多大程度上帮我们自动化解决EDA的需求。

提高数据科学效率的8个Python神库! (qq.com)

用于特征选择和超参数调整的库。

torchhandle是一个PyTorch的辅助框架。它将PyTorch繁琐和重复的训练代码抽象出来,使得数据科学家们能够将精力放在数据处理、创建模型和参数优化,而不是编写重复的训练循环代码。使用torchhandle,可以让你的代码更加简洁易读,让你的开发任务更加高效。

非负矩阵分解

机器学习:降维技术之NMF(非负矩阵分解) (qq.com)
R语言实现非负矩阵分析 - 腾讯云开发者社区-腾讯云 (tencent.com)

生信算法

Nat. Methods | scBasset:基于DNA序列的单细胞ATAC-seq卷积神经网络建模 (qq.com)

作者提出了一种基于DNA序列的卷积神经网络方法(scBasset)来对scATAC数据进行建模。实验表明,通过利用可及性峰值下的DNA序列信息和神经网络模型的表达能力,scBasset在scATAC和单细胞多组数据集的各种任务中展现了最先进的性能,包括细胞类型识别、scATAC去噪、数据集成和转录因子活性推断。

image.png

自组织基因组: 基因组结构和功能原理 P1 (qq.com)

image.png

bioRxiv | Verkko:二倍体染色体的端粒到端粒组装 (qq.com)

端粒到端粒联盟最近组装了第一个真正的人类基因组完整队列。为了解决最复杂的重复序列情况,该项目依赖于手动集成超长牛津纳米孔测序读取与高分辨率装配图从长期建立,准确的 PacBio HiFi 读取。我们已经在 Verkko 改进并自动化了这一策略,这是一个迭代的、基于图的管道,用于组装完整的二倍体基因组。Verkko 从一个多重 de Bruijn 图开始,该图由长时间、精确的读取构建而成,并通过集成超长读取和单体型特定标记逐步简化了该图。其结果是两种单倍型分阶段的二倍体组装,许多染色体从端粒自动组装到端粒。在 HG002人类基因组上运行 Verkko 导致46个二倍体染色体中的20个组装成无间隙,准确率为99.9997% 。二倍体基因组的完整组装是构建全面的 pangenome 数据库和染色体尺度比较基因组学的关键一步。

image.png

Nature | 首张人类免疫系统物理连接图 (qq.com)

开发了可扩展的阵列多价细胞外相互作用筛选 (SAVEXIS)方法,并建立一个交互式多组织单细胞图谱,可以推断全身免疫相互作用,揭示多细胞网络中新的相互作用和枢纽的潜在功能。
A physical wiring diagram for the human immune system - PMC (nih.gov)

image.png
上一篇 下一篇

猜你喜欢

热点阅读