CS224W 学习笔记

CS224W-图神经网络 笔记1:Introduction :

2021-02-01  本文已影响0人  Epiphron

本文总结之日CS224W Winter 2021只更新到了第四节,所以下文会参考2021年课程的PPT并结合2019年秋季课程进行总结以求内容完整
课程主页:CS224W: Machine Learning with Graphs
视频链接:【斯坦福】CS224W:图机器学习( 中英字幕 | 2019秋)

1 引言

这篇是CS224W 图机器学习笔记的第一篇,本笔记主要梳理课程的关键点,以及一些图相关的基本概念。

1.1 为什么要研究网络

  1. 图/网络 无处不在。
  2. 跨领域。图在不同研究领域都有应用,如计算机科学、社会学、经济学等等。
  3. 数据丰富。
  4. 有前景。社交网络分析,药物开发,AI推理等

1.2 网络分析主要研究方向(场景)

老师在课程中ppt中给了很多现实例子。总之,学了很有用就对了!!

图片

2 图的基础知识

为了研究这些,需要有系统(system) -> 图(Graph)的建模的过程。

先需要一些网络/图论基本知识

2.1 图的定义

  • A network is a collection of objects where some pairs of objects are connected by links
  • 网络是互连成对的节点的集合。

网络是一种描述复杂系统中实体关联的通用语言。是一种通用的数据结构。它表示了成分之间的联系.

图片

图的数据表示G(N,E) G是图,V是节点,E是边。上面既有图,又有网络,那它们之间的区别是什么呢?

2.2 网络(Network)与图(Graph)之间区别

很多时候,并不太严格区分。

2.3 网络的粗分类(不严格)

网络大致可分为两类,有时它们的界线并不那么明显。

第一类可以看做是自然网络,比如社会网络、社交网络、蛋白质图谱、基因图谱等。

第二类就是各种信息汇聚成为的网络,如知识图谱,相似网络(similarity netoworks)等等。如基于地址相似度构建的地址网路。

2.4 图论中图的分类

图的分类:

2.4.1 根据边的方向

图片

补充概念——度(degree)

定义:连接节点i的边的数量,称为节点i的度(数)

上左图的无向图中节点a的度为4.

对于有向图,节点i的度分为

平均度 avg degree:衡量图的稠密性。等于所有节点度的平均。

从图的邻接矩阵来看

图片

2.4.2 根据边是否有权重

  1. 无权图,权重为1**
  2. 加权图

2.4.3 根据节点连接方式

- 补充概念——二部图的折叠 (Projection/Folded)
  也就是将异质的二部图图,变成同质图。

2.3 图数学的表示

这部分在代码篇再详细展示。这里只做简单介绍。虽然课程老师推荐使用官方的SNAP包,进行实操。但是因为之前主要用的还是networkx,为了降低学习成本。动手部分就采用 networkx了,这些部分代码,可以在下面的github链接获得。

https://github.com/wanghaodi/Graph_ML

2.4 图的连通性

2.4.1 对于无向图

2.4.2 对于有向图

最后放一张,现实中的不同系统中网络的统计信息再次,说明网络的稀疏性!

图片

3 参考文章

上一篇下一篇

猜你喜欢

热点阅读