WWW'16(高维数据可视化)-Visualizing Larg

2023-08-17  本文已影响0人  Caucher

标题:大规模高维数据可视化
作者来自MSRA
代码开源好用:https://github.com/lferry007/LargeVis

编者的总结

  1. 类似t-SNE,本文以KNN图捕捉原始数据分布,但目标函数没有采用KL散度,但含义是类似地,只是更好地帮助训练,达成更快的速度和更稳定的参数。
  2. 对于相似度的度量主要是L2距离,无论在高维或者低维,不清楚在其他度量空间上是否有效。
  3. 相比于t-SNE,降维速度和参数稳定性有很大提升,但是仍然比较慢,测试1M,8线程要2-3个小时左右。

ABSTRACT

1. INTRODUCTION

image.png

3. LARGEVIS

3.1 Efficient KNN Graph Construction

这一部分没什么好说的,KNN-graph用最新的技术去做就可以了。
本文采用的是用树来初始化knn-graph,用nn-descent来refine的过程,和effana比较像。树的分裂是随机选两个点,取中间平面进行分割。

3.2 A Probabilistic Model for Graph Visualization

首先KNN图边的权重和t-SNE的设计一样:


image.png
上一篇 下一篇

猜你喜欢

热点阅读