机器学习读论文程序员

CNCC2017中的深度学习与跨媒体智能

2017-12-04  本文已影响61人  梦里茶

转载请注明作者:梦里茶

目录

正片开始

传统方法与深度学习

图像分割

图像分割是医疗图像中一个很重要的任务,通常分为分割,配准,可视化几个子任务。这里贴一张广义的图像分割的图:

p3-segment.jpg

存在的困难:

常用分割步骤

检测(定位)-> 边界寻优

常用分割方法

语音前沿技术

任务

降噪,增强,杂音分离,消除回响

结合领域知识和DNN

移动端语音挑战

模型压缩,轻量化

生成模型

基于贝叶斯的视觉信息编解码

任务

模型(基于卷积和反卷积的自编码器)

多视图生成式自编码器

除了视觉数据之外,还有其他模态的数据,可以根据多个模态的数据构建多视图的生成时自编码器

珠算:基于贝叶斯推断的深度生成模型库

任务

大数据中有许多不确定因素,需要学习对不确定性建模

模型

p9_zhusuan.png

给定一个输入z,用神经网络学习变量x的分布的参数(均值和方差),约束生成样本与真实样本的相似性

有约束的GAN

p10_gan.png

在GAN的基础上,加一个分类器C,对生成器G生成的对象加中间约束,使得生成的对象更符合实际需求,比如生成不同姿态的人脸,要求不同人的人脸尽量不同,同个人的人脸尽量相同。

珠算

图像与视频生成的规则约束学习

景深风景生成

骨架约束的人体视频生成

视频检索的哈希学习

Learning Multifunctional Binary Codes for Both Category and Attribute Oriented Retrieval Tasks

视频检索基于图像检索,大规模图像检索对性能要求较高

p17_hash.png

多媒体与知识图谱

Cross-media analysis and reasoning: advances and directions

基于锚图的视觉数据分析

视频问答

细粒度分类

基于模型动态扩容的增量深度学习方法

论文:Error-Driven Incremental Learning in Deep Convolutional Neural Network for Large-Scale Image Classification

局部两级注意力深度模型

The Application of Two-level Attention Models in Deep Convolutional Neural Network for Fine-grained Image Classification

给定图片-类别,不给出对象位置(bounding box)和局部的位置(part location),用Attention学习对象位置和局部特征

p25_object.png p25_local.png

空间约束的显著性部件选择模型

Weakly Supervised Learning of Part Selection Model with Spatial Constraints for Fine-grained Image Classification

上面两篇都是不需要局部组件的标注,就学到了局部的特征和约束

显著性引导的细粒度辨识性定位方法

Fine-grained Discriminative Localization via Saliency-guided Faster R-CNN

结合分类模型和检测模型做更高精度的细粒度分类

p27_rcnn.png

视觉文本联合建模的图像细粒度表示

Fine-grained Image Classification via Combining Vision and Language

p28_vt.png

跨媒体关联与检索

这里的六篇论文我还没读完,读完之后补具体的理解

跨媒体关联传递方法

IJCV2013: Exhaustive and Efficient Constraint Propagation

基于稀疏和半监督的统一表征方法

Learning Cross-Media Joint Representation With Sparse and Semisupervised Regularization

基于跨媒体语义单元的统一表征方法

Semi-Supervised Cross-Media Feature Learning with Unified Patch Graph Regularization

基于跨媒体多深度网络的统一表征方法

Cross-media Shared Representation by Hierarchical Learning with Multiple Deep Networks

基于多粒度层级网络跨媒体关联学习方法

CCL: Cross-modal Correlation Learning with Multi-grained Fusion by Hierarchical Network

跨媒体混合迁移网络方法

Cross-modal Common Representation Learning by Hybrid Transfer Network, IJCAI2017

跨媒体检索数据集PKU-XMedia

上一篇下一篇

猜你喜欢

热点阅读