视频目标分割任务和语义分割有两个基本区别:
1.视频目标分割任务分割的是一般的、非语义的目标;
2.视频目标分割添加了一个时序模块:它的任务是在视频的每一连续帧中寻找感兴趣目标的对应像素。
上图是Segmentation的细分,其中的每一个叶子都有一个示例数据集。
基于视频任务的特性,我们可以将问题分成两个子类:
无监督(亦称作视频显著性检测):寻找并分割视频中的主要目标。这意味着算法需要自行决定哪个物体才是“主要的”。
半监督:在输入中(只)给出视频第一帧的正确分割掩膜,然后在之后的每一连续帧中分割标注的目标。
视频理解中的三大基础领域:动作识别(Action Recognition)、时序动作定位(Temporal Action Localization)和视频 Embedding。
https://mp.weixin.qq.com/s/ATKmdw50V50_gczEVfIZSw
视频理解综述:动作识别、时序动作定位、视频Embedding
http://mp.weixin.qq.com/s/pGrzmq5aGoLb2uiJRYAXVw
一文概览视频目标分割
https://www.zhihu.com/question/52185576
视频中的目标检测与图像中的目标检测具体有什么区别?
https://mp.weixin.qq.com/s/0NpTiwNRpd92mFCtXw1oQw
CVPR 2019视频描述(video caption)相关论文总结
https://mp.weixin.qq.com/s/nZVIVJ9z0AWA8VFouNpafg
深度学习之视频摘要简述
https://mp.weixin.qq.com/s/z1APyCxlOEPHn48OeJAHkQ
基于深度学习的视频内容识别
https://mp.weixin.qq.com/s/XFlcGZRrxmmUDZXg-ijFDA
视频识别SOTA模型都在这了—PySlowFast! Facebook AI Research开源视频理解前沿算法代码库
https://mp.weixin.qq.com/s/ovjoHCcR1xYb9N6kyFJUTg
视频广告段落检测——从一个偏门说计算机视觉的发展历史
https://mp.weixin.qq.com/s/iqLHjbmLOmvfEeEUB_SqSA
计算机视觉视频理解领域的经典方法和最新成果
https://mp.weixin.qq.com/s/lBu1q5Pyw9dZIxSYXUp2pw
视频语义分割介绍
https://mp.weixin.qq.com/s/qtRV9Sb54o8TnDEhLlB69Q
基于视频的目标检测的发展
https://zhuanlan.zhihu.com/p/59915784
Video Action Recognition的近期进展
https://mp.weixin.qq.com/s/k4Ilj11wbuj5oIXLHo-5ew
《视频目标分割与跟踪》最新39页综述论文
https://mp.weixin.qq.com/s/GCCqIm4Q7UfUhhiqFbBS3g
Pytorch视频分类教程
https://mp.weixin.qq.com/s/ua8V2g2uZAditKui-IcoKw
物体检测算法在视频中的应用
https://mp.weixin.qq.com/s/pfAVyS_JQLqsXLYdX2m8IQ
基于深度学习的视频目标检测综述
https://mp.weixin.qq.com/s/NcA178JxgZLrAE1efBG2dA
深度神经网络在视频编码中的应用
https://mp.weixin.qq.com/s?__biz=MzU2OTA0NzE2NA==&mid=2247515277&idx=1&sn=e6466ace50c46b66824747c79ea4d6f1
视频摘要最新综述文章
https://blog.csdn.net/sinat_35177634/article/details/89601950
CVPR 2019视频描述(video caption)相关论文总结
https://zhuanlan.zhihu.com/p/91986833
视频综合理解:行为识别、场景识别以及视频综述
https://mp.weixin.qq.com/s/noljXreGfoMfiZb_n90R3w
模仿人类的印象机制,商汤提出精确实时的视频目标检测方法
http://mp.weixin.qq.com/s/-Av3-ZNi6UGlKNv_jduAeQ
微软新论文:如何利用深度特征流提高视频识别准确率?
https://mp.weixin.qq.com/s/WMakTEN68KPi7X9kMQetiw
OpenAI:3段视频演示无人驾驶目标检测强大的对抗性样本!
https://mp.weixin.qq.com/s/j5YPHYEPioLiEIDc6lK3kA
在线视频衣物精确检索技术,开启刷剧败明星同款时代
https://mp.weixin.qq.com/s/CXKuSMi0Vd43BGDf5BgoqA
弱监督视频物体识别新方法:香港科技大学联合CMU提出TD-Graph LSTM
https://mp.weixin.qq.com/s/7ccEaDRngVo42OSU6FBlVg
从视频到语句,优必选获TRECVID 2017子任务冠军
https://mp.weixin.qq.com/s/XorPkuIdhRNI1zGLwg-55A
斯坦福新深度学习系统NoScope:视频对象检测快1000倍
https://mp.weixin.qq.com/s/7w5nYWfZO-YOJ4cA47kQXg
无监督视频物体分割新思路:实例嵌入迁移
https://mp.weixin.qq.com/s/PhMPa-e4sbzqWKmFzRZE4Q
实时替换视频背景:谷歌展示全新移动端分割技术
https://mp.weixin.qq.com/s/0JgwBizaCwvPP9TfLKTang
密歇根大学&谷歌提出TAL-Net:将Faster R-CNN泛化至视频动作定位中
http://mp.weixin.qq.com/s/LAgDobWyK0SOH08GCLXG7A
减少30%流量,增加清晰度:MIT提出人工智能视频缓存新算法
https://mp.weixin.qq.com/s/_ZmbwM-lmS0o2DjAAc_TWQ
美图云+中科院AAAI2018:视频语义理解的类脑智能NOASSOM
https://mp.weixin.qq.com/s/LzKsD_vFlA1n-TYOGJkDZg
商汤科技开源DAVIS2017视频目标分割冠军代码
https://mp.weixin.qq.com/s/FiAju9F_MWexstP7FrIquw
凭一张照片找到视频中你所有的镜头,包括背影
https://mp.weixin.qq.com/s/3H0ZJjnPsh1BzALmG0W7og
DAVIS2017视频目标分割冠军代码开源了
https://mp.weixin.qq.com/s/ZqnfSL6U5E9NzE15QMdxtg
腾讯AI Lab提出视频再定位任务,准确定位相关视频内容
https://mp.weixin.qq.com/s/6MXLtUDi_idMYqbHARkbcg
港中文林达华团队提出计算机视觉新方向:电影情节分析
https://mp.weixin.qq.com/s/Np4xyvPrncd7MJ9q1WShBA
Python视频深度学习:计算任意影片中所有演员出镜时间
https://mp.weixin.qq.com/s/Nt4QLX_lbHhszb8fFlmOLA
DeepVS:基于深度学习的视频显著性方法
https://mp.weixin.qq.com/s/NgsSQS6opjOsusTIr9Vx-w
腾讯AI Lab、MIT等机构提出TVNet:可端到端学习视频的运动表征
https://mp.weixin.qq.com/s/26OZ5sLK3floF8I1SNIKuA
时空建模新文解读:用于高效视频理解的TSM
https://mp.weixin.qq.com/s/TzNqZNEPBewR7neU7Or9nQ
更侧重工业的应用:PRCV2018美图短视频实时分类挑战赛冠军技术方案
https://mp.weixin.qq.com/s/MzVPesFK0vJ1UuQPPSSN2w
百度、MIT等提出StNet:局部+全局的视频时空联合建模
https://mp.weixin.qq.com/s/UeQc3orm2ooZ5zlvrSLzOw
视频内容理解在Hulu的应用与实践
https://mp.weixin.qq.com/s/syZObdxjPv6jq3B_mgP9Sw
拒绝“不可描述”!爱奇艺短视频软色情识别技术解析
https://mp.weixin.qq.com/s/8YpyfdhDypSZOP3dQegQdQ
谷歌大脑提出基于流的视频预测模型,可产生高质量随机预测结果
https://mp.weixin.qq.com/s/-FF3tuEB2V8RlQCjQhu5Bg
人大ML研究组提出新的视频测谎算法
https://mp.weixin.qq.com/s/T-Rg9xLfdYmV8bJESK0h8g
快速端到端嵌入学习用于视频中的目标分割
https://mp.weixin.qq.com/s/pKSrokV_j8Repa-JMloUHg
Google又发大招:高效实时实现视频目标检测
https://mp.weixin.qq.com/s/ySAfdII8291hvTxUBtE5qA
详解爱奇艺ZoomAI视频增强技术的应用
https://mp.weixin.qq.com/s/l6WMJnrGNNK4A1cTD2drcg
视频跟踪新思路,完全无需手工标注。这是一篇Visual Tracking和Optical Flow Estimation相互结合的论文
https://mp.weixin.qq.com/s/NQSJvlcjOAoIZjI2cgjhkw
谷歌AI:根据视频生成深度图,效果堪比激光雷达
https://mp.weixin.qq.com/s/fxKHMVRYCR9CycifjEnArQ
视频显著性目标检测
https://mp.weixin.qq.com/s/oSoCIAEF78iKIxLxj2H1mA
基于光流的视频目标检测系列文章解读
https://mp.weixin.qq.com/s/1tcoGGbJnnWARu-2wefWdQ
不同视角构造cycle-consistency,降低视频标注成本
https://mp.weixin.qq.com/s/pDMBnX3CeQbv8hr-79Mvvg
商汤EDVR算法获NTIRE 2019视频恢复比赛全部四项冠军
https://mp.weixin.qq.com/s/BtIYc7SSi0E6mT3muV6NhQ
视频编辑利器,不喜欢就框除!开源视频物体移除软件video object removal
https://mp.weixin.qq.com/s/YwZijgTbhd2ILiVxug1dWg
框一下就能从视频隐身,这是现实版的“隐身衣”?
https://zhuanlan.zhihu.com/p/73599727
基于深度学习的视频帧内插技术
https://mp.weixin.qq.com/s/PnDjXF_ZPYPJ3cgZ_w6v-g
视频分类/行为识别网络和数据集上新
https://mp.weixin.qq.com/s/cNvQy4MW9vHTbUPsrqnUdA
视频PS神器!人物隐身、水印去除,简直像重拍了一遍,这项登上CVPR的研究刚刚开源了
https://mp.weixin.qq.com/s/umLqkfSDCBUGaEa0yygAIw
有了这款DVD-GAN,DeepMind就生成了逼真视频
https://mp.weixin.qq.com/s/7ygF4zxZxp0Iz7KRDdWebg
R-C3D视频活动检测
https://mp.weixin.qq.com/s/N6nL9D1wjsBNzxedXX3qNQ
Hulu在视频内容理解上的应用和最佳实践
https://mp.weixin.qq.com/s/0z6jrEYTdIUSOYzW3gA9FQ
ActivityNet 挑战赛冠军方案—时序动作提名,边界匹配网络详解
https://mp.weixin.qq.com/s/r47N4HVAydNeBOTtP-iruQ
阿里文娱资深算法专家:视频物体分割算法的三个方向与最新应用
https://zhuanlan.zhihu.com/p/75444151
时序动作提名:边界匹配网络详解
https://mp.weixin.qq.com/s/8x1ne425aRb2aqP8dSrClg
玩王者荣耀用不好英雄?两阶段算法帮你精准推荐精彩视频
https://mp.weixin.qq.com/s/YL08krIuf0WOz8KsoBYhew
25个视频神同步,还能给视频声音移花接木,谷歌开源最新自监督算法
https://mp.weixin.qq.com/s/THUjd-wXI6_57mdw4XfYUQ
商汤-港中文MMLab开源图像视频超分辨率工具箱MMSR
https://zhuanlan.zhihu.com/p/209133135
基于深度学习的视频超分辨率技术:全面调研(2015-2020)
https://mp.weixin.qq.com/s/9YSO1RW8mgyihrZWbEe20w
视频超分辨率研究方法
https://mp.weixin.qq.com/s/XZ-fn_Xd7vVoLiVr6Esb3g
Ranking Attention-适用于视频分割的全新Attention机制
https://zhuanlan.zhihu.com/p/79719747
Super SloMo,基于光流和U-Net的视频插值
https://mp.weixin.qq.com/s/8uxeOqcUvnZcKHv7qXwWJQ
如何在视频里任意抠图?阿里工程师做到了!
https://mp.weixin.qq.com/s/HHS888HA0slvjkkkI8HU8w
字节实习生开发的AI,实现4K60帧视频实时抠图
https://zhuanlan.zhihu.com/p/83604007
Deep Burst Denoising/RFCN
https://mp.weixin.qq.com/s/dl8kbhKUCHzwJ-5lSv6VMw
高清彩色开国典礼将上映:技术加持之下,历史不会褪色
https://mp.weixin.qq.com/s/-lNM3bVxK8YtmPWdXpSf5A
UC信息流视频标签识别技术
https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247508659&idx=1&sn=77bd5db94ffc7737d937e9b2cbda84cf
快手王华彦:端上视觉技术的极致效率及其短视频应用实践
https://mp.weixin.qq.com/s/JahD1ON5ym0_ldc7MiJz7A
让视频里的你完全消失,Adobe最新SOTA模型实现无痕修图,无需先验知识
https://mp.weixin.qq.com/s/xocs_UI5HzgFZtTPWABRKw
使用时间循环一致性学习(TCC)理解视频内容
https://mp.weixin.qq.com/s/xjQtVE-i-n1N9a0AsR6BWw
网络运行时间提高100倍,Google使用的AI视频理解架构有多强?
您的打赏,是对我的鼓励