大家好,我是方小鲸,今天想给大家介绍一个参赛思路十分清晰的参赛选手,向大家展示一下他参与首届“全国人工智能大赛”AI+4K HDR赛项初赛的全流程。
围观群众请坐好小板凳,选手登场了!
首先,我看上这个比赛主要是因为奖金高呀(说的好像我拿的到一样)、闲着也是闲着找点事做它规格高、选题接近实际生产环境,以下节选自官方赛事介绍:
现在初赛阶段也进入了白热化阶段,排行榜上的争夺十分激烈。初赛的任务是“视频四倍超分,要求将叠加随机噪声的540p SDR视频重建为去噪后的4K SDR视频”
说实话,刚看到这个任务我是懵的:
四倍超分是啥,SDR又是啥??
但是吧,想想趁着刚开赛排行榜人数还不多,四舍五入只要提交了就能前一百,我决定试试!
缠着隔壁的大佬给我讲了一下之后,终于整明白了,原来这是个计算机视觉领域里非常具有现实意义的宝藏题目,由浅入深学CV,老少咸宜乐趣多。
另外,也要说说这个数据集,这可能是业界能找到的最大规模的4K HDR视频重建数据集了。你说搞学术也总不能天天只在200MB的图片数据集上闭门造视频车对吧。
接下来是选手的干货分享,大家记好笔记呀!
四倍超分,缩写之前是四倍超分辨率,指的就是把视频的长宽各×4,也就是将整体像素数量扩大16倍。
SDR是相对HDR的一个概念,二者是两套亮度/色度体系, HDR的编码能够保存比SDR更多的画面细节。在初赛中,并没有要求大家在SDR和HDR之间转换,所以可以暂时忽略这件事。
那么用简单的话来说,就是让把一个粗糙的小视频,放大成长宽各4倍的精致大视频。
那么如何做呢?
因为视频是由一帧一帧的图片构成的,所以我们可以先考虑从图片超分做起,最最最简单的就是把测试集下载下来,将每个视频的每一帧做去噪+双线性插值。
啥?不知道啥叫去噪+双线性插值?那你会调包+算平均数嘛?会啊,好,那你就会去噪+双线性插值了,那你就可以进入前100了~
此处社区热心群众公开的项目:
https://www.kesci.com/home/project/5dd2057d00b0b900365eb49c
想再提高一下?
好的。因为双线性插值他说白了就是个算数游戏,他并不能恢复图像压缩过程中丢失的细节信息,不算严格意义上超分技术,而且也配不上尊贵的初赛前100的身份,所以我决定升级一下的我技术路线。
查阅资料后,发现现有的使用深度学习的超分模型大概有这么几种分类:
好棒,每个字都看得懂呢,然而并不知道怎么入手。
别怕,云端大腿已经在网上公布了EDSR的baseline。这个模型经过了云端大腿的精心挑选,它的特点是使用了残差连接的方式,并且增加了网络的深度以及模型容量,移除batch norm以减少使用的显存,对于此次比赛的大分辨率数据集更加适用。
看不懂,没关系,现已全部开源,只需要从github下载下来,拆开分析一下怎么用就可以了。
具体来说就是:
1.先运行这个文件把每个视频转成100帧的PNG。
2.再运行这个文件加载pre-trian的参数跑测试(以及训练),pre-trian的参数需要下载,链接在model文件下里面每个文件的开头。
哎呀,再往细里说我就要顺着网线爬过来手把手教你了,求求你自己拆代码看吧......
反正一番鼓捣之后,就能跑上了,完全不需要自己写代码呢~ 然而几分钟后,我的电脑逐渐变烫……
这个时候,主办方掏出了一沓厚厚腾讯云的代金券:
好的,赶紧安排。
有了算力,我又觉得自己可以试试更🐂🍺的模型了。
那是时候展现真正的技术了用上时序信息了。视频超分和图像超分的处理区别,在于视频比图像多出以下两点:
之前有个友商的比赛,冠军中科大团队的baseline就是基于商汤在CVPR2019提出的EDVR。EDVR作者提出了一种新的网络模块「PCD 对齐模块」,使用 Deformable 卷积进行视频的对齐,整个过程可以端到端训练。而在挖掘时域(视频前后帧)和空域(同一帧内部)的信息融合时,作者提出了一种时空注意力模型进行信息融合。
- https://www.leiphone.com/news/201909/4dcpVMfyOonzN1ez.html
- http://www.sohu.com/a/343990005_129720
- https://arxiv.org/pdf/1905.02716.pdf
- http://www.vision.ee.ethz.ch/ntire19/
看不懂没关系,github代码下下来跑就完事了~
https://github.com/xinntao/EDVR
算法的效果,看了我都心动!
另外,云端大腿还讲解了另一个RBPN模型,有需要的可以自行取用:
https://github.com/alterzero/RBPN-PyTorch
不行,不能再说了,再多说你们就看出来我还没做到这步了……
话都说到这里了,你还问我参赛体验怎样收获多少嘛?这么难得的学习机会大家都要来试试吧,多提交几次就能知道自己学到啥了!
以上就是这位优秀选手的思路分享,如果想要了解更多选手的参赛经验分享,欢迎订阅我们的大赛专栏,定期更新,我们从不迟到!
专栏链接:https://www.kesci.com/home/column/5db15d7675df5c002b22b80f
AI+4K HDR赛项培训&答疑视频:https://www.bilibili.com/video/av75103748