美图与清华合作推出最大规模教程类行为数据集COIN

互联网
2019
03/15
20:51
分享
评论

近日,美图公司社交产品事业群视觉算法组与清华大学自动化系智能视觉实验室合作,推出了业界最大规模教程类行为数据集COIN(COmprehensive INstructional video analysis),该论文已被计算机视觉与模式识别会议CVPR 2019录用。

COIN数据集的概览

教程类行为视频(Instructional Video)可以帮助使用者获取完成各种行为任务的知识,但是现有教程类行为视频数据集在规模性和多样性都存在较大的局限性,难以应用于现实生中的复杂场景。为此,美图公司社交产品事业群视觉算法组与清华大学自动化系智能视觉实验室合作提出了名为COIN的大规模教程类数据集,用于更全面的教程类行为视频分析。

COIN数据集采用分层结构,即第一层是领域(Domain)、第二层是任务(Task)、第三层是步骤(Step),其中包含与日常生活相关的11827个视频,涉及交通工具、电器维修、和家具装修等12个领域的180个任务,共778个步骤。

COIN数据集的分层结构

COIN数据集的设计人员还开发了创新性的标注工具,可以更高效更准确地标注视频行为的步骤信息。此外,为了给数据集提供更准确的基准指标,数据集开发人员还使用了SSN、R-C3D等评价方法对COIN数据集进行了测评。

COIN数据集的步骤定位准确率分析

目前,COIN数据集是业界规模最大、多样性最丰富的教程类视频数据集。该数据集在标注结构上采用分层的组织结构,涵盖了多种不同类型的教程类视频。该数据集的提出,给复杂场景下视频动作时序定位(temporal localization)等问题的研究提供丰富的数据资源,有望加快推动视频行为分析与理解等相关领域的研究。

美图公司社交产品事业群视觉算法组,是美图社交化的重要算法团队之一。随着“美和社交”战略的发布,美图秀秀从过去的纯图片处理软件转变为社区平台。视觉算法组通过人工智能/深度学习算法,理解图像和视频内容中的语义信息,为社区中推荐、搜索、反作弊和垃圾过滤等提供有力的技术支撑。帮助用户处理图片的同时,增加社交功能及软件活性。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表环球360的观点和立场。

相关热点

近期,多地农产品滞销新闻见诸报端,引发社会关注。为促进农产品产销对接,由农业农村部主办的2018全国贫困地区农产品产销衔接活动日前在京举行,农产品采购量达到252.6万吨。...
洞见
相较于李嘉诚时代频繁的抛售地产,李泽钜主导长和系的这段时间里,却几乎每个月都在公布有关地产投资的消息。...
产经
在楼市调控政策坚持不放松的大背景下,房地产开发从“高利”转为“微利”,房企如何做好利润与质量的平衡关,不仅关乎品牌形象,更与企业发展息息相关。...
产经
2月26日,波司登在中国最高地标建筑——上海中心,举办“逆势突围 共创传奇”2018战略成果发布会,揭秘波司登在经济寒冬下如何取得逆势增长。...
洞见
分时租赁行业之所以运营了这么久还没有出现像网约车和共享单车行业一样的寡头,很重要的两个原因就是重资产和资源封闭。...
洞见

相关推荐

1
3