模型|Meta AI推出“杂食者”:一个模型搞定图像视频和3D数据的分类任务( 二 )


模型|Meta AI推出“杂食者”:一个模型搞定图像视频和3D数据的分类任务
文章插图
此外,在ImageNet-1K数据集上检索给定RGB图像的深度图也发现,尽管Omnivore没有接受过关于1K深度图的训练,但它也能够给出语义相似的正确答案。
模型|Meta AI推出“杂食者”:一个模型搞定图像视频和3D数据的分类任务
文章插图
最后,作者表示,尽管这个“杂食者”比传统的特定模式模型有了很多进步,但它有一些局限性。
比如目前它仅适用于单视图3D图像,不适用于其他3D表示,如体素图(voxels)、点云图等。
论文地址:
https://arxiv.org/abs/2201.08377
代码已开源:
https://github.com/facebookresearch/omnivore
【 模型|Meta AI推出“杂食者”:一个模型搞定图像视频和3D数据的分类任务】— 完 —
量子位 QbitAI · 头条号签约