肛交 推特 Meta发布Sapiens视觉模子,让 AI 分析和表示图片/视频中东谈主类看成
IT之家 8 月 24 日音信,Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模子肛交 推特,适用于二维姿势预估、躯壳部位分割、深度推断和名义法线瞻望 4 种以东谈主为中心的基本视觉任务。
这些模子的参数数目各不疏通,从 3 亿到 20 亿不等。它们接受视觉转机器架构,任务分享疏通的编码器,而每个任务有不同的解码器头。
二维姿势预估:这项任务包括检测和定位二维图像中东谈主体的关键点。这些关键点时常与肘、膝和肩等要害相对应,有助于了解东谈主的姿势和看成。
躯壳部位分割:这项任务将图像分割成不同的躯壳部位,如头部、躯干、手臂和腿部。图像中的每个像素齐被归类为属于特定的躯壳部位,足球尤物这对虚构试穿和医学成像等运用颠倒有用。
深度推断:这项任务是估算图像中每个像素与录像头的距离,从而有用地从二维图像中生成三维图像。这对增强履行和自动驾驶等运用至关进犯,因为在这些运用中,了解空间布局颠倒进犯。
名义法线瞻望:这项任务是瞻望图像中名义的标的。每个像素齐会分拨一个法向量,默示名义朝向的标的。这些信息关于三维重建和了解场景中物体的几何形态颠倒有价值。
Meta 公司默示该模子可原生支撑 1K 高别离率推理,而且颠倒容易针对个别任务进行休养,只需在卓越 3 亿张野生东谈主类图像上对模子进行预锻真金不怕火即可。
即使在标注数据稀缺或十足是合成数据的情况下,所生成的模子也能对野生数据弘扬出不凡的泛化才调。
IT之家附上参考地址
大桥未久哪部好看Sapiens: Foundation for Human Vision Models
Sapiens: Foundation for Human Vision Models
GitHub肛交 推特