当前位置:网站首页 > 科技网络 > 正文

Facebook开源PyTorch3D以实现从三个角度思考的AI

作者:访客发布时间:2023-05-12分类:科技网络浏览:110评论:0

导读:导读给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识...
导读 给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识

给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识与大家分享。希望大家看完之后会喜欢。

脸书公司的研究部门在周四发布了PyTorch3D的代码。PyTorch3D是一个自制的工具包,旨在简化可以在三维环境中运行的人工智能模型的开发。

或者至少是理解3D空间的能力,对于跨多个领域的深度学习的应用非常重要。最明显的领域是机器人、虚拟现实和增强现实。即使是传统的分析物体二维照片的图像识别模型也可以从理解物体的真实三维形式中受益,因为额外的上下文可能有助于提高其准确性。

然而,由于脸书缺乏专门的开发工具,释放3D深度学习优势的进度相对缓慢。借助PyTorch3D,社交网络研究人员正在寻求解决这一差距,并降低学习曲线,以在应用中实现这一技术。

PyTorch3D的第一个组件是一个名为grid的数据结构。3D模型由所谓的网格组成,这些网格有许多不同的类型,可能很难使用。脸书说,网格结构为组织这些形状提供了统一的格式,这使得人工智能开发人员更容易处理他们的数据。

开发人员可以使用PyTorch3D中包含的脸书损失函数和运算符集来构建人工智能模型,以处理他们的3D模型。损失函数是一种算法,用于跟踪人工智能在数据集上训练时所犯的错误。这些信息有助于将学习过程引向正确的方向。操作员本质上是在为执行复杂的任务编写快捷方式。在这种情况下,它涉及3D对象的计算。

脸书研究人员Nikhila Ravi、Georgia Gkioxari和贾斯廷约翰逊在他们的博客中写道:“我们已经完成了优化3D数据的几种常见运算符和损失函数的实现工作,从而支持不同批次的输入。”“随着时间的推移,我们将继续增加一组通用运算符。”

脸书通过渲染引擎增强了PyTorch3D的功能集,该引擎将3D数据转换为2D图像,开发者可以查看这些图像,或者由应用程序进行处理。渲染器不仅可以生成对象,还可以添加灯光和阴影效果。它有一个应用程序编程接口,允许将项目导出到一个流行的深度学习框架,比如脸书开发的PyTorch(工具包的同名产品)。

本文就为大家讲解到这里了。