您好、欢迎来到现金彩票网!
当前位置:21点 > 子任务处理 >

Facebook开源视觉、语言多任务深度学习框架——Pythia

发布时间:2019-06-12 22:19 来源:未知 编辑:admin

  雷锋网 AI 科技评论按:Facebook 人工智能研究院最近推出 Pythia ——一个深度学习框

  雷锋网 AI 科技评论按:Facebook 人工智能研究院最近推出 Pythia ——一个深度学习框架,支持视觉和语言领域的多任务处理。其模块化的即插即用设计能够帮助使用者快速构建、复制和基准人工智能模型。

  Pythia 是一个视觉和语言多模式研究的模块化深度学习框架,它建立在PyTorch之上,具有以下特点:

  Unopinionated:对基于它构建的数据集和模型实现不受任何影响的功能

  即插即用的模块化设计,能够使研究人员快速构建、复制并基准 AI 模型。你可以使用 Pythia 为您的下一个视觉和语言多模式研究项目提供引导程序,也可以用作视觉和语言数据集挑战赛的入门代码库(TextVQA 挑战,VQA 挑战);还可以用它来回答与视觉数据相关的问题和自动生成图像注释。

  Pythia加入了近期的AI比赛(VQA Challenge 2018和Vizwiz Challenge 2018)中获奖作品的元素。功能包括通过参考实现来展示之前的模型如何完成相关基准测试结果,以及迅速评估新模型性能。 除了多任务处理,Pythia还支持分布式训练和各种数据集,以及自定义损失、指标、调度和优化器。

  Pythia使得进入视觉和语言子领域的过程变得更简单,也使研究人员能够专注于更快的原型设计和实验。通过提高这些模型和结果的可重复性来加速研究进程,将使得社区更容易成功构建系统并进行基准测试。

  通过消除这些障碍,研究人员能更快地为人们和智能机器开发新的交流方式。 同时,这项工作还将帮助研究人员开发自适应人工智能,使得多种理解更好融合到多情境的多模理解中。除了这个开源版本,Facebook还计划继续添加工具、任务、数据集和参考模型。

  标签:pythia 数据集 视觉 模型 语言 雷锋网 人工智能 框架 多任务 ai 研究人员 vqa textvqa 优化器 自定义 科技评论 github 指标 智能机器 文档

http://idiomcoach.com/zirenwuchuli/86.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有