资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

百度发布 Paddle Fluid v1.3 版本,带来多项重要更新

作者:丛末
2019/03/01 10:04

雷锋网 AI 科技评论按:日前,百度 PaddlePaddle 更新至 Fluid v1.3 版本,一如既往地, Fluid v1.3 版本在基础框架、预测引擎、模型建设、分布式训练各个方向上都实现了多项更新,而其中比较重要的更新包括:

  • 统一 Executor 和 ParallelExecutor 接口,用户只需通过 CompiledProgram 将单卡模型转化多卡模型,并利用 Executor 进行训练或者预测。

  • 正式发布 AnalysisConfig 预测接口,支持计算图分析、算子融合等优化,并支持利用 Intel MKLDNN、Nvidia TensorRT 子图引擎等第三方库的加速.

  • 模型库新增发布 PaddlePaddle 视频模型库,提供 5 个视频分类经典模型以及适合视频分类任务的通用骨架代码,用户可一键式高效配置模型完成训练和评测。

  • 新增支持 NLP 语义表示 BERT 模型,支持多机多卡训练,支持混合精度训练,训练速度对比主流实现提升 50%+,提供完整部署示例。

  • 发布大规模稀疏参数服务器 Benchmark,CPU 多机异步训练发布显著提升点击率预估任务 IO 吞吐的 built-in reader,多机多卡训练性能多方面提升。

最新版本在基础框架、预测引擎、模型建设、分布式训练上的具体更新情况如下:

基础框架

安装

增加动态图基础功能

Executor 和 ParallelExecutor 接口优化

中间表达 IR 和 Pass 方面的优化

内存和显存方面的优化

Operator 整体层面的优化

INTEL FP32 计算相关优化

完善 CPU JitKernel

其他

预测引擎

服务器预测

正式发布 AnalysisConfig 预测接口,支持计算图分析、算子融合等优化,并支持利用 Intel MKLDNN、Nvidia TensorRT 子图引擎等第三方库的加速。

预发布 intel CPU 上的 预测 INT8 离线量化方案

CPU 预测速度提升

新增 Paddle-TRT 对 Calibration INT8 的支持,GPU 预测速度提升

算子融合

功能完善及易用性提升

其他

移动端预测

效率优化,常见模型预测速度提升

新增支持多个输入和多个输出的模型预测

新增实现 prelu6 operator、cast operator、top_k operator

修复 int8 offline 量化溢出结果不对的问题

修复 winograd 实现在输入 feature map 的 height 和 width 不相等时结果可能为 0 的 bug

模型建设

PaddleCV 智能视觉

PaddleNLP 智能文本处理

PaddleRec 智能推荐

分布式训练

大规模稀疏参数服务器 Benchmark 发布

CPU 多机异步训练

GPU 多机多卡水平扩展性能提升

GPU 多机多卡垂直扩展性能提升

典型模型收敛速度优化

VisualDL

安装参考网址http://paddlepaddle.org/documentation/docs/zh/1.3/beginners_guide/install/index_cn.html

PaddlePaddle Fluid v1.3 版本项目开源地址:https://github.com/PaddlePaddle/Paddle/releases 雷锋网雷锋网

长按图片保存图片,分享给好友或朋友圈

百度发布 Paddle Fluid v1.3 版本,带来多项重要更新

扫码查看文章

正在生成分享图...

取消
相关文章
Baidu
map