加载中
围炉夜话:2020年,“创造”的努力与成长

现在是2020年最后一个夜晚,我们打算放下官方账号的调性,唠唠家常。 2020年有多魔幻无需赘述,那2021年会好吗? 这句话几乎是所有年终盘点里都要写的一句话,或开头,或结尾。但从理性的角度...

仅此一文让您掌握OneFlow框架的系统设计(下篇)

仅此一文让您掌握OneFlow框架的系统设计(下篇) 本文主要介绍OneFlow系统的运行时(Runtime)的运行流程,以及参与运行时的各个模块是如何协同工作的,还探讨了OneFlow的Actor机制如何解决流水...

2020/12/28 16:52
3.2K
仅此一文让您掌握OneFlow框架的系统设计(中篇)

本文是OneFlow系统设计分享系列文章的中篇,主要介绍OneFlow的编译期Compiler如何将Job编译为Plan的。其中最精华的部分是OneFlow的Boxing模块,负责构建两个逻辑上的Op对应的两组物理上的Op在...

2020/12/28 16:52
1.6K
仅此一文让你掌握OneFlow框架的系统设计(上篇)

仅此一文让你掌握OneFlow框架的系统设计(上篇) OneFlow开源近半年,近期发布了v0.3.2版本,相较于上个大版本,我们又新增了众多算子和功能(如亚线性内存优化、Partial FC、足够灵活易用的新...

2020/12/28 16:51
3.1K
当当当当!OneFlow荣膺“创新之星”,技术实力再受认可

喜 报 在2020年12月23日举办的2020中国人工智能高峰论坛暨中国人工智能大赛发布会上,OneFlow深度学习框架因独特的技术创新优势和领先的技术水平,荣获大会颁发的“创新之星”奖项。 中国人工...

2020/12/24 17:52
59
OneFlow版本更新 - Changelog 0.3.2

OneFlow 发布了新版本 0.3.2,大版本 0.3 加入了诸多特性,性能更优,用户体验更友好,且率先支持了 CUDA 11.1。 内存亚线性优化在省的基础上更省,保持训练速度的前提下,大幅节省内存;新版...

OneFlow CHANGELOG V0.3.2

Changelog OneFlow 发布了新版本 0.3.2,这个版本以及之前的 0.3.1 版本都是大版本 0.3.0 的 minor 版本,所以在此一并介绍。 在这个版本中,引入了大量性能优化、加入了不少新的 feature,率...

2020/12/18 16:45
248
【翻译】深度学习框架简史(A Brief History of Deep Learning Frameworks)

原文链接:https://towardsdatascience.com/a-brief-history-of-deep-learning-frameworks-8debf3ba6607 作者:Lin Yuan Machine Learning @ Waymo | ex-Amazonian 翻译:赵露阳 过去十年,机...

深度学习框架简史

原?链接: https://syncedreview.com/2020/12/14/a-brief-history-of-deep-learning-frameworks/ 作者:Lin Yuan Machine Learning @ Waymo | ex-Amazonian 本文已获原作者授权发布 | 翻译:...

“黑科技”RDMA如何帮助深度学习模型优化通信网络?

很多人有疑问:为什么深度学习模型需要优化通信网络? 事实上,越是高性能算力的平台,越离不开通信网络的优化。近日,OneFlow创始人袁进辉与熊先奎先生(中兴通讯股份有限公司无线首席架构师...

2020/12/08 14:45
640
CUDA 有 unified memory 还需要内存优化吗?

CUDA 有 unified memory 还需要内存优化吗? 先说结论,不管有没有 unified memory,只要有性能要求的软件,都必需自己做优化。 因为 unified memory 的主要工作,并不是去掉了 Host Memory ...

2020/12/08 14:44
268
【深度学习】— 各框架分布式训练简介+测评

【深度学习】— 各框架分布式训练简介+测评 1.各框架分布式简介 1.Pytorch 从官方文档上我们可以看到,pytorch的分布式训练,主要是torch.distributed包所提供,主要包含以下组件: Distribu...

2020/12/08 14:44
5K
【深度学习】— 分布式训练常用技术总结

【深度学习】— 分布式训练常用技术总结 概述 分布式、高并发、多线程,似乎是一个程序员永远逃离不了的3个关键词,只要脱离了单机/单节点,涉及到2台以上的机器,就会碰到分布式。深度学习领...

“黑科技”RDMA如何帮助深度学习模型优化通信网络?

为什么深度学习模型需要优化通信网络? 事实上,越是高性能算力的平台,越离不开通信网络的优化。近日,OneFlow创始人袁进辉与熊先奎先生(中兴通讯股份有限公司无线首席架构师)、宋庆春先生...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部
http://www.vxiaotou.com