NVIDIA DOCA 先行者 · 开发者故事系列第一弹来啦!
在年初结束的 NVIDIA DOCA 应用代码分享活动中,我们见证了开发者们的奇思妙想。在一众优秀的参赛者中,有五位开发者脱颖而出获得奖项,并在此讲述他们参赛的心路历程以及与 DOCA 结缘的故事。
我们第一期的故事主角是本次活动一等奖得主陈勤。作为计算机科学与技术专业在读硕士研究生,陈勤在初次接触 NVIDIA DOCA 软件框架时就定下了自己的目标——利用 DOCA 解决数据中心高性能网络传输的流控问题。如今,他将这一想法成功地落到了实践上。
破局之作:基于 DOCA 的自适应路由
陈勤本次创作的项目题为“基于 DOCA 的自适应路由”,该项目通过 NVIDIA BlueField-2 DPU 卸载基于主动探测的自适应路由算法,实现了 VXLAN 等 Overlay 流量的逐流负载均衡。通过该项目,陈勤不仅探索了基于 DPU 的新型负载均衡方案的可行性和有效性,还提供了有效的源代码和测试数据作为支持。
扫描二维码,进入 Github 查看项目详情
创作背后的挑战:
用 DOCA 驱动数据中心网络负载均衡
随着云计算和 AI 等技术的蓬勃发展,数据中心网络负载均衡一直是热议话题。为了解决数据中心高性能网络传输的流控问题,陈勤根据过去几年的开发经验,构思出了比较适合卸载到 NVIDIA BlueField-2 DPU 上的调度算法——通过 DOCA 的核心功能 DOCA-Flow 和 DPU 的基础功能进行流量转发和处理,卸载了一些主机上的流量调度功能。
在利用 DOCA-Flow 的一些 API 进行开发的过程中,陈勤也遇到了一些意料之外的挑战,比如某些流表的下发逻辑虽然能够编译通过,但是运行时却出现异常。经过反复修改和尝试,陈勤最终将代码调整到符合自己的预期,这个过程需要大量的耐心。
谈及此次活动的参与心得,陈勤表示:“把 DOCA 的应用代码放在开源平台上跟大家分享,不仅对高性能网络和 AI 基础架构研发人员有一定的借鉴意义,对我个人来说,也能够通过这次活动认识到更多身处相同研究领域的开发者,让我了解到行业内对 DPU 的关注点集中在何处。”
DOCA 先行者快问快答
Q:您是从什么渠道了解到 DOCA 的?什么契机使您成为 DOCA 开发者?
A:我是通过导师的介绍和 NVIDIA 的公众号了解到 DOCA 的。因为我的研究方向就是 SmartNIC 相关,而 NVIDIA BlueField 系列 DPU 产品是行业佼佼者且生态友好,所以立马就注册了。
Q:最初从事 DOCA 开发时,有具体明确的目标吗?
A:主要想利用 DOCA 解决数据中心高性能网络传输的流控问题,DPU 是可编程的基础设施,所以想借此自定义相关协议的流控,譬如利用 PCC 开发一些自定义的拥塞控制算法。
Q:除了这次活动,可以分享一下过往其他成功的 DOCA 开发经历吗?
A:我还参加了2022 年举办的 DOCA 有奖征文比赛,详细介绍了 NVIDIA BlueField-2 DPU 和 DPDK 的开发入门指南,拿了不错的名次。
Q:您对 DOCA 的评价如何呢?
A:我觉得 DOCA 的文档很齐全,生态友好,希望能加强和高校的合作。
Q:您觉得成为 DOCA 开发者对您的生活和工作带来了哪些改变?
A:为我带来了潜在的工作机会,我在社区也获得了其他 DOCA 开发者和很多前辈的肯定,让我对自己更有信心。
Q:NVIDIA DOCA 中国开发者社区对您有哪些帮助?
A:在这里我可以及时获取 DOCA 最新版本的情况,结识更多相同领域的开发者,并能时常获得社区专家的答疑解惑,有很大的成长。
“随着 AI 技术的蓬勃爆发,网络成为分布式训练的瓶颈,利用 DPU 来探索提升高性能网络表现是一个行之有效的路径。希望以后能和更多 DOCA 开发者一起推动高性能网络和异构计算的发展。”
——NVIDIA DOCA 应用代码分享活动
一等奖获得者陈勤
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.