来源:2020-09-29 14:32:00 热度:

践行开源理念,百度飞桨深度学习平台超过TensorFlow,跃居国内第一

AI中国网 https://www.cnaiplus.com

近日,人们通过分析 GitHub 开源项目数据集 GitHubArchive,得出 2020 和 2019 年度全球深度学习框架排名榜单,其中,百度飞桨 PaddlePaddle 均力压 TensorFlow,紧随 PyTorch 之后,其数据表现意味着在开发者积极贡献代码和项目、社区活跃、代码迭代速度上一直保持着很强竞争力,已经成为了国内第一、世界第二的深度学习开源框架,将国内开源的理想往前又推进了一步。 

2020/2019 年度全球开源深度学习框架活跃度排名榜单

如果 GitHub 开发者想要对开源项目贡献代码,需发起 pull request 把自己修改的代码合入分支主,如果 pull request 被合入,则表示代码被采用,成功完成一次开源贡献。因此,pull request 的发起(open)数量是评估开发者积极贡献代码、项目和社区活跃最直观的指标,合入(merged)pull request 是评估开源项目的代码迭代速度的一个极佳的权威性指标。

通过分析 GitHub 开源项目数据集 GitHubArchive 之中关于 pull request 的发起和合入数据,我们可以看到在 2020 和 2019 年之间,百度飞桨的 open 数据由去年的 2759 次跃升到今年同期的 3391 次,比现阶段暂列第三的谷歌 Tensorflow 高出 1000 多次。飞桨的 merged 数据由 1924 次跃升为 2428 次,超过 Pytorch 的 238 次,比第三名 Tensorflow 高出近 1000 次,这可能意味着「动静统一、软硬融合」的飞桨一直在致力于让深度学习技术的创新与应用更简单,其提供的 AI 底层技术也深受开发者欢迎。

GitHub 标星 47000+

百度飞桨于 2016 年 9 月正式宣布开源,这使得百度成为继谷歌、Facebook、IBM 后第四家将 AI 技术开源的公司。作为国内 AI 开源热门项目,百度飞桨集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,并根据本土化特点将开源框架与应用层面做了更好的结合,旨在打造自主可控的人工智能操作系统,持续赋能广大开发者,这意味着个人开发者也可以利用飞桨提供的平台部署自己的深度学习模型。

经过 4 年的发展,飞桨在 GitHub 上已经有 62 个 Repositories,共收获 47000+ Star,成为国产开源项目的佼佼者。

飞桨在 GitHub 收获了超过 47000 个 Star

作为我国首个开源开放、功能完备的产业级深度学习平台,飞桨能够做到这样的地位,当然少不了要有自己独特的优势。总的来说,飞桨有以下 4 大领先技术。

首先,同时支持动态图和静态图的编程,能够兼顾易用性和效率。飞桨平台结合了动态图的易用性和静态图的高性能,使开发者可以兼顾两者的优势。第二,针对大规模的工业化场景,飞桨提供大规模分布式训练能力,在真正的工业场景应对自如。飞桨平台推出了支持万亿规模参数模型的实时更新能力和训练能力。第三,端到端的部署是应用深度学习的一个非常关键的环节,飞桨提供非常完备的支持各种硬件的端到端的部署能力,能够使得开发者推理、预测的过程足够顺畅。最后,飞桨还有大量在产业实践当中沉淀出来的模型,并提供官方的支持,能够保证开发者的应用效果是最佳且可靠的。

更可贵的是,飞桨并没有满足当下国内深度学习领域「流量担当」地位,仍在持续进行优化升级。在前段时间举办的百度世界 2020 百度大脑分论坛上,飞桨实现了「动静统一、软硬融合」的更新:硬件上,飞桨目前已适配 22 种芯片型号,覆盖 15 家硬件厂商,对国产硬件的支持超过 TensorFlow 和 PyTorch;软件上,动态图功能升级实现了动静态的结合,让用户更容易开发模型;全面升级的 API 体系,则对于开发者更加友好。

2020 年 9 月,百度飞桨深度学习平台入选了 2020 服贸会「科技创新服务示范案例」, 数据显示,飞桨当前支持 140 + 个产业及开源算法,累计开发者 230 万,服务企业 9 万家,基于飞桨开源深度学习平台产生了 31 万个模型。在城市、工业、电力、通信等很多关乎国计民生的领域都有飞桨在发挥作用。

多领域助力应用落地

基于其简洁、灵活、快速的特性,百度飞桨推动了各个行业的深度学习应用,在液晶显示屏的检测、机器人安全巡检、遥感监测等领域发挥着不可代替的作用。拿液晶显示屏检测来说,精测电子应用飞桨开源深度学习框架开发后,基于其分类、检测、分割等多种功能模块,对具有缺陷的液晶屏幕检测的精度上有很大提升。

百度飞桨全景图

同时,飞桨还正在利用技术优势推动各个行业的深度学习应用,在液晶显示屏的检测、机器人安全巡检、遥感监测等领域发挥着不可代替的作用。

例如在消费类电子领域,OPPO 在其多个业务线都上线了基于飞桨构建的大规模分布式推荐系统,覆盖全球 3.5 亿月活用户。工业安全领域,通过飞桨研发的输电线路通道隐患目标图像与视频智能检测系统,实现了输电线路通道隐患目标的自动化识别和预警。环境保护领域,飞桨支撑的无人机自主飞行 + 应用管理平台,可以对森林进行自主巡逻、火情监测、非法入侵、森林树木砍伐监测等功能…… 而这些只是百度飞桨深度学习平台产业实践的一小部分。 

电网智能巡检方案上线以来已发现多起安全隐患,是飞桨的典型应用之一


今年 5 月,百度发布了「量桨」Paddle Quantum,这是建立在百度飞桨深度学习平台之上的开放源代码的机器学习工具包,它包括量子开发工具集,量子化学库以及一系列优化工具,可以帮助领域内的科研人员以及开发者在量子计算应用程序中训练和开发 AI,也为相关领域的爱好者开发量子人工智能的应用提供了强有力的支撑。

在百度开源理念下,多领域的领先技术被开放出来,越来越多的开发者通过开源技术来构建业务,并且形成了应用繁荣、活力十足的社群。尤其是飞桨深度学习平台,既帮助开发者实现人工智能应用的落地,也在不断的反馈中迭代平台架构,促进自身技术升级,并更加贴合开发者的实际需求。

例如,有大学生借助飞桨,让人工智能来为野外摄像装置拍摄的海量图片进行筛选和标注,代替人工的繁琐和低效,大幅节约人力成本。这一产品将在今年年底交付,方便野保工作者轻松使用,为滇南地区包括滇金丝猴在内的生物多样性保护贡献了很大力量。

还有大学生借助飞桨来搭建深度学习模型,通过摄像头捕捉和识别聋哑人群的手语,再转化成语音。如此一来,人们可以流畅地与聋哑人交流,改善特殊人群的生存处境。该项目已在 AI Studio 人工智能学习与实训社区开源,以群策群力实现优化和落地。

在这些案例中,开源的飞桨成为链接开发者之间的「桥梁」,不仅让每一个人可以实现自己的理想,更可以通过这些公开项目,加速技术的演进与商业、社会议题的解决。社区的广泛参与,正是飞桨等开源项目的活力体现,在其上构建繁荣的生态,形成足够强大的产品竞争力。

构建开源开放生态

开源思路,既体现了百度的基因和能力,也表达出其开放的态度,助力更多企业和开发者实现自己的应用落地与业务升级转型。

以深度学习框架为例,百度飞桨具备了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件,让所有人都可以在平台上部署自己的深度学习模型,并且具备简洁、灵活、快速的特性。

飞桨深度学习开源开放平台全景图

另一个典型的领域是自动驾驶。2017 年 11 月,百度发布了全球首个自动驾驶开源项目——Apollo 自动驾驶开放平台,其自动驾驶软件可供任何人免费下载及修改使用。这意味着,许多企业都能通过 Apollo 平台结合车辆和硬件系统,快速搭建一套属于自己的完整的自动驾驶系统。

目前,百度 Apollo 平台已经汇聚了全球 177 家生态合作伙伴;在全球,有 97 个国家超过 3.6 万名开发者使用 Apollo 开源代码,开源代码数量超过 56 万,Apollo 自动驾驶平台已成为全球最强大、最开放、最活跃的自动驾驶平台。 Apollo 已经形成全球最强的自动驾驶生态

此外,还有百度 ECharts,这是当前流行、最强大的可视化库之一,它提供了直观,生动,可交互,可个性化定制的数据可视化图表。从 2013 年 1.0 版本发布至今,为用户提供了交互、多维度数据分析、数据自由刷选、多图表联动、渲染等丰富功能。目前,Apache ECharts (incubating) 在 Github 中的 star 数已经超过 4.2万,每周 npm 下载量超过 25 万。

目前,百度已经构建起了全新的开源开放生态,主导了一千多个开源项目,聚拢了超过一万名社区贡献者,获得超过 30 万次 GitHub Star 数量。从人工智能基础底座深度学习平台,到语音、视觉、自然语言处理、知识图谱等通用 AI 能力,再到 Apollo、DuerOS、智能小程序等开放平台,以及智能交通、智能家居、工业农业等场景化应用,百度开源的能力与技术已经在生活中广泛落地。

百度开源开放生态

除此之外,百度还深度参与国内外顶级开源基金会和组织。百度既是 Apache 基金会、Linux 基金会以及云原生计算基金会的金牌会员,其旗下 Echarts、Doris、Brpc 等多个项目已经成为 Apache 基金会孵化项目,Baetyl、IME、EDL 等项目入选了 Linux,百度 BFE 更是成为云原生计算基金会中,第一个来自中国的网络方向沙箱项目。

同时,百度也在大力支持中国自主代码托管平台建设,以应对复杂国际形势下带来的封闭风险。2019 年,百度战略投资了开源中国,这是中国最大的开源技术社区,旗下运营的 Gitee 代码托管平台是全球仅次于 GitHub 的代码托管平台,每日约增加 5000 名开发者、200 家企业客户、1.7 万代码仓库。在国际市场,开源中国已经可以和 GitHub 掰手腕,为中国开发者提供了自主稳定的保障。

百度创始人、董事长兼 CEO 李彦宏在百度世界 2020 大会上表示:「推动人工智能扎实渗透,行业要充分利用开源、开放平台,它在人工智能发展当中的作用会越来越受到重视。」百度 CTO 王海峰也认为:「一方面,开源创新可以加速技术的创新发展,不断拓展人类认知边界和技术边界。另一方面,所有开发者都可以基于开源开放的成果开发自己的项目、产品及业务,更便捷、高效、安全地推进技术创新与应用。」

百度 CTO 王海峰在 2020 中关村论坛阐述 AI 开源开放价值

飞桨的发展证明了开源开放才是实现技术革新与产业演进的最佳途径,开源两字已深植百度的基因之中。未来我们也需要更多这样致力于开源开放的公司,行业和广大开发者打造共同繁荣的技术生态。

AI中国网 https://www.cnaiplus.com

本文网址:

欢迎关注微信公众号:人工智能报;合作及投稿请联系:editor@cnaiplus.com

AI中国号...

关注微信公众号,了解最新精彩内容
热门标签...
    SQL Error: select a.*,b.* from www_92game_net_enewstags a LEFT JOIN www_92game_net_enewstagsdata b ON a.tagid=b.tagid WHERE isgood=1 group by b.tagid order by a.num desc limit 12