当前位置:首页 > 资讯 > 正文

IBM引入CodeNet项目来帮助人工智能代码翻译

IBM引入CodeNet项目来帮助人工智能代码翻译  第1张

科幻网5月12日讯 据外媒报道,IBM正在宣传其在人工智能(AI)方面的进步,包括CodeNet项目。

许多公司面临的最大挑战之一是将现有代码库转换成另一种语言。人工智能有望帮助缓解这一问题,但需要进行大量培训,才能将一种编程语言正确地翻译成另一种语言。

IBM Research发布了一个名为Project CodeNet的数据集,该数据集旨在训练人工智能进行源到源的翻译。

据了解,它是一个旨在教人工智能编码的大型数据集,它包含55种以上不同编程语言的大约1400万个代码示例和大约5亿行代码,从诸如C ++,Java,Python和Go的传统语言到诸如COBOL,Pascal和FORTRAN。

IBM表示:“Project CodeNet是同类中最大、最具差异的数据集,它解决了当今编码中的三个主要用例:代码搜索(自动将一种代码翻译成另一种代码,包括像COBOL这样的遗留语言);代码相似性(识别不同代码之间的重叠和相似性);还有代码约束(根据开发人员的特定需求和参数定制约束)。”

该公司相信,Project CodeNet将有助于彻底改变源到源的语言翻译,并可能成为那些需要将遗留代码库迁移到现代语言的公司的重要资源。