中国  

English  

你的位置:郑州金博体育技术有限公司 > 金博体育新闻 > 同时也基于ModelScope-Agent金博体育中国官方网站,金博体育唯一官方网站

同时也基于ModelScope-Agent金博体育中国官方网站,金博体育唯一官方网站

时间:2024-08-14 04:36:44 点击:75 次

同时也基于ModelScope-Agent金博体育中国官方网站,金博体育唯一官方网站

CodexGraph团队 投稿

量子位 | 公众号 QbitAI

代码生成和补全任务做不完了?!

不如试试让大语言模型(Large Language Models, LLMs)来帮忙。

不过,如果是处理大规模、多文件的代码库,LLMs就可能犯了难。这时候,往往需要需要Retrieval-Augmented Code Generation (RACG)系统来检索相关的代码信息。

现有解决方案,如基于语义相似度的检索和手动设计的工具与API,虽然在特定任务上有效,但在泛化能力和普适性方面存在局限。

为了缓解现有RACG方法的通用性缺陷,来自新加坡国立大学、阿里巴巴、西安交通大学的研究人员提出了CodexGraph,一个以代码图数据库为媒介,连接了语言模型和代码库的系统。

研究团队在三个有代表性的学术benchmarks对CodexGraph进行了评测,同时也基于ModelScope-Agent,将CodexGraph实现在了五个真实代码应用场景。

实验和现实实践显示出了CodexGraph的有效性和通用性。

研究方法

CodexGraph通过代码图数据库接⼝界⾯ ,创新性地将语⾔模型与代码库连接,以克服现有⽅法的不⾜。

该系统的⼯作流程主要包括以下⼏个步骤 :

首先,构建代码图数据库。

使⽤静态分析技术,根据预定义的Schema,将代码库中的代码符号(如模块、 类、 函数等)和它们之间的关系映射为图数据库中的节点和边。

其次,代码结构感知查询。

利⽤graph query language的灵活性,同时结合图数据库的结构特性,实现对代码图的复杂查询和深度检索。

第三, “Write then translateˮ 策略。

Primary LM agent ⾸先分析代码问题,⽣成⾃然语⾔查询。

然后,专门的translation LM agent将这些查询翻译为为格式化的graph query language。

第四,金博体育官网入口迭代式pipeline。

通过迭代的⽅式,LM agent根据⽤户问题和已获取的信息,逐步优化查询和检索结果。

实验

实验部分,CodexGraph在CrossCodeEval、 EvoCodeBench和SWE-bench三个具有代表性的代码库级基准测试上进⾏了评估。

这些测试覆盖了跨⽂件代码补全、 代码⽣成和⾃动化GitHub问题解决等多个⽅⾯ 。

实验结果显示,CodexGraph在所有基准测试中均展现出了优异且稳定的性能,验证了代码图数据库作为语⾔模型和代码库之间的接⼝界⾯的有效性。

原论⽂的分析进⼀步指出,CodexGraph在处理不同难度的推理任务时,单⼀查询与多重查询策略的效果存在差异。

在CrossCodeEval中,多重查询策略更有效;⽽在SWE- bench中,单⼀查询策略表现更佳。

此外 ,去除Cypher LM agent会显著增加primary LM agent的推理负担,导致性能下降。

这表明Cypher LM agent在减轻primary LM Agent的推理压⼒中发挥了关键作⽤。

真实应⽤场景⽰例

基于ModelScope-Agent框架 ,CodexGraph的实际应⽤价值在多个场景中得到了体现,如:

代码聊天助⼿(Code Chat)代码调试⼯具(Code Debugger)单元测试⽣成器(Code Unit tester)代码⽣成器(Code Generator)代码注释⼯具(Code Commenter)……

这些应⽤展⽰了CodexGraph如何在⽣产环境中帮助开发者解决实际问题 ,提⾼代码开发的效率和质量。

总结

以图数据库作为媒介,CodexGraph为语⾔模型与代码库提供了⼀个新的交互⽅式。

它不仅提升了语⾔模型对复杂代码库的理解能⼒,还增强了整体的代码检索和导航的准确性。

它的出现为⾃动化软件⼯程领域,尤其是在⾯临RACG挑战时,带来了新的解决⽅案 ,展⽰了在多样化代码任务和现实世界应⽤中的⼴泛潜⼒和实际价值。

随着技术的不断发展,CodexGraph有望在未来⽀持更多编程语⾔ ,并进⼀步优化其⼯作流程和索引构建效率。

代码链接 :

https://github.com/modelscope/modelscope-agent/tree/master/apps/codexgraph_agent

arXiv链接 :

https://arxiv.org/pdf/2408.03910

— 完 —

量子位 QbitAI · 头条号签约金博体育中国官方网站,金博体育唯一官方网站

专题:2024亚布力企业家第二十届夏季年会金博体育官网入口 “2024亚布力企业家第二十届夏季年会”于8月30日-9月1日在广州市举行。亚布力中国企业家论坛理事长,泰康保险集团股份有限公司创始人、董事长兼CEO陈东升出席并演讲。 陈东升谈及自己在武汉大学130周年时代表70万武大学子讲话,“这是我一生最高的荣誉”。 陈东升还表示,不同于北大清华有社会捐款,武汉大学基本是校友捐献,武大也是现代企业家的发源地。据其介绍,武大校友捐款已经超过57个亿,“雷军去年赚13个亿,是一个楷模”。 据悉,26
专题:2024亚布力企业家第二十届夏季年会 “2024亚布力企业家第二十届夏季年会”于8月30日-9月1日在广州市举行。亚布力中国企业家论坛理事长,泰康保险集团股份有限公司创始人、董事长兼CEO陈东升出席并发言。 陈东升在演讲中分享了自己的想法,并建议教育部在高中开设一门4个学时的名人轶事或名人传记课。 他回忆到,自己是1957年出生,1973年到1975年在天门中学读高中。“那是非常好的中学,我买了一本《马克思传》,是马克思的女婿梅林先生著的。我当时读了5章,一个中学生,连县城都没出过,读了
专题:2024亚布力企业家第二十届夏季年会 “2024亚布力企业家第二十届夏季年会”于8月30日-9月1日在广州市举行。亚布力中国企业家论坛理事长,泰康保险集团股份有限公司创始人、董事长兼CEO陈东升出席并演讲。 陈东升在现场回忆起了自己二十多岁时在武汉大学珞珈山的石头上,刻下“千里之行始于足下”的“始”字,笑称当时对于一个20多岁的学生来说,做这件事非常难,(今后)不成功天都不容。 新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其
专题:2024亚布力企业家第二十届夏季年会 “2024亚布力企业家第二十届夏季年会”于8月30日-9月1日在广州市举行。泰康保险集团股份有限公司创始人、董事长兼CEO陈东升出席并演讲。 陈东升表示,中国经济和社会目前处于深度的转轨期,从高增长、高收益进入中低增长低收益的时代,“就是过去是个增量经济,跑马跑马圈地,野蛮生长,工业化、城市化,遍地是工地,今天是存量经济了。” 他指出,存量时代就会变成内卷、同质化竞争。“出现的问题就是多元化、不专注主业,不精细化管理,不创新,不走效率这个道路,就会死
高质量发展基调不改、持续提质增效目标不变。8月30日傍晚,万科A提交了2024年半年度答卷。作为在今年第二季度全面实施瘦身健体的一揽子方案后提交的财报,这份半年报多处业绩亮眼:实现高品质交付7.4万套房子,全面完成预定计划;保障公开市场债务正常兑付;实现销售金额1,273.3亿元,保持行业第一阵营;现金流现积极信号,实现大宗交易回款93.4亿元;印力集团完成商业基础设施 REIT 的发行,发行规模32.6亿元。同时,放眼业务全局,报告期内,万科全面聚焦综合住区开发、物业服务、租赁住宅三大主业,
财联社8月31日讯(编辑 周子意)民主党候选人卡玛拉·哈里斯在最新一次讲话上明确表示,如果她当选总统,她将不会禁止一项富有争议的钻探技术——水力压裂法。而此前的她,一向反对这项技术。 哈里斯周四(8月29日)在接受采访时表示,“作为副总统,我没有禁止水力压裂。作为总统,我也不会禁止水力压裂。”与此同时,她也指出将坚定不移地在绿色能源领域取得进展。 “我们已经创造了超过30万个新的清洁能源工作岗位,从我作为副总统的经验来看,我们可以在不禁止水力压裂的情况下做到这一点。” 水力压裂法是美国大部分页

官网:lchanjie.com

邮箱:lchanjie@163.com

联系:0371-89926159

地址:郑州市二七区二马路77号

Powered by 郑州金博体育技术有限公司 RSS地图 HTML地图