2024年1月26日 2024年1月26日技术

目录显示

CodeRL

"CodeRL can be extended and improved in various ways. For example, it can be easily integrated with other (better pretrained) LMs, and improved with more fine-grained feedback from the environment, such as feedback received from a static code analyzer."

TDD

这篇论文提出了一个基于深度强化学习和小语言模型（770M参数）的text2test-case生成方法。论文实验指出效果不错，超过ChatGPT的表现，作者认为这个功劳归功于加入了深度强化学习。而且消融实验证明reward function中语法错误损失非常重要。

重新详述一下解决的问题：数据集采用的是APPS，它采集自各大在线OA平台，包括问题描述（requirement）,问题参考答案代码（code），测试用例（test case）。这样的三元组构成了一条训练数据。

打赏作者

发表回复取消回复