CodeRL

"CodeRL can be extended and improved in various ways. For example, it can be easily integrated with other (better pretrained) LMs, and improved with more fine-grained feedback from the environment, such as feedback received from a static code analyzer."

TDD

这篇论文提出了一个基于深度强化学习和小语言模型(770M参数)的text2test-case生成方法。论文实验指出效果不错,超过ChatGPT的表现,作者认为这个功劳归功于加入了深度强化学习。而且消融实验证明reward function中语法错误损失非常重要。

重新详述一下解决的问题:数据集采用的是APPS,它采集自各大在线OA平台,包括问题描述(requirement),问题参考答案代码(code),测试用例(test case)。这样的三元组构成了一条训练数据。

打赏作者

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

CAPTCHA