【Software Clone】2014-IEEE-Towards a Big Data Curated Benchmark of Inter-Project Code Clones

Abstract 大数据的克隆检测和搜索算法已经做为嵌入在应用中的一部分.git 本文推出一个代码检测基准.包含一些已知的真假克隆代码.其中包括600万条真克隆(包含type-1,type-2,type-3,type-4).github S1   Introduction IJaDataset 2.0包含25,000个系统,365MLOC(Million Lines of Code).经过人工标记
相关文章
相关标签/搜索