COWFLOW

目录结构

.
├── ans 最终结果输出文件
├── assembler.cpp 汇编词法分析
├── assembler.h
├── assembler.l 汇编词法分析lex 文件
├── cal.cpp 代码相似程度计算
├── cal.h
├── code 用于查重以及处理后的代码
│ ├── assembler 反汇编得到的汇编代码
│ │ ├── *.s
│ │ └── ...
│ ├── c 用于查重的源代码
│ │ ├── *.c
│ │ └── ...
│ ├── parse 提取并筛选函数名、操作码后的汇编代码 .p 是随便想的后缀
│ │ ├── *.p
│ │ └── ...
│ └── Makefile 负责编译查重的 c 代码并反汇编成汇编文件
├── config.cpp 读取 config.ini 配置文件
├── config.h
├── config.ini cowflow 配置文件
├── function.cpp 从 ./code/assembler 里的汇编代码中提取需要的函数名和操作码，输出到 ./code/parse
├── function.h
├── getFunc.sh 从汇编代码里根据函数名找到函数下的操作码
├── km.cpp KuhnMunkres 算法，用于解决二分图最大权匹配问题
├── km.h
├── launch.cpp main 函数，负责初始化等操作
├── lcs.cpp 计算字符串的 lcs
├── log.cpp 日志，非线程安全
├── log.h
├── log.txt 最终输出的日志文件
├── Makefile
├── netflow.cpp SPFA 增广，用于解决费用流问题
├── netflow.h
└── README.md

使用

将需要查重的代码放在 ./code/c 目录下，并在 ./code 目录下执行 make
./code 目录下 make 后得到的汇编代码在 ./code/assembler 下
再在初始目录执行 make
运行 ./cowflow

代码阅读说明

宏定义采用全大写，用下划线分隔
变量名采用驼峰命名法，全局变量首字母大写，其他变量首字母小写
public 函数名首字母必须大写
private 函数名首字母必须小写

lex

和 lex 相关的三个文件：assembler.l、function.cpp、Makefile

原则

不希望和 lex 相关的变量、宏定义对外暴露

缺点

目前只支持词法分析输出到文件，想获得到词法分析的内容还需要再从文件读取

assembler.l

用于通过 lex 生成词法分析程序，对汇编代码进行词法分析，筛选需要的函数和操作码

只定义了两种类型的 token：

函数名：形如尖括号后跟一个冒号，尖括号内的即为函数名。正则表达式：<(.*?)>:。同时会调用 parseFuncName 忽略 wasteFunctionList 列表里的函数名
操作码：目前只添加了常见的且去除后缀的操作码。如想补全，链接：https://www.felixcloutier.com/x86/index.html

lex 相关

%option c++ 用于生成 c++ 的词法分析程序
%option outfile="assembler.cpp" 用于生成指定名称的 .cpp 代码（之前默认是 lex.yy.cc）
%option header-file="assembler.h" 用于生成被 include 的 .h 代码
yyless(num)：返回匹配到的 token 的前面 num 个字符，num 后的内容回退到输入
YYLeng()：c++ 模式下替代 yyleng
YYText()：c++ 模式下替代 yytext

用法及输出

文档：http://dinosaur.compilertools.net/flex/flex_19.html
源码：https://casa.nrao.edu/doxygen/classyyFlexLexer.html

FlexLexer *lexer;
std::ifstream in;
std::ofstream out;

i.open(fileInput);	// fileInput fileOutput 类型为 char*，即输入输出的文件名
o.open(fileOutput);
lexer = new yyFlexLexer;
while(num = lexer -> yylex(&i, &o)) {	// 如果不带参数默认标准输入输出
    /* empty */
}

.l 文件内如果想要输出到目标输出，用 yyout << something

function.cpp

用了 lex 后 function.cpp 内没什么东西了，就简单看一下怎么从 .cpp 用 lex 生成的头文件

Makefile

关注一下 assembler 前缀的文件的编译链即可，没什么坑点，注意需要放在被 include 的文件之前

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

COWFLOW

目录结构

使用

代码阅读说明

lex

原则

缺点

assembler.l

function.cpp

Makefile

Files

README.md

Latest commit

History

README.md

File metadata and controls

COWFLOW

目录结构

使用

代码阅读说明

lex

原则

缺点

assembler.l

function.cpp

Makefile