工程概论第二次作业

发布时间 2023-09-20 18:55:47作者: 橙子李子

个人项目 ———Java实现论文查重算法

这个作业属于哪个课程 https://edu.cnblogs.com/campus/jmu/ComputerScience21
这个作业要求在哪里 https://edu.cnblogs.com/campus/jmu/ComputerScience21/homework/13034
这个作业的目标 进一步熟悉Github得使用,完成查重算法的设计与测试,学习搭建项目的流程

需求

题目:论文查重

描述如下:

设计一个论文查重算法,给出一个原文文件和一个在这份原文上经过了增删改的抄袭版论文的文件,在答案文件中输出其重复率。

原文示例:今天是星期天,天气晴,今天晚上我要去看电影。
抄袭版示例:今天是周天,天气晴朗,我晚上要去看电影。
要求输入输出采用文件输入输出,规范如下:

从命令行参数给出:论文原文的文件的绝对路径。
从命令行参数给出:抄袭版论文的文件的绝对路径。
从命令行参数给出:输出的答案文件的绝对路径。
我们提供一份样例,课堂上下发,上传到班级群,使用方法是:orig.txt是原文,其他orig_add.txt等均为抄袭版论文。

注意:答案文件中输出的答案为浮点型,精确到小数点后两位

开发环境

开发环境#
语言选择:Java 17

使用工具:IDEA 2020.1.1

测试环境:Windows11 22H2

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 45 35
Estimate 估计这个任务需要多少时间 400 502
Development 开发 100 90
Analysis 需求分析 (包括学习新技术) 45 40
Design Spec 生成设计文档 20 20
Design Review 设计复审 25 20
Coding Standard 代码规范 (为目前的开发制定合适的规范) 5 7
Design 具体设计 55 30
Coding 具体编码 60 80
Code Review 代码复审 30 25
Test 测试(自我测试,修改代码,提交修改) 50 60
Reporting 报告 40 50
Test Repor 测试报告 30 25
Size Measurement 计算工作量 10 10
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 20 10
合计 535 502

算法思路