开源众包
105人浏览/46人投稿
892天前
已托管赏金
1. 文档查重(1) :和论文发表时侯的查重一样,先展示出完全重复的部分,然后再按照主谓宾或者其他逻辑实现相似的识别。(2) :支持本地word、excel、pdf、txt文件之间的批量查重,也可以建立比对库进行查重。(3) :对本地的文件进行查重,适用于本地文档查重、标书查重/辅助检测串标、作业查重、或者是论文写作时与参考文献之间进行论文查重等多个应用场景。(4) :根据语义识别技术查重,分析词、段落的语义,并进行相识度打分对比,可自定义设定相似度阈值,提取重复内容。(5) :可基于标准词库、叙词库扩展概念查重。(6) :支持白名单词库,白名单词不参与重复校验。(7) :支持图片查重,可设定图片白名单,白名单不参与重复校验。(8) :生成文档查重报告,报告格式支持docx、doc、pdf、html等。(9) :文档自查重,同一文档中不同的段落出现重复,给出重复标注。二、文档审查(1):文档格式:支持word、excel、pdf、txt等格式文档审查。(2):文档审查校验:涵盖文档中各类别疑似错误统计列表,可查看页面中错误更改情况,并生成对应的统计图展示详细错误占比情况,并可对文档进行再次审核。(3):文档自动校正:针对专业知识标准库(可自定义标准库),可对格式错误和语义错误两大主要文档问题进行自动校正。(4):文档质量智能评分:将依据文档的各类错误扣分自动对文档质量进行评估,采用百分制,可以查看每类的详细得分。评分模型中的各类错误的扣分及最大扣分数均可在后台配置设定,以满足不同业务需求。(5):生成文档审查报告,报告格式支持docx、doc、pdf、html等。(6):敏感词库,将文档中出现的敏感词重点标注并输出到报告中。