您的位置:首页 > 任务详情
招标模式 重复文档比对算法开发
  • 雇主:mike
  • 发布时间:2025-10-21
  • 分类:程序开发

待商议

免责声明 该外包需求信息来源于站外平台,本站仅提供公开信息部分字段展示与订阅服务,更多请查看免责声明。

任务详情

1.需求概述:通过对采集到的数据内容进行智能分析匹配,找到历史信息中的重复文档,并给出处理建议。 2.需要提供一套算法,可以实现从10万个文档中找到重复的文档,要求能够提供重复度。 传统的方法是两两对比。但是如果要实现10万个文档的对比,需要对比100000*100000/2= 50亿次。如果每次对比1秒,那么需要使用57870年。 这样的对比是不现实的,因此要求提供的算法不需要对比那么多次,可以提取每个文档的特征,然后后续文章通过特征对比即可。 如果有开源的算法,建议使用开源的算法。不建议自己开发算法。 注:不要电话联系。

任务附件 (0)

暂无稿件哦!

预期中标

已中标

0

快去分享,提高任务的曝光率吧

  • 发布需求     2025.10.21
  • 服务商报价    
  • 选择服务商并托管资金    
  • 服务商工作    
  • 验收付款    
  • 评价