任务详情
背景说明:我们是一个AI团队,目前业务增长非常快,目前已经人力不够,现在希望以人力外包的形式给我们提供支撑,例如安排2~3 AI人员驻场,费用可以商量,地域武汉需求说明:目前大概有6种形式的版面,详情看样例参考。主要是使用OCR提取图片中的公司名称,姓名,身份证号码(姓名和身份证号码需要对应)。输入是包含一种或多种版面的图片或pdf文件,最终输出信息结构化后的Json格式,其中若是pdf文件,需要输出页码与对应提取的内容。输入要求:支持扫描件或印刷体类型的jpg,png等图片base64格式,或pdf格式文件输出要求:信息结构化后的json返回验收标准:在常规字迹清晰的数据下:针对公司名称识别准确率大于95%,姓名和身份证号准确率大于99%。在字迹不清晰情况下:针对公司名称识别准确率大于90%,姓名和身份证号准确率大于95%。交付清单:接口文档,代码,模型权重文件,运行环境和版本号,dockerfile文件。注意点:1、需要考虑到图片或pdf倾斜的情况2、考虑到公司名称,姓名有生僻字,相似字的情况3、姓名和身份证号码要一一对应,不能错乱4、有一定抗干扰能力,如被印章等遮挡(不做强制要求)