任务详情
我们正在启动一个大规模数据收集项目,旨在收集 15 万张真实文档图像,用于 OCR(光学字符识别)和 AI 算法训练。该项目将有助于改进机器读取印刷文本的能力,从而支持数字计费系统、自动费用跟踪、扫描应用以及视障人士辅助工具等技术。
目的和合法性
此项数据收集计划合法且已获批准。收据图像将严格用于技术目的,例如提高机器学习读取真实打印数据的准确性。我们不会提取任何个人信息或将其用于任何其他目的。这些图像将被视为用于文本识别训练的匿名数据样本。
照片类型:
1.火车票/机票:电子版 清晰全屏UI截图,纸质版1张票/25张不同背景的完整清晰照片;
2. 发票:包括商业、医院、旅行或官方发票,1张发票 /25张图片;完整详细信息(徽标、日期、金额、组织名称) 使用真实世界的设置(办公桌、文件夹、桌子) 必须与一般账单或收据明显不同;
3.电子票: 仅限电子版:交通、活动、酒店、预约 ;每张票 1 张屏幕截图(全屏 UI)
每种类型最多 20 张屏幕截图;
4.账单:打印或手写的水电费账单(电费、水费等) ;必须显示提供商名称、日期、用户名、金额 ,正反都有即2 张图片,单面则1张照片;
拍摄要求:使用 12MP+ 智能手机或相机 ;无滤镜、美化、HDR 或 AI 效果
保持图像清晰、聚焦,并保留原始色彩
自然光,室内柔和光,闪光灯需分散,照顾均匀,避免曝光 反射等不清晰,不可扫描件
自然场景:书桌沙发,地铁 咖啡厅等,使用自上而下或倾斜拍摄(30-45°)
持有文件时:仅可见部分手/手指 ;手臂不应超过框架的 1/6 ;改变环境和照明 ;每个角都应该可见。
注意事项:禁止模糊、裁剪或扫描的图像(电子票除外);禁止完整的手/手臂可见性
禁止重叠的文档 ;禁止跨类别重复使用图像