收藏
一、项目信息
采购人:之江实验室
项目名称:大批量文档离线解析服务
拟采购的货物或服务的说明:
标的名称:大批量文档离线解析服务 数量:1 预算金额(元):*开通会员可解锁* 单位:项 货物或服务的说明:大批量文档离线解析服务的指标要求:▲1、平均公式识别率高于0.9;▲2、公式召回率高于0.9;▲3、公式F1高于0.9;▲4、版面检测准确率mAP高于60%;▲5、段落识别-编辑距离-中文不高于0.4;▲6、段落识别-编辑距离-英文不高于0.4;▲7、表格识别-TEDS-中文高于60%;▲8、表格识别-TEDS-英文高于60%;▲9、公式识别-编辑距离-中文不高于0.4;▲10、公式识别-编辑距离-英文不高于0.4;▲11、公式识别-CDM-中文高于60%;▲12、公式识别-CDM-英文高于60%;▲13、阅读顺序-编辑距离-中文不高于0.4;▲14、阅读顺序-编辑距离-英文不高于0.4;▲15、批量处理能力:支持一次性解析大量文件,单次处理文件数量不低于5000个;▲16、处理速度:1个月内处理超过5000万页;▲17、支持多种文件格式:支持处理PDF(含扫描件)、图片(JPEG、PNG等)、djvu、epub、mobi等多种常见文献存储格式。
拟采购的货物或服务的预算总金额(元):*开通会员可解锁*
采用单一来源采购方式的原因及说明:本项目主要用于科学文献数据制备和科学书籍数据制备。根据项目要求,数据制备流程中的OCR识别技术须满足平均公式识别率大于0.9,公式召回率大于0.9等技术指标。经项目组调研,仅Mathpix公司提供的大批量文档转换和OCR服务能够满足对公式识别准确率、批处理能力、处理速度和稳定性等技术指标的需求。广东朴华源科技有限公司是Mathpix产品在浙江省的唯一代理商,经专家论证,认为本项目符合《中华人民共和国政府采购法》第三十一条的规定,同意采用单一来源方式进行采购。
二、拟定供应商信息
名称:广东朴华源科技有限公司
地址:广州市番禺区南村镇万博二路202号1座507
三、公示期限
*开通会员可解锁*至*开通会员可解锁*
四、其他补充事宜
无
五、联系方式
联 系 人:俞老师
联系电话:*开通会员可解锁*
联系地址:杭州市余杭区中泰街道之江实验室新园区一期西区1号楼13楼
六、附件
专业人员论证意见(格式见附件)
附件信息:
单一来源采购方式专业人员论证意见.pdf (0.1 KB)