品玩9月5日讯,据OpenDataLab官方消息,为解决企业级大模型应用中非结构化数据解析难题,OpenDataLab与钉钉基于智能文档解析引擎MinerU,联合推出面向企业用户的文档解析工具DLU(Document Language Understanding)。该工具将于近期开源,旨在降低AI应用开发门槛,加速AI技术在各行业落地。
作为上海AI实验室旗下项目,MinerU在GitHub已获超4万星标,其2.0版本以0.98B参数实现比肩72B主流大模型的解析性能。DLU继承了MinerU的技术优势,不仅支持Office、PDF等主流格式,还兼容钉钉自有文档、AI表格等特殊格式,可精准提取图表、公式、化学分子式等复杂元素,转化为适合大模型训练的高质量语料。
未来DLU将深度融入钉钉办公协同生态,支持从文档创建、解析到定制化模型训练的全流程闭环。OpenDataLab创始人何聪辉表示,希望将其打造成“数据工具中的PyTorch”,而钉钉CTO朱鸿则强调,开源DLU将助力企业筑牢智能化转型的数据根基,推动千行百业数字化升级。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。!
本文链接:https://www.wanhaidao.com/article-14339-1.html