概述
AI结合传统OCR技术,识别图片pdf中的文本并提取图片生成 markdown文本
项目部分截图
工作流

图片pdf源文件


识别生成的markdown文本



项目细节
技术方案概述
(一)pdf拆分
将上传的pdf文件拆分为多个指定页数的pdf小文件
(二)AI大模型识别pdf文本内容生成markdown文本
利用ai大模型识别的pdf中的文本内容,并将文本内容转换为markdown文本,其中”图片”部分替换为”md-picture”关键字
(三)ORC识别并提取df中的图片
使用传统OCR技术识别pdf中的图片,将图片从pdf提取并上传到图片服务器,生成图片url链接
(四)markdown文本合并替换”md-picture”关键字
将所有的markdown文本合并,并将文本中的”md-picture”关键字替换为图片url链接
测试案例
测试地址:http://10.254.31.137:30000/workflow/bpjOz0SpJt3ROEWe
点击“从本地上传”,上传要转换的pdf文件,之后点击“运行”开始执行

执行成功后会输出“文件下载链接”

文件中是转换后的markdown文本内容

附件
作者:admin 创建时间:2025-07-01 20:48
最后编辑:陈晓东 更新时间:2025-12-18 17:33
最后编辑:陈晓东 更新时间:2025-12-18 17:33