pdf-extract-api: 结合 OCR 和 LLM 实现高质量的本地文档智能化处理# 基于现代 OCR 技术和 LLM 的 PDF 文档解析 API, 能够将 PDF/图片高精度转换为 Markdown/JSON 格式, 支持数学公式识别、隐私信息删除, 完全本地部署无需云服务, 适合对数据隐私敏感的企业级应用场景。

发布时间: 2024-11-07 04:00:15

1分

数据加载中

关注推特

收听电报

2

1

0

pdf-extract-api: 结合 OCR 和 LLM 实现高质量的本地文档智能化处理
# 基于现代 OCR 技术和 LLM 的 PDF 文档解析 API, 能够将 PDF/图片高精度转换为 Markdown/JSON 格式, 支持数学公式识别、隐私信息删除, 完全本地部署无需云服务, 适合对数据隐私敏感的企业级应用场景。
时政
( twitter.com )

1年前由 meng shao 提交

pdf-extract-api: 结合 OCR 和 LLM 实现高质量的本地文档智能化处理 @CatchtheTornado

# 基于现代 OCR 技术和 @ollama LLM 的 PDF 文档解析 API, 能够将 PDF/图片高精度转换为 Markdown/JSON 格式, 支持数学公式识别、隐私信息删除, 完全本地部署无需云服务, 适合对数据隐私敏感的企业级应用场景。

※ 核心功能
- 可以将任何PDF文档或图片转换为 Markdown 文本或 JSON 结构化文档
- 支持数学公式的高精度识别和转换
- 能够自动移除文档中的个人身份信息(PII)
- 支持 OCR 识别和文档解析

※ 技术架构
- 基于 @FastAPI 构建 API 服务
- 使用 Celery 处理异步 OCR 任务
- 使用 Redis 进行缓存
- 结合 PyTorch 的 OCR(Marker) 和 Ollama 模型
- 完全本地部署, 无需外部云服务依赖

※ 关键特性
- 高质量 OCR: 使用不同的 OCR 策略确保高精度转换
- LLM 增强: 使用 Llama 模型改进 OCR 结果, 修复拼写和文本问题
- 隐私保护: 可以移除敏感个人信息
- 分布式处理: 使用 Celery 实现队列处理
- GPU 支持: 支持 GPU 加速

项目地址:
https://t.co/r4NZM8CpCg

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：

1

892

891

891

两头都忙不过来了，美女们都456了
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 6 评论

2

205

204

204

拍完，看我怎么草粉？
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

3

143

142

142

最近作息时间调整了一下。今天改成上午发。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

4

153

152

152

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

5

691

690

690

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

6

872

871

871

喜欢你被撞的每一下
活动圆满结束
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

7

205

204

204

几个月没玩3p了，今天一次性解馋，约了2个炮友服务我，老公在旁边负责拍照
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

8

584

583

583

又是疯狂的一天……
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

9

43

42

42

那一下拨到你的心旋了吗
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

10

578

577

577

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

11

482

481

481

周末啦！想要拍这样视频的可以联系起来啦~~
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

12

131

130

130

做爱需要双方有好的配合才能达到最佳状态
才能把各种姿势发挥到应有的效果
这让情人着迷，他傻傻的已经分不清谁在X谁
嘻嘻
在男人身上跳舞的赶紧也很不错啊
只有他够大够劲
跟大佬投稿
谢谢
@91porm
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 2 评论

13

62

61

61

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

14

249

248

248

上一个是她自己拍的，这个是我的角度
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

15

653

652

652

如果你喜欢乖的又拒绝不了骚的我就白天叫你老公晚上叫你爸爸白天披头发晚上双马尾又乖又骚
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 4 评论

16

863

862

862

Watch video
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

17

874

873

873

老公既然同意了,那享受就完了。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

18

316

315

315

在吗？看看奶，转推评论呀小哥哥，抽几个送自拍视频
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

19

24

23

23

有没有小哥哥入门槛啊@Xijierqi
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

20

108

107

107

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

21

500

499

499

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

22

485

484

484

《透明时装秀》NO.17季
看露出
最爽的莫过于时装表演
各个肤白貌美大长腿
袒胸露乳无视人前
刺激你的每一根神经
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

23

227

226

226

巨乳姐姐洗澡视频完整版过了门槛的小哥哥vx上找我观看哦。
另外，抽一个同城的小哥哥一起洗澡，给我留言吧❤️
@xiaolaqiuzhang
@shenmingss
@Xijierqi
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

24

194

193

193

就不一一回覆了谢谢你们的祝福
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

25

421

420

420

别饿着，挺累的，抓紧时间补充体力
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论