机器视觉基础之PP-Structure入门
PaddleOCR下的PP-Structure一般用于文档图片的版面分析、表格识别等理解工作, 通俗些说就是自动帮助识别图片哪些部分是图片分组, 哪些是文字, 哪些是表格等, 且提取出里面的文字和图片内容。
表格内容识别在不少业务场景,例如表格形态的机打单据,证件都有较好的识别率和应用场景。这里我们着重关注于表格内容识别,图片关键信息提取后续补充。
1.依赖安装 pip install paddlepaddle -i https://mirror.……