可以把pdf转成html的工具
ubuntu 指令 docker run -ti --rm -v ~/pdf:/pdf bwits/pdf2htmlex pdf2htmlEX --zoom 1.3 test.pdf

pdf2htmlex github链接