Linux系统中利用node.js提取Word(doc/docx)及PDF文本的内容 前言想要做全文搜索引擎,则需要将word/pdf等文档内容提取出来。对于pdf有xpdf等一些开源方 读取word文档