docx损坏了 如何提取有用的文字信息

docx损坏了 如何提取有用的文字信息

Word 提供了一个“从任意文件中恢复文本”的文件转换器,可以用来从任意文件中提取文字,你可以尝试一下。步骤如下:

打开 Word ,依次点击“工具”菜单上→“选项”,切换到“常规”选项卡,选中“打开时确认转换”选项,点击“确定”。在“文件 ”菜单上单击“打开”命令,在“文件类型”框中,选择“从任意文件中恢复文本”,然后选择损坏的文档。这时系统会弹出“转换文件”对话框,选择文件格式为“纯文本”,单击“确定”按扭即可。不过,选择了“纯文本”方式打开文档后,仅能恢复文档中的普通文字,原文档中的图片对象将丢失,页眉页脚等非文本信息也将变为普通文字。