在 Windows 操作系统中,可以使用 PowerShell 脚本批量提取多个 Word 文档中的文字。具体步骤如下:
1. 打开 Windows Powershell。在命令提示符中输入 "powershell" 并按回车键启动 PowerShell。
2. 进入要保存提取文本的文件夹。可以通过 "cd" 命令进入到该文件夹。
3. 输入以下脚本来批量提取 Word 文档中的文本:
```powershell
$word = New-Object -ComObject Word.Application
Get-ChildItem *.docx | foreach { $doc = $word.Documents.Open($_.FullName); $doc.Content.Text | Out-File $_.Name.Replace(".docx", ".txt"); $doc.Close() }
$word.Quit()
```
这个脚本会创建一个 Word 应用程序实例,循环遍历当前目录下的所有 .docx 文件,打开每个文档并获取其内容,将文本输出到一个同名的.txt 文件中,并关闭文档。
4. 运行脚本。在 PowerShell 中执行该脚本。
5. 完成后,在当前文件夹中会生成和 Word 文档同名的 .txt 文件,其中包含对应 Word 文档中的文本。
需要注意的是,如果文档中有一些图片或表格等内容,这个脚本只会提取文本。如果需要提取更多的内容,需要对脚本进行修改。