工具推荐:markitdown - 转换文件为 Markdown

一个 Python 工具转换文件为 Markdown,方便自己使用 Markdown 成为的笔记。

介绍

一个 Python 工具转换文件为 Markdown,方便自己使用 Markdown 成为的笔记。

支持的文件格式如下:

  • PDF

  • PowerPoint

  • Word

  • Excel

  • Images (EXIF metadata and OCR)

  • Audio (EXIF metadata and speech transcription)

  • HTML

  • Text-based formats (CSV,JSON,XML)

  • ZIP files (iterates over contents)

Github:https://github.com/microsoft/markitdown

使用

工具支持多种使用方式:命令行,Python API 以及 Docker 等,下面以命令行为主介绍。

1
2
3
4
5
6
# 安装
pip install markitdown

# 转换 pdf
markitdown path-to-file.pdf > document.md
markitdown path-to-file.pdf -o document.md
Licensed under CC BY-NC-SA 4.0
最后更新于 Dec 21, 2024 06:56 UTC
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计