文档转markdown实测 - 微软markitdown

编程文章jaq1232025-07-08 0:41:4541A⁺A^-

来源：黄建同学

微软markitdown出来之后，广受欢迎，今天我们来实测一下看看效果如何！

微博：

github：

测试时间：2024-12-16

1. 代码

比较简单，和github项目写的一样

代码

2. PDF文件

PDF输入

PDF输出

PDF中的图片丢失，而且PDF里面的段落结构/标题/粗体也没有体现出来。

我试了一下以下代码，尝试用LLM去分析图片，一样的效果（看来LLM分析只适合图片分析）

LLM识别图像代码

3. PPT文件

PPT输入

PPT输出

输出内容包括Slide分割、每张Slide的标题和正文

图片输出为"内容占位符3.JPG"，有点奇怪

3. Word文档

Word输入

Word输出

保留大标题，小标题，图片有识别，转成一段base64的占位data

4. Excel文件

Excel输入

Excel输出

5. 图片OCR

需要切换到以下代码，通过LLM来识别图像。

图像LLM识别代码

OCR输入图像

OCR结果

能够借助LLM识别并分析图片的内容

6. Audio音频

中文音频结果

英文音频结果

不支持中文音频，支持英文音频

尝试了传入LLM来解析中文音频，也不支持。

7. HTML文件

HTML输入

HTML输出

Head 标签里面的内容都没输出，其他内容正常。

点击这里复制本文地址以上内容由jaq123整理呈现，请务必在转载分享时注明本文地址！如对内容有疑问，请联系我们，谢谢！