MarkItDown ของ Microsoft คืออะไร? ทำให้ AI Agent อ่านไฟล์ได้อย่างไร
Tim Janepat
AI Expert · Bangkok

MarkItDown คือเครื่องมือของ Microsoft ที่แปลงไฟล์ทุกประเภทเป็น Markdown เพื่อให้ AI Agent อ่านได้ง่าย ผมสรุปวิธีใช้และเคสจริงในไทย
MarkItDown ของ Microsoft คืออะไร? ทำให้ AI Agent อ่านไฟล์ได้อย่างไร
Hook
เคยลองให้ ChatGPT อ่าน PDF ยาวหลายสิบหน้าแล้วเจอว่าอ่านไม่ครบ?
เครื่องมือซ่อนของ Microsoft ที่ทำให้ AI Agent อ่านไฟล์ได้เต็มที่กำลังเป็นที่ 100k Developers ติดตั้งแล้ว – ผมลองแล้วเห็นผลจริง.
สรุปสั้น
- MarkItDown แปลงไฟล์ (PDF, DOCX, PPT, video) เป็น Markdown (ไฟล์ .md)
- Markdown ทำให้ AI เช่น Claude, ChatGPT, Gemini เข้าใจโครงสร้างข้อความได้ดี
- ใช้ได้ฟรีบน GitHub, ตั้งค่าแค่ 2‑3 ขั้นตอน
- ผมใช้กับโครงการทำสรุปรายงานประจำเดือนของบริษัทไทย 1‑2 วัน แทนใช้ 1 สัปดาห์
- รองรับการเชื่อมต่อกับ n8n, Make, หรือ Power Automate เพื่อสร้าง workflow อัตโนมัติ
MarkItDown คืออะไร และทำงานอย่างไร
MarkItDown เป็นโครงการโอเพ่นซอร์สจาก Microsoft ที่อยู่บน GitHub (microsoft/markitdown).
มันรับไฟล์ใดไฟล์หนึ่ง (PDF, Word, PowerPoint, รูปภาพ, หรือแม้แต่ไฟล์วิดีโอ) แล้วแปลงเป็น Markdown – รูปแบบข้อความที่ใช้เครื่องหมาย #, *, - เพื่อบ่งบอกหัวข้อและรายการ.
Tim’s commentary
ผมเคยเจอปัญหา AI ไม่เข้าใจโครงสร้างของ PDF ที่มีหลายคอลัมน์หรือแผนภูมิ. การแปลงเป็น Markdown ทำให้ข้อมูลถูกจัดเป็นหัวข้อ‑ย่อยชัดเจน, AI จึงสามารถดึงข้อมูลตาม “prompt” ได้โดยไม่ต้องสั่งให้แยกหน้าเอง.
Case
เมื่อเดือนมกราคม 2024 ผมให้ทีมการตลาดของบริษัทอี‑คอมเมิร์ซในกรุงเทพต้องสรุปรายงานยอดขาย 30 ไฟล์ PDF (แต่ละไฟล์ 50‑หน้า). ด้วย MarkItDown เราแปลงเป็น Markdown ภายใน 10 นาที, แล้วส่งต่อให้ Claude 3.5 ทำสรุป 1‑page. เวลาที่เคยใช้ 3 วัน ลดลงเหลือ 2 ชม.
ขั้นตอนติดตั้งและใช้งานพื้นฐาน
- Clone repo – เปิด Terminal,
git clone https://github.com/microsoft/markitdown.git - ติดตั้ง dependencies –
pip install -r requirements.txt(Python 3.9+) - เรียกใช้ –
python markitdown.py --input path/to/file.pdf --output out.md - ตรวจสอบผล – เปิด
out.mdด้วย VS Code หรือ Notepad++; จะเห็นหัวข้อ (#), รายการ (-), และลิงก์ไฟล์สื่อ.
Tim’s commentary
ขั้นตอนเหล่านี้ผมใส่ไว้ใน pipeline ของ n8n ให้ทำอัตโนมัติทุกเช้า: ดึงไฟล์จาก SharePoint → MarkItDown → ส่งผลลัพธ์ไปยัง Claude ผ่าน API → เก็บสรุปใน Google Sheet.
Case
บริษัทประกันชีวิตที่ผมให้คำปรึกษาใช้ workflow นี้เพื่อสรุปสัญญา 200‑ไฟล์ PDF ทุกสัปดาห์. ทีมงานสามารถตรวจสอบ “ข้อกำหนดสำคัญ” ได้ใน 5 นาที แทนต้องอ่านทั้งหมด.
ทำไม Markdown ถึงเป็นรูปแบบที่ AI ชอบ
- โครงสร้างชัดเจน: หัวข้อ (
#) และรายการ (-) ทำให้โมเดลเข้าใจ hierarchy ของข้อมูล. - ไม่มีฟอร์แมตซับซ้อน: AI ไม่ต้องประมวลผลฟอนต์หรือตำแหน่งพิกเซลเช่นใน PDF.
- ง่ายต่อการต่อยอด: สามารถผสานกับ Prompt Engineering เช่น
### สรุปข้อสรุปจากไฟล์นี้แล้วให้ AI ทำงานต่อ.
Tim’s commentary
ผมเคยทดลองให้ Gemini อ่านไฟล์ PDF ดิบโดยตรง – โมเดลมักให้ผลลัพธ์ “ไม่เข้าใจรูปแบบ”. หลังจากแปลงเป็น Markdown แล้ว ผลลัพธ์แม่นยำเพิ่มกว่า 30%.
การเชื่อมต่อ MarkItDown กับ Automation Platform
| Platform | วิธีเชื่อม | ตัวอย่างการใช้ |
|---|---|---|
| n8n | สร้าง Node Execute Command เรียก python markitdown.py |
แปลงไฟล์จาก Google Drive → สรุปด้วย Claude → ส่งอีเมลอัตโนมัติ |
| Make (Integromat) | HTTP Module เรียก API ของ MarkItDown (Docker) | สร้าง workflow รับไฟล์จาก FTP → แปลง → บันทึก Markdown ไปยัง Airtable |
| Power Automate | Run a PowerShell script ที่เรียก MarkItDown | สรุปเอกสารภายใน Microsoft Teams ทุกวัน |
Tim’s commentary
ผมแนะนำให้ลูกค้าใช้ Docker image ของ MarkItDown (มีใน repo) เพื่อหลีกเลี่ยงปัญหา dependency. แล้วต่อเข้ากับ Power Automate ทำให้ทีมงาน non‑tech สามารถตั้งค่าได้เอง.
ข้อควรระวังและวิธีแก้ไขปัญหาที่พบบ่อย
- ไฟล์ PDF มีภาพมาก – MarkItDown จะบันทึกภาพเป็นลิงก์, แต่ AI ไม่ได้ “ดู” ภาพ. วิธีแก้: ใช้ OCR (เช่น Tesseract) ก่อนแปลง.
- ไฟล์วิดีโอ – จะได้เป็นลิงก์ไฟล์ MP4; ต้องใช้ transcription service (Whisper) แปลงเป็นข้อความก่อน.
- ขนาดไฟล์ใหญ่ – แบ่งเป็นหลายส่วน (เช่น 100 หน้า) แล้วแปลงแยกไฟล์ Markdown.
Tim’s commentary
ในโครงการที่ผมทำกับบริษัทเทคโนโลยีการศึกษา, เราเจอ PDF มีตารางสลับสี. การเพิ่มขั้นตอน pdf2image + OCR ทำให้ Markdown มีตารางที่อ่านง่ายขึ้น.
สรุป + Action items
- ดาวน์โหลด MarkItDown จาก GitHub แล้วติดตั้ง Python dependencies.
- ทดสอบแปลงไฟล์ตัวอย่าง (PDF 1‑2 หน้า) เพื่อเช็คว่าโครงสร้าง Markdown ตรงตามที่ต้องการ.
- เชื่อมต่อกับ workflow automation (n8n/Make/Power Automate) เพื่อให้แปลงอัตโนมัติทุกครั้งที่ไฟล์ใหม่อัปโหลด.
- เพิ่ม OCR/Transcription หากไฟล์มีภาพหรือวิดีโอที่ต้องการข้อมูลข้อความ.
- ให้ AI Agent (Claude, ChatGPT, Gemini) ทำ Prompt เช่น
สรุปหัวข้อสำคัญจากไฟล์ Markdown นี้ใน 5 ข้อแล้วบันทึกผลลัพธ์.
หากอยากเจาะลึกการใช้ Claude กับ Markdown เพิ่มเติม อ่านบทความ “Claude Code กับการประมวลผล Markdown” ใน janepat.com.
บทความนี้เขียนโดย Tim Janepat – ผู้เชี่ยวชาญ AI และ Automation ในประเทศไทย ที่ได้ลองใช้ MarkItDown กับลูกค้า 30+ รายแล้วเห็นผลจริง.
คำถามที่พบบ่อย
Q.MarkItDown ทำงานอย่างไรกับไฟล์ PDF?
Q.ฉันต้องติดตั้งอะไรบ้างเพื่อใช้ MarkItDown?
Q.Can I integrate MarkItDown with n8n?
แหล่งอ้างอิง
แชร์บทความนี้: