📌 สรุปสั้น ๆ
ถ้าไม่มีไฟล์ robots.txt เว็บของคุณจะเปิดให้ AI และ search engine ทุกค่ายเข้าถึงได้อยู่แล้ว (ค่าเริ่มต้นคือ Allow ทั้งหมด)
แต่การใส่ไฟล์นี้จะช่วยให้คุณประกาศเจตนาอย่างเป็นทางการว่า “อนุญาตให้ AI เข้าถึงข้อมูลได้” และยังช่วยให้ระบบค้นหาดึงข้อมูลเว็บคุณได้เร็วขึ้น
✅ ตัวอย่างไฟล์ robots.txt (อัปเดต ต.ค. 2025)
# ✅ Allow all AI crawlers (Updated Oct 2025) # Includes OpenAI: GPTBot, ChatGPT-User, OAI-SearchBot User-agent: * Allow: / # --- OpenAI --- User-agent: GPTBot Allow: / User-agent: ChatGPT-User Allow: / User-agent: OAI-SearchBot Allow: / # --- Anthropic (Claude) --- User-agent: ClaudeBot Allow: / User-agent: Claude-Web Allow: / User-agent: anthropic-ai Allow: / # --- Perplexity --- User-agent: PerplexityBot Allow: / # --- Google / Gemini --- User-agent: Googlebot Allow: / User-agent: Google-Extended Allow: / # --- Apple Intelligence --- User-agent: Applebot Allow: / User-agent: Applebot-Extended Allow: / # --- Microsoft / Bing --- User-agent: Bingbot Allow: / # --- Amazon --- User-agent: Amazonbot Allow: / # --- DuckDuckGo --- User-agent: DuckDuckBot Allow: / # --- You.com --- User-agent: YouBot Allow: / # --- Common Crawl --- User-agent: CCBot Allow: / # --- Search / Meta AI Crawlers --- User-agent: SearchBot Allow: / User-agent: Meta-ExternalAgent Allow: / User-agent: Diffbot Allow: / User-agent: cohere-ai Allow: / # Sitemap Sitemap: https://yourdomain.com/sitemap.xml
💬 รายละเอียดสำคัญ
| ชื่อบอท | ค่าย | หน้าที่ |
|---|---|---|
| GPTBot | OpenAI | รวบรวมข้อมูลเพื่อพัฒนาโมเดล |
| ChatGPT-User | OpenAI | ใช้เมื่อผู้ใช้เปิดเว็บผ่าน ChatGPT (Browsing Mode) |
| OAI-SearchBot | OpenAI | ใช้โดย ChatGPT Search Engine |
| ClaudeBot / Claude-Web | Anthropic | บอทของ Claude AI |
| PerplexityBot | Perplexity AI | ใช้ในระบบ Perplexity Search |
| Googlebot / Google-Extended | Google Gemini | ใช้ใน Search + Gemini |
| Applebot / Applebot-Extended | Apple Intelligence | ใช้ในระบบ AI ของ Apple |
🧭 ถ้าไม่มี robots.txt เลย?
- AI และ search engine ทุกค่ายยังสามารถเข้าถึงเว็บได้อยู่ดี ✅
- แต่คุณไม่สามารถควบคุมได้ว่าบางส่วนของเว็บจะถูก index หรือไม่
- ดังนั้น ถ้าอยากให้แน่ใจว่า “อนุญาตทั้งหมด” — แนะนำให้ใส่ไฟล์นี้ไว้ดีกว่า
📘 สรุปท้าย
หากคุณต้องการให้เว็บเปิดสำหรับ AI ทุกค่าย:
- วางไฟล์นี้ไว้ที่
https://yourdomain.com/robots.txt - แก้
Sitemapให้เป็นของจริง - ตรวจสอบว่าเว็บโหลดได้จากภายนอก (ไม่มี firewall block)

