สรุปการตั้งค่า robots.txt สำหรับ AI

📌 สรุปสั้น ๆ

ถ้าไม่มีไฟล์ robots.txt เว็บของคุณจะเปิดให้ AI และ search engine ทุกค่ายเข้าถึงได้อยู่แล้ว (ค่าเริ่มต้นคือ Allow ทั้งหมด)
แต่การใส่ไฟล์นี้จะช่วยให้คุณประกาศเจตนาอย่างเป็นทางการว่า “อนุญาตให้ AI เข้าถึงข้อมูลได้” และยังช่วยให้ระบบค้นหาดึงข้อมูลเว็บคุณได้เร็วขึ้น

✅ ตัวอย่างไฟล์ robots.txt (อัปเดต ต.ค. 2025)

# ✅ Allow all AI crawlers (Updated Oct 2025)
# Includes OpenAI: GPTBot, ChatGPT-User, OAI-SearchBot

User-agent: *
Allow: /

# --- OpenAI ---
User-agent: GPTBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: OAI-SearchBot
Allow: /

# --- Anthropic (Claude) ---
User-agent: ClaudeBot
Allow: /
User-agent: Claude-Web
Allow: /
User-agent: anthropic-ai
Allow: /

# --- Perplexity ---
User-agent: PerplexityBot
Allow: /

# --- Google / Gemini ---
User-agent: Googlebot
Allow: /
User-agent: Google-Extended
Allow: /

# --- Apple Intelligence ---
User-agent: Applebot
Allow: /
User-agent: Applebot-Extended
Allow: /

# --- Microsoft / Bing ---
User-agent: Bingbot
Allow: /

# --- Amazon ---
User-agent: Amazonbot
Allow: /

# --- DuckDuckGo ---
User-agent: DuckDuckBot
Allow: /

# --- You.com ---
User-agent: YouBot
Allow: /

# --- Common Crawl ---
User-agent: CCBot
Allow: /

# --- Search / Meta AI Crawlers ---
User-agent: SearchBot
Allow: /
User-agent: Meta-ExternalAgent
Allow: /
User-agent: Diffbot
Allow: /
User-agent: cohere-ai
Allow: /

# Sitemap
Sitemap: https://yourdomain.com/sitemap.xml

💬 รายละเอียดสำคัญ

ชื่อบอทค่ายหน้าที่
GPTBotOpenAIรวบรวมข้อมูลเพื่อพัฒนาโมเดล
ChatGPT-UserOpenAIใช้เมื่อผู้ใช้เปิดเว็บผ่าน ChatGPT (Browsing Mode)
OAI-SearchBotOpenAIใช้โดย ChatGPT Search Engine
ClaudeBot / Claude-WebAnthropicบอทของ Claude AI
PerplexityBotPerplexity AIใช้ในระบบ Perplexity Search
Googlebot / Google-ExtendedGoogle Geminiใช้ใน Search + Gemini
Applebot / Applebot-ExtendedApple Intelligenceใช้ในระบบ AI ของ Apple

🧭 ถ้าไม่มี robots.txt เลย?

  • AI และ search engine ทุกค่ายยังสามารถเข้าถึงเว็บได้อยู่ดี ✅
  • แต่คุณไม่สามารถควบคุมได้ว่าบางส่วนของเว็บจะถูก index หรือไม่
  • ดังนั้น ถ้าอยากให้แน่ใจว่า “อนุญาตทั้งหมด” — แนะนำให้ใส่ไฟล์นี้ไว้ดีกว่า

📘 สรุปท้าย

หากคุณต้องการให้เว็บเปิดสำหรับ AI ทุกค่าย:

  1. วางไฟล์นี้ไว้ที่ https://yourdomain.com/robots.txt
  2. แก้ Sitemap ให้เป็นของจริง
  3. ตรวจสอบว่าเว็บโหลดได้จากภายนอก (ไม่มี firewall block)

ปลั๊กอิน Wordpress แจ่ม ๆ อยู่ที่นี่