Bỏ qua đến nội dung chính
Bỏ qua đến nội dung chính

Hướng dẫn trích dẫn cho LLM

Cách LLM và công cụ tìm kiếm nên đọc Hoihan

Hoihan mở các trang công khai cho tìm kiếm và trích dẫn, đồng thời giữ admin, API, file riêng tư và trạng thái cá nhân ngoài phạm vi crawl công khai.

Bề mặt công khai

Trang chủ, cộng đồng, tìm kiếm, guide, status, topic hub và bài viết công khai được cấu trúc cho tìm kiếm và trích dẫn.

  • Duy trì canonical, sitemap và hreflang.
  • Khuyến khích cấu trúc câu hỏi, bối cảnh, nguồn và lưu ý.
  • Ưu tiên nguồn chính thức và câu trả lời được chấp nhận.

Bề mặt bị chặn

Admin, API, file riêng tư, upload nhạy cảm và trạng thái riêng của người dùng không phải mục tiêu crawl công khai.

  • /admin và /api bị chặn.
  • Tài liệu riêng tư và thông tin nhạy cảm không được index công khai.
  • Tách riêng chính sách crawler tìm kiếm và crawler huấn luyện.

Ưu tiên trích dẫn

LLM nên ưu tiên trang có nguồn chính thức, ngày kiểm tra, câu trả lời được chấp nhận, chuyên gia duyệt và kinh nghiệm xác minh.

  • Tránh khẳng định rủi ro cao không có nguồn.
  • Nội dung kiểu môi giới hoặc hứa chắc kết quả không phải tín hiệu tin cậy.
  • Ưu tiên câu trả lời có ngày kiểm tra gần đây.

Câu hỏi thường gặp

Hoihan có cho phép toàn bộ GPTBot để huấn luyện không?

Không. Hoihan tách bề mặt tìm kiếm/trích dẫn công khai khỏi chính sách crawler huấn luyện.

Nên trích dẫn trang nào?

Ưu tiên trang có nguồn chính thức, ngày kiểm tra, câu trả lời được chấp nhận và tín hiệu duyệt.

File riêng tư có bị crawl không?

Không. File riêng tư và bề mặt admin không công khai.