Bỏ qua tới nội dung chính
SEO & Audit kỹ thuật

Internal Link và Orphan Page: Audit Từ Kiến Trúc

Internal Link và Orphan Page: Audit Từ Kiến Trúc

Một bài hướng dẫn có thể dài 3.000 chữ, được tối ưu title và có ảnh riêng, nhưng nếu không trang nào trên website dẫn tới nó thì bài vẫn giống một căn phòng không có hành lang. Sitemap giúp crawler biết địa chỉ tồn tại; internal link mới cho biết bài nằm ở đâu trong cấu trúc, liên quan tới chủ đề nào và người đọc nên tìm đến nó từ ngữ cảnh nào.

Đó là lý do audit liên kết nội bộ không nên bắt đầu bằng câu hỏi “mỗi trang cần bao nhiêu link”. Câu hỏi hữu ích hơn là: trang quan trọng đã nhận được đường dẫn phù hợp chưa, đường dẫn đó có crawl được không, và anchor có giúp người đọc dự đoán đúng nội dung đích không?

Liên kết nội bộ là link từ một trang tới trang khác trên cùng website. Một link tốt đồng thời hỗ trợ ba lớp:

  1. Khám phá: crawler và người dùng tìm được URL mới.
  2. Ngữ cảnh: anchor text và nội dung xung quanh mô tả quan hệ giữa hai trang.
  3. Ưu tiên: cấu trúc link cho thấy trang nào là hub, trang nào là nội dung hỗ trợ và trang nào gần hành động chuyển đổi.

Chỉ đếm số link bỏ qua hai lớp sau. Một trang nhận 200 link từ footer có thể kém rõ ngữ cảnh hơn trang nhận 12 link từ các bài chuyên sâu liên quan. Ngược lại, một trang bán hàng chỉ được nhắc trong một bài cũ ở độ sâu năm click khó được xem là điểm đến quan trọng.

Orphan page là gì?

Orphan page là URL không nhận được internal link crawlable từ các trang khác trong website. Trang có thể vẫn xuất hiện trong sitemap, được Google biết qua backlink, dữ liệu lịch sử hoặc một feed, nhưng người dùng đi theo navigation thông thường không tìm thấy nó.

Cần phân biệt ba trạng thái:

  • Orphan thật: không có internal link nào trỏ tới URL.
  • Gần orphan: chỉ có một link yếu, nằm sâu hoặc từ trang không còn traffic.
  • Orphan có chủ đích: landing page chiến dịch, trang xác nhận hoặc tài liệu riêng không cần tham gia cấu trúc tìm kiếm.

Không phải orphan nào cũng cần “cứu”. Trang cảm ơn sau khi gửi form không nên được thêm vào menu chỉ để công cụ crawl báo màu xanh. Audit tốt phải quyết định URL có vai trò gì trước khi thêm link.

Vì sao crawler vẫn thấy trang nhưng cấu trúc vẫn có vấn đề?

Sitemap là danh sách URL bạn muốn công cụ tìm kiếm biết và ưu tiên crawl. Nó không thay thế navigation. Khi một URL chỉ tồn tại trong sitemap, Google thiếu nhiều tín hiệu ngữ cảnh mà link từ danh mục, bài viết hoặc breadcrumb có thể cung cấp.

Người dùng cũng không duyệt sitemap XML để tìm hướng dẫn tiếp theo. Nếu một bài chỉ nhận traffic từ Google nhưng không có đường vào và đường ra hợp lý, website bỏ lỡ lượt xem trang tiếp theo, cơ hội chuyển đổi và khả năng giúp người đọc hoàn thành công việc.

Hãy coi sitemap là danh mục địa chỉ, còn internal link là bản đồ đường đi. Hai thứ nên thống nhất, nhưng không thể làm thay công việc của nhau.

Chuẩn bị dữ liệu trước khi audit

Một audit đáng tin cần ít nhất bốn nguồn:

Crawl website từ một điểm vào

Crawler bắt đầu ở trang chủ và đi theo các link tìm được. Kết quả cho biết URL nào thực sự có thể khám phá qua cấu trúc hiện tại, độ sâu click, status code và anchor.

Danh sách URL trong sitemap

Dùng Sitemap Checker để xem sitemap index, số URL và tình trạng tệp. Danh sách này đại diện cho những URL website chủ động gửi đi.

Trang có traffic hoặc impression

Xuất landing page từ analytics và trang từ Google Search Console. Một URL có impression nhưng không xuất hiện trong crawl là ứng viên orphan rõ ràng.

URL từ CMS hoặc cơ sở dữ liệu

Danh sách bài published, sản phẩm active, danh mục và landing page trong hệ thống giúp phát hiện trang chưa từng được đưa vào sitemap hoặc navigation.

Gộp bốn nguồn theo URL chuẩn hóa. Cần thống nhất HTTP/HTTPS, hostname, dấu gạch chéo cuối, chữ hoa và tham số. Nếu không, cùng một trang có thể bị tính thành nhiều dòng và tạo orphan giả.

Quy trình tìm orphan page không bỏ sót

Bước 1: Xác định tập URL hợp lệ

Loại asset, trang admin, URL preview, tham số tracking và các route không phải nội dung. Chỉ giữ URL mà một người có trách nhiệm nội dung có thể giải thích mục đích.

Bước 2: Đánh dấu nguồn phát hiện

Thêm các cột crawl, sitemap, GSC, analytics, CMS. URL có trong CMS và sitemap nhưng không có trong crawl là orphan hoặc link không crawl được. URL có trong GSC nhưng không có CMS có thể là đường dẫn cũ cần redirect hoặc trả trạng thái phù hợp.

Google khuyến nghị link ở dạng thẻ <a> có thuộc tính href. Một phần tử div gắn sự kiện JavaScript, nút chỉ thay đổi route trong bộ nhớ hoặc a không có href không phải đường dẫn đáng tin cậy cho crawler.

Ví dụ rõ ràng:

<a href="/huong-dan/seo-hinh-anh">Đọc hướng dẫn SEO hình ảnh</a>

Đừng chỉ nhìn giao diện có bấm được. Hãy xem HTML đã render và xác nhận URL nằm trong href.

Bước 4: Phân loại theo quyết định

Mỗi orphan nên vào một trong bốn nhóm:

  1. Thêm vào cấu trúc vì nội dung còn giá trị.
  2. Hợp nhất và redirect vì trùng với trang khác.
  3. Giữ riêng nhưng noindex vì không dành cho tìm kiếm.
  4. Xóa và trả 404 hoặc 410 vì không còn mục đích.

Một cột “người phụ trách” và “hạn xử lý” quan trọng hơn thêm mười cột điểm số.

Topic cluster thường gồm một trang hub và các trang hỗ trợ. Hub trả lời bức tranh tổng quát, sau đó dẫn tới hướng dẫn chuyên biệt. Các trang con liên kết trở lại hub và nối sang nhau khi người đọc có bước tiếp theo hợp lý.

Ví dụ cụm technical SEO:

  • Hub: checklist audit technical SEO.
  • Nhánh: robots.txt và sitemap.
  • Nhánh: canonical và nội dung trùng.
  • Nhánh: mã HTTP và redirect.
  • Nhánh: JavaScript rendering.
  • Nhánh: Core Web Vitals.

Không cần mọi trang con liên kết tới mọi trang còn lại. Nếu sáu bài đều có một khối “bài liên quan” giống hệt, cấu trúc trở nên ồn và ít ngữ cảnh. Link nên xuất hiện tại đoạn người đọc thật sự cần kiến thức tiếp theo.

Bài canonical URL và nội dung trùng lặp là ví dụ một nhánh có thể được dẫn từ checklist audit và quay lại hub, thay vì phải gắn vào mọi bài SEO.

Anchor text: rõ nghĩa trước, từ khóa sau

Anchor “xem thêm” không sai trong mọi trường hợp, nhưng nó không nói được nội dung đích. Anchor tốt mô tả chủ đề hoặc hành động: “kiểm tra chuỗi redirect”, “cách viết alt text cho ảnh sản phẩm” hoặc “quy trình nối Google Search Console”.

Ba nguyên tắc đủ dùng:

  1. Viết anchor như một phần tự nhiên của câu.
  2. Mô tả đúng nội dung trang đích, không hứa quá mức.
  3. Dùng biến thể khi ngữ cảnh thay đổi, không ép một cụm chính xác ở mọi nơi.

Anchor quá dài có thể làm đoạn văn khó đọc. Anchor chỉ có tên thương hiệu có thể thiếu ngữ cảnh cho một bài chuyên môn. Cân bằng dựa trên người đọc, không dựa trên mật độ.

Với ảnh dùng làm liên kết, alt text có thể đóng vai trò anchor. Vì vậy ảnh click được cần alt mô tả đích hoặc chức năng, không phải danh sách từ khóa.

Navigation giúp truy cập các khu vực cốt lõi: sản phẩm, dịch vụ, tài nguyên, giá hoặc liên hệ. Không nên đưa hàng chục bài blog vào menu cấp một. Hãy dẫn tới hub hoặc danh mục đủ tốt để phân phối tiếp.

Breadcrumb cho biết vị trí của trang trong phân cấp và tạo đường quay lại danh mục cha. Nó đặc biệt hữu ích với ecommerce, tài liệu và blog có taxonomy rõ. Breadcrumb không sửa được cấu trúc danh mục lộn xộn; nó chỉ phản ánh cấu trúc bạn đã chọn.

Đây thường là link có ngữ cảnh mạnh nhất. Một đoạn giải thích lỗi 503 dẫn tới bài về mã HTTP giúp người đọc chuyển bước đúng lúc. Link như vậy có giá trị sử dụng rõ hơn danh sách dài ở footer.

Khối bài liên quan

Khối này hữu ích khi được chọn theo chủ đề và cập nhật. Nếu hệ thống chọn ngẫu nhiên hoặc chỉ dựa trên ngày mới nhất, nó có thể tạo đường dẫn ít liên quan. Thuật toán liên quan nên dùng taxonomy, thực thể, hành vi hoặc quy tắc biên tập, đồng thời tránh lặp đúng các link đã có trong bài.

Sửa độ sâu click một cách có chọn lọc

“Mọi trang phải cách trang chủ tối đa ba click” là khẩu hiệu dễ nhớ nhưng không phù hợp mọi website. Một kho tài liệu 50.000 URL không thể đặt tất cả gần trang chủ mà vẫn giữ navigation dễ dùng.

Thay vì áp một ngưỡng cứng, hãy so sánh độ sâu với mức quan trọng:

  • Trang doanh thu chính nên có đường ngắn và ổn định.
  • Hub quan trọng nên được dẫn từ navigation hoặc trang danh mục.
  • Nội dung hỗ trợ có thể sâu hơn nhưng phải có đường từ hub.
  • Trang lưu trữ, phiên bản cũ hoặc phụ lục có thể sâu nếu người dùng hiếm khi cần.

Khi một trang quan trọng ở độ sâu sáu, đừng chỉ thêm link từ trang chủ. Xem lại các lớp danh mục ở giữa. Có thể một hub bị thiếu, phân trang không crawl được hoặc bộ lọc đang thay vai trò của navigation.

Internal link nên trỏ thẳng tới URL cuối. Sau migration, website thường còn hàng nghìn link tới địa chỉ cũ. Redirect vẫn đưa người dùng tới nơi, nhưng tạo thêm request, làm log khó đọc và giữ kiến trúc cũ sống dai. Kiểm tra bằng Redirect Chain Checker.

Broken link làm đứt hành trình. Soft 404 khó thấy hơn: server trả 200 nhưng nội dung báo không tìm thấy hoặc gần như trống. Hãy kiểm tra cả status và nội dung phản hồi.

Link tới trang noindex không luôn là sai, vì trang có thể cần cho người dùng. Tuy nhiên, nếu hàng trăm bài dồn link tới một URL mà bạn chủ động loại khỏi tìm kiếm, cần xem lại mục tiêu.

URL tương đối sai ngữ cảnh

href="huong-dan" có thể tạo địa chỉ khác nhau tùy URL hiện tại. Với component dùng lại ở nhiều cấp thư mục, nên kiểm tra URL resolve thực tế hoặc dùng đường dẫn bắt đầu bằng /.

Nội dung trong tab hoặc accordion có thể được xử lý nếu có trong HTML. Nhưng nếu link chỉ được tải sau khi rê chuột, cuộn tới cuối hoặc gọi API sau thao tác phức tạp, khả năng khám phá kém ổn định hơn. Đường dẫn quan trọng nên có trong HTML mà crawler nhận được.

Một audit có thể trả về hàng chục nghìn cơ hội. Sửa tuần tự theo số dòng là cách nhanh nhất để tiêu tốn thời gian.

Hãy chấm ưu tiên bằng bốn câu hỏi:

  1. Trang đích có giá trị kinh doanh hoặc tìm kiếm cao không?
  2. Link nguồn có traffic, backlink hoặc quan hệ chủ đề mạnh không?
  3. Việc thêm link có giúp người đọc hoàn thành bước tiếp theo không?
  4. Lỗi nằm ở template hay từng bài riêng lẻ?

Lỗi template luôn đáng chú ý vì một lần sửa có thể cải thiện hàng nghìn trang. Với link biên tập, bắt đầu từ các trang nguồn có traffic và các URL đích ở gần trang một của kết quả tìm kiếm. Một liên kết đúng ngữ cảnh đôi khi giúp nhiều hơn 50 link được thêm cho đủ chỉ tiêu.

Theo dõi sau khi triển khai

Lưu bản crawl trước khi sửa để có mốc so sánh. Sau khi release:

  • Crawl lại và kiểm tra số orphan, broken link, redirect link.
  • Xác nhận hub và trang doanh thu có độ sâu hợp lý hơn.
  • Theo dõi crawl request và trạng thái index trong Search Console.
  • Xem click sang trang tiếp theo trong analytics.
  • Đo query và landing page của nhóm nội dung được cải tổ.

Đừng mong mọi thứ đổi sau hai ngày. Crawler cần quay lại, hệ thống tìm kiếm cần xử lý quan hệ mới, còn dữ liệu chuyển đổi cần đủ mẫu. Với website vừa, đánh giá đầu tiên sau bốn tuần và lần thứ hai sau tám đến mười hai tuần thường thực tế hơn.

Một quy tắc xuất bản giúp không tạo orphan mới

Thêm “đường vào” và “đường ra” vào checklist biên tập:

  • Trước khi publish, chọn ít nhất một hub hoặc bài liên quan sẽ dẫn tới URL mới.
  • Trong bài mới, thêm các link thật sự cần cho người đọc.
  • Đặt bài vào taxonomy và sitemap phù hợp.
  • Sau khi publish, bấm link từ trang nguồn để xác nhận URL, locale và status.
  • Với bài quan trọng, kiểm tra sau một chu kỳ crawl xem nó đã được phát hiện chưa.

Con số link tối thiểu không phải phần quan trọng nhất. Một link từ đúng hub có thể tốt hơn năm link từ các bài không liên quan.

Rà nhanh toàn bộ tín hiệu: chạy SEO audit miễn phí để phát hiện URL khó khám phá, redirect và lỗi on-page trước khi lập kế hoạch chỉnh cấu trúc.

Kết luận

Liên kết nội bộ là kiến trúc sử dụng website được viết bằng các đường dẫn. Nó giúp crawler khám phá URL, giúp công cụ tìm kiếm hiểu quan hệ chủ đề và giúp người đọc đi tiếp mà không phải quay lại Google.

Muốn sửa orphan page, hãy bắt đầu từ danh sách URL đầy đủ, so sánh nhiều nguồn, xác nhận link có href, rồi quyết định trang cần được kết nối, hợp nhất, noindex hay xóa. Sau đó thiết kế đường dẫn dựa trên nhiệm vụ của người đọc. Một cấu trúc tốt không có nhiều link nhất; nó có những link đúng chỗ và có lý do.

Nguồn tham khảo: Google Search Central về link crawlable và anchor textGoogle Search Central về sitemap.

Quảng cáo

Câu hỏi thường gặp

Trang có trong sitemap nhưng không có internal link có phải orphan không?
Có thể xem là orphan trong cấu trúc navigation. Sitemap giúp phát hiện URL nhưng không cung cấp đầy đủ đường đi và ngữ cảnh như internal link crawlable.
Mỗi trang cần tối thiểu bao nhiêu internal link?
Không có con số phù hợp cho mọi website. Trang quan trọng cần ít nhất một đường vào rõ ràng từ hub hoặc nội dung liên quan; chất lượng và ngữ cảnh quan trọng hơn số lượng.
Có nên thêm mọi orphan page vào menu chính?
Không. Hãy xác định vai trò trước. Một số trang nên nối từ topic hub, một số nên hợp nhất, noindex hoặc xóa thay vì làm menu trở nên quá tải.
#Technical SEO #On-page SEO #Search Console

Nhận bản tóm tắt SEO checklist qua email

Đăng ký để nhận bản tóm tắt các bước tối ưu SEO quan trọng nhất từ bài viết này.

Kiểm tra website của bạn miễn phí

Chạy SEO audit hoặc kiểm tra chất lượng traffic ngay — không cần đăng ký.