Làm thế nào để bạn tìm thấy các trang không có liên kết?
Nó gần như không thể.
Nếu bạn có các trang trên trang web của mình mà người dùng và công cụ tìm kiếm không thể truy cập. Đây là một vấn đề quan trọng bạn cần phải giải quyết nó ngay!
Loại trang này có tên: Trang mồ côi .
Trong bài đăng này, bạn sẽ tìm hiểu được trang mồ côi là gì, tại sao việc sửa chúng lại quan trọng đối với SEO và cách tìm mọi trang mồ côi trên trang web của bạn.
Trang mồ côi là gì?
Một trang không có bất kỳ liên kết đến nó được gọi là một trang mồ côi.
Để Google và các công cụ tìm kiếm khác lập chỉ mục các trang của bạn, họ cần biết chúng tồn tại và ở đâu.
Điều này thường được thực hiện theo một trong hai cách:
- Trình thu thập thông tin theo một liên kết từ một trang khác.
- Trình thu thập thông tin tìm thấy URL được liệt kê trong sơ đồ trang XML của bạn .
Tại sao các trang mồ côi là vấn đề quan trọng với SEO?
Bởi vì các công cụ tìm kiếm không thể tìm thấy một trang mồ côi thông qua các liên kết khác ở cuối, các trang mồ côi thường không được tìm thấy và không bao giờ hiển thị trong kết quả tìm kiếm.
Ngay cả khi các trang mồ côi của bạn được liệt kê trong sơ đồ trang web XML của bạn, chúng vẫn là một vấn đề đối với SEO.
Không có liên kết nội bộ, không có thẩm quyền nào được chuyển đến các trang và công cụ tìm kiếm không có ngữ cảnh cấu trúc hoặc ngữ nghĩa để đánh giá trang.
Không có bất kỳ cách nào để biết toàn bộ trang phù hợp với trang web của bạn, việc xác định các truy vấn mà trang có liên quan sẽ khó khăn hơn.
Trang mồ côi so với trang cụt
Trước khi chúng tôi đi sâu vào các trang mồ côi, tôi muốn dành một chút thời gian để làm rõ một chút về sự khác biệt giữa các trang mồ côi và trang cuối, vì đã có một số nhầm lẫn giữa các thuật ngữ SEO này .
Như đã nói ở trên, trang mồ côi là một trang web không được liên kết bởi hoặc có thể truy cập từ bất kỳ trang nào khác trên cùng một trang web.
Mặt khác, một trang cụt là một trang web không liên kết với bất kỳ trang web nội bộ nào khác hoặc bất kỳ trang web bên ngoài nào, do đó tạo ra một ngõ cụt đầu ra.
Khi khách hàng truy cạp vào trang này, họ có thể quay lại hoặc từ bỏ trang web vì không có link đề dẫn qua các nền tảng khác. Khi công cụ tìm kiếm thu thập dữ liệu truy cập vào trang, chúng không có nơi nào để đi và không có tài sản liên kết nào có thể được thông qua.
Ngày nay, với rất nhiều mẫu và chủ đề có sẵn, việc tạo ra một trang cụt khó khăn hơn – nhưng hầu như không thể. Một trang cụt có thể dễ dàng được khắc phục bằng cách thêm liên kết vào nội dung trên trang của bạn hoặc trong thanh bên hoặc điều hướng chân trang.
Nấu đã hiểu được những tổng quan trên thì bây giờ hãy tìm các trang mồ côi của bạn!
1. Xác định các trang có thể thu thập dữ liệu của bạn
Trước tiên, bạn sẽ cần một danh sách tất cả các URL hiện có thể đạt được bằng cách thu thập các liên kết trang web của bạn.
Bạn sẽ cần một SEO spider để làm điều này. Tôi khuyên bạn nên ScreamingFrog.
Dù bạn sử dụng trình thu thập thông tin nào, hãy đảm bảo rằng nó được đặt để chỉ thu thập dữ liệu các trang có thể lập chỉ mục bởi các công cụ tìm kiếm, nghĩa là nó không nên thu thập dữ liệu các trang không có nội dung hoặc các trang bị ẩn khỏi công cụ tìm kiếm bởi robot.txt.
Bắt đầu thu thập thông tin từ trang chủ của trang web, đảm bảo sử dụng URL chuẩn, bao gồm https hoặc http và www thích hợp so với không phải www.
Khi bạn đã thu thập dữ liệu trang web của mình, hãy xuất URL sang bảng tính như thế này:
2. Giải quyết 2 nguyên nhân phổ biến của các trang mồ côi
Trước khi kiểm tra bất kỳ công cụ hoặc nguồn nào để tìm các trang mồ côi, có hai nguyên nhân phổ biến của các trang mồ côi cần được xử lý ngay lập tức và xử lý.
Điểm chung của cả hai nguyên nhân này là về cơ bản chúng là các bản sao trang sẽ tự động chuyển hướng chung đến chỉ một URL.
Nếu chúng không như vậy, có khả năng một số phiên bản của trang không được liên kết đến và kết quả là trang mồ côi.
Trong trường hợp này, việc nó là trang mồ côi không phải là vấn đề chính, thực tế là chúng là bản sao.
Tuy nhiên, những thứ này sẽ xuất hiện sau trong khi bạn đang tìm kiếm các trang mồ côi và cần phải xử lý, vì vậy tốt nhất là bạn nên loại bỏ chúng trước.
Không chính tắc https / http hoặc www / không www
Mỗi trang công khai trên trang web của bạn nên sử dụng http hoặc https một cách nhất quán (tốt nhất là https) và www hoặc không phải www một cách nhất quán.
Để kiểm tra xem đây có phải là trường hợp không, hãy thử nhập tất cả các biến thể của trang chủ trang web của bạn vào trình duyệt của bạn:
- https://www.example.com
- http://www.example.com
- https://example.com
- http://example.com
Tất cả bốn biến thể sẽ tự động chuyển hướng đến cùng một URL.
Bạn nên kiểm tra điều này trên một vài trang khác trên trang web của bạn và kiểm tra tệp .htaccess của trang web của bạn để đảm bảo rằng các chuyển hướng cho những trang này được thiết lập đúng.
Dấu gạch chéo
Một điều khác để coi chừng là sử dụng nhất quán các dấu gạch chéo.
Ví dụ: hai URL này có thể tạo ra cùng một nội dung, nhưng các URL không giống nhau:
- https://example.com/page1/
- https://example.com/page1
Kiểm tra một vài trang trên trang web của bạn cả có và không có dấu gạch chéo và đảm bảo rằng chúng tự động chuyển hướng đến cùng một URL và chúng thực hiện một cách nhất quán.
3. Nhận danh sách URL từ Google Analytics
Trình thu thập thông tin, theo định nghĩa, sẽ có một thời gian khó khăn để tìm các trang mồ côi.
Vì vậy, sử dụng bất kỳ công cụ SEO để tìm một công cụ chắc chắn là có vấn đề.
Sau đó, nơi tốt nhất để bắt đầu tìm kiếm các trang mồ côi là dữ liệu Google Analytics của riêng bạn (hoặc bất kỳ gói phân tích nào khác mà bạn sử dụng).
Chừng nào các trang trong câu hỏi có cài đặt Google Analytics, nếu trang đã từng được truy cập, có một kỷ lục của nó ở đâu đó trong Google Analytics.
Để có được danh sách toàn diện các URL, từ thanh bên trái, hãy chọn Phần mềm Tất cả các trang trong mục “Site content” trực tuyến từ phần “Behavior”:
Vì các trang mồ côi của chúng tôi rất khó tìm, nên số lần chúng được truy cập có thể khá thấp.
Nhấp vào Số lượt xem Số lượt xem để mũi tên hướng lên trên, cho biết danh sách các URI được sắp xếp theo thứ tự tăng dần từ ít nhất đến hầu hết các lần xem trang.
Điều này sẽ di chuyển các trang rất có thể là trang mồ côi lên đầu:
Hãy chuyển đến phạm vi thời gian ở trên cùng bên phải và đặt ngày bắt đầu trở lại thời điểm trước khi Google Analytics được đặt và nhấp vào nút Áp dụng:
Bây giờ sẽ cần mở rộng danh sách URL càng nhiều càng tốt.
Ở góc dưới bên phải, nhấp vào menu Hiển thị hàng của hàng Menu thả xuống và chọn số lượng hàng cao nhất.
Trở ngại lớn nhất là Analytics chỉ có thể liệt kê tối đa 5.000 URL mỗi lần:
Nếu bạn có nhiều hơn thế, bạn sẽ phải xuất 5.000 trang cùng một lúc cho đến khi bạn có tất cả dữ liệu khách truy cập Google Analytics của mình.
Có thể sẽ mất một chút thời gian để Analytics tìm nạp tất cả dữ liệu. Hãy kiên nhẫn và đừng cố vội vàng mọi thứ nếu không bạn sẽ có nguy cơ làm hỏng trình duyệt của mình.
Khi các URL được tải, hãy đi lên trên cùng bên phải, chọn xuất và xuất một trang tính Google, tệp Excel hoặc bảng tính CSV để nhận URL của bạn.
Bây giờ sao chép URL từ tệp phân tích đã xuất của bạn vào bảng tính trang mồ côi của bạn, như vậy:
Bạn sẽ cần đưa chúng vào định dạng URL để chúng hữu ích. Để làm điều này, chèn một cột mới và dán xuống URL trang chủ, như vậy:
Và sử dụng công thức concat () để kết hợp chúng lại với nhau thành một URL trong cột tiếp theo:
Sau đó, chỉ cần kéo công thức xuống để có danh sách đầy đủ các URL:
4. Xác định URL mồ côi của bạn
Để xác định các URL mồ côi bạn cần so sánh danh sách các URL có thể thu thập dữ liệu của Google
Trong ví dụ trên, rõ ràng https://example.com/11 là trang mồ côi, nhưng thực tế bạn sẽ luôn có nhiều URL hơn để sàng lọc và bạn sẽ cần tự động hóa quá trình xác định URL mồ côi của chúng tôi .
Để làm điều này, bạn cần một công thức kiểm tra xem mỗi URL trong danh sách Analytics của chúng tôi cũng được tìm thấy trong danh sách các URL có thể thu thập dữ liệu của chúng tôi.
Dưới đây là một ví dụ về một công thức sẽ thực hiện điều này:
Công thức trận đấu trên mạng mà chúng tôi đã sử dụng trong ô E2 ở đây là:
= trận đấu (D2, $ A $ 2: $ A $ 11,0)
Công thức này kiểm tra xem URL trong ô D2 có nằm trong phạm vi $ A $ 2: $ A $ 11 không. (Nếu bạn không quá quen thuộc với bảng tính, các ký hiệu đô la sẽ ở đó để đảm bảo rằng khi bạn kéo công thức xuống cột, phạm vi sẽ không thay đổi.)
Giá trị NỮ 0 0 nói với Google Sheets rằng các cột không nhất thiết phải được sắp xếp.
Nếu có sự trùng khớp, công thức trả về vị trí của nó trong phạm vi, trong trường hợp này là vị trí đầu tiên trong phạm vi.
Như bạn có thể thấy, công thức trả về lỗi # N / A cho https://example.com/11, vì nó không được tìm thấy trong danh sách URL có thể thu thập dữ liệu của chúng tôi. Điều này có nghĩa là nó là một trang mồ côi.
Sau đó, để có được danh sách các trang mồ côi của chúng tôi, tất cả những gì chúng ta cần làm là sắp xếp cột Trận đấu để thu thập tất cả các kết quả # N / A ở một nơi.
Sau đó, bạn có thể sao chép danh sách URL mồ côi của mình và dán chúng vào một trang tính mới nơi chúng tôi có thể giải quyết cách khắc phục chúng.
5. Các địa điểm khác để tìm URL mồ côi
Bạn có thể lặp lại quy trình này để xác định URL mồ côi bằng các nguồn dữ liệu khác ngoài Google Analytics.
Bất kỳ công cụ nào sau đây cũng sẽ có danh sách các trang được thu thập từ trang web của bạn:
- SEMrush
- Ahrefs
- Moz Link Explorer
- Raven Tools
Tuy nhiên, có thể trong một số trường hợp, các công cụ này sẽ tìm thấy các trang không thể thu thập dữ liệu trực tiếp vì chúng được tìm thấy bằng các phương tiện khác, thường tại một số thời điểm trong lịch sử khi trang có thể thu thập dữ liệu:
Ngoài ra, bạn nên làm việc với nhóm nhà phát triển của mình để xem liệu họ có thể nhận được danh sách URL đầy đủ trên trang web trực tiếp từ máy chủ hay không, vì đây sẽ là danh sách đầy đủ nhất có sẵn ở bất cứ đâu.
Mặc dù các trang này rõ ràng được lập chỉ mục nếu chúng hiển thị ở đây, bạn vẫn có thể tìm thấy các trang không thể thu thập dữ liệu từ các liên kết nội bộ của bạn sẽ cần phải được sửa chữa.
Phần kết luận
Các trang mồ côi không thể được lập chỉ mục bởi các công cụ tìm kiếm nếu chúng không hiển thị trong sơ đồ trang web của bạn – và chúng có thể tạo ra các vấn đề SEO khác ngay cả khi chúng xảy ra.
Sử dụng các phương pháp được nêu trong bài đăng này để tìm các trang mồ côi của bạn và giải quyết vấn đề này ngay nhé! Chúc bạn thành công!
Tâm Trần – ATPSOFTWARE
————————————————————-
Liên hệ ATP Software
Website : https://atpsoftware.vn/
Group : https://www.facebook.com/groups/ATPSupport/
Page : https://www.facebook.com/atpsoftware.tools/
Hotline : 0931 9999 11 – 0967 9999 11 – 1800 0096