Nhiều người bị ám ảnh bởi mọi thứ mà Matt Cutts nói bất kể đâu, trên blog, phương tiện truyền thông, tài liệu chia sẻ … Nhưng Google không chỉ có một mình Matt Cutts, và bạn có thể lắng nghe nhiều từ phía họ để tốt hơn cho website của mình. Người mà tôi muốn nói tới ở đây chính là Dan Crow, một người thuộc nhóm quản lý chất lượng tìm kiếm của Google và là người quản lý nhóm thu thập dữ liệu.
Minh họa Đạt nhiều chỉ mục từ Google (Google Index)
Sau đây là một cuộc trò chuyện không chính thức của Jonathan Hochman (Search Engine Watch) và Dan Crow ít nhiều sẽ giúp chúng ta có được những hướng dẫn tốt nhất để đạt được nhiều chỉ mục từ Google.
Lời khuyên của Dan Crow cho các webmaster.
Dan đã bắt đầu cuộc nói chuyện bằng việc đề cập tới World Wide Web rất rộng lớn, và kể cả Google cũng không dám chắc nó lớn đến như thế nào. Họ có thể lập chỉ mục chỉ một phần nào trong đó mà thôi. Google có đủ khả năng để trang bị nhiều máy chủ lưu trữ hơn, nhưng vấn đề lại nằm ở việc không có đủ băng thông và năng lượng (điện) có sẵn để lập chỉ mục toàn bộ internet. Chương trình thu thập dữ liệu và lập chỉ mục của Google được tin tưởng bởi chúng là những siêu máy tính lớn nhất hiện nay.
Các Googlebot tìm nạp các trang, và sau đó một chương trình lập chỉ mục phân tích các trang và lưu trữ biểu diễn của trang vào chỉ mục của Google. Chỉ mục là một mô hình không hoàn chỉnh của Web. Từ đó, PageRank được tính toán và các thuật toán bí mật tạo ra các kết quả tìm kiếm. Chỉ những trang nằm trong mục lục mới có thể xuất hiện trong kết quả tìm kiếm của Google. Nếu trang của bạn không được gán chỉ mục, nó sẽ không bao giờ có xếp hạng với bất kỳ từ khóa nào.
Bởi vì Web lớn hơn rất nhiều so với mục lục, Google phải quyết định những gì cần được thăm dò và những gì được gán chỉ mục. Dan đã cho tôi biết Google không thăm dò mọi trang họ biết, cũng không thêm mọi trang được thăm dò vào mục lục. Hai suy nghĩ lóe lên trong đầu tôi lúc đó là:
1. Tôi cần mua cho Dan chút đồ uống,
2. Tôi có thể làm gì để đảm bảo các trang của tôi được lập chỉ mục?
Băng thông và điện năng là nguồn lực ràng buộc của Google. Theo một số cấp độ họ phải phân bổ những nguồn lực vào tất cả các trang web khác nhau: Google sẽ không chỉ mục các trang web A – G và sau đó bỏ qua H-Z. Dan gợi ý rằng mỗi ngày Google có một lượng lớn nhưng có hạn các URL mà nó có thể thăm dò, do đó với những website lớn nó đặt vào trang web lợi ích của chính chủ sở hữu để giúp tiến trình lập chỉ mục thực hiện hiệu quả hơn, bởi vì điều đó có thể dẫn tới nhiều trang đang được lập chỉ mục hơn.
Google quyết định đưa bao nhiêu nỗ lực vào do thám một trang web là một bí mật, nhưng nó bị tác động bởi PageRank. Nếu website của bạn có liên quan tới một vài trang mà có xếp hạng cao, tất cả chúng sẽ được đưa vào mục lục không vấn đề gì, nhưng nếu bạn có lượng lớn các trang với xếp hạng thấp, bạn có thể thấy một số chúng không có trong mục lục của Google.
Vấn đề mã nguồn sáng sủa
Chúng ta có thể làm gì để có nhiều trang được lập chỉ mục hơn? Tôi đã luôn luôn nghi ngờ rằng mã HTML tinh giản là một cách tốt để tạo điều kiện lập chỉ mục. Tối giản mã nguồn giúp các trang load nhanh hơn và tốn ít băng thông hơn. Tôi đã hỏi nó có giúp chuyển các định nghĩa Javascript và CSS thành các file bên ngoài, và làm gọn các thẻ không. Dan trả lời một cách rõ ràng. “đó là những ý tưởng thật rất hay”, ông nói.
SEO rất chú ý tới những vấn đề như xây dựng nội dung trùng lặp liên kết, để tăng PageRank, và cấu trúc liên kết để di chuyển PageRank thông qua trang web. Tuy nhiên, tôi không thấy nhiều bài viết SEO về tầm quan trọng của phương pháp thích hợp phát triển Web. Quá thường xuyên khi tôi nhìn vào một trang web mới, tôi hoảng sợ trước những dòng mã cẩu thả. Trang web tiêu biểu có thể được sắp xếp đặc biệt hợp lý.
Đúng, bạn nên cố gắng tăng thứ hạng các trang, và nên thiết kế kiến trúc liên kết của bạn sao cho PageRank được phân bố trên toàn trang web theo một cách tự nhiên. Bạn nên cung cấp nội dung thật độc đáo và có giá trị. Những chiến thuật này sẽ giúp ích cho chỉ mục của bạn, nhưng bạn cũng cần phải chú ý đến các chi tiết tối tăm như các trang của bạn được đặt lại với nhau thế nào. Nếu tất cả mọi người đều viết mã nguồn sáng sủa, Google sẽ có thể chỉ mục các trang nhiều hơn đáng kể.
Tại sao Google không đào tạo các quản trị web nhiều hơn về hiệu quả sử dụng băng thông và khả năng tính toán? Có lẽ sẽ không hay nếu Google đề nghị các webmaster lập trình lại các trang web của họ để Google làm việc dễ dàng hơn. Tuy nhiên, nếu Google có thể cho tôi biết làm thế nào để có được nhiều các trang lập chỉ mục hơn, tôi sẵn sàng lắng nghe và hợp tác.
Không có nhận xét nào:
Đăng nhận xét