Hiển thị các bài đăng có nhãn Google Search. Hiển thị tất cả bài đăng
Hiển thị các bài đăng có nhãn Google Search. Hiển thị tất cả bài đăng

Chủ Nhật, 17 tháng 1, 2010

Phát hiện và xử lý những phần không được crawl của Google

Phat hien va xu ly nhung phan khong duoc crawl cua Google
VnTim™  ^-^ Bạn luôn nghĩ là spider của google vẫn luôn lùng sục khắp website của bạn và đánh chỉ mục cho từng nội dung, dù là nhỏ nhất, sự thật không phải như vậy googlebot cũng đôi khi có chút trục trặc hay chút khó tính mà không crawl cũng như index một phần nào đó trong website của bạn.
Điều này quả thật là quá thiệt thòi cho các webmaster trong việc quảng bá website (SEO), vậy vấn đề ở đây là cần phát hiện ra những phần đó và bắt google crawl lại và index phần mục đó.
A. Cách phát hiện
Theo các chuyên gia về SEO trên thế giời thì có rất nhiều cách để phát hiện phân vùng này ví dụ như theo dõi google webmaster trong sitemap, để ý sự trên lệch giữa tổng số link và số lượng link được index, hay là sử dụng những từ khóa đặc biết có sẵn trên phần vùng muốn kiểm tra và .... search từ khóa ( cách hiệu quả ) đó.
Nói kỹ về phương pháp này một chút cho các bạn mới dễ hiểu nhé. Phương pháp này là sử dụng một đoạn hay cụm từ đặc biệt trên phần vùng muốn kiểm tra của website bạn, sau đó vào google và search chính xác cụm từ khóa đó.
Và sẽ có 2 kết quả:
1. Không thấy website của bạn ở đâu.
2. Thấy ngay trong top 10 ( chỉ nói là top 10, có thể là 20-30...) tức là bạn đã được Google  index
B. Cách xử lý
Đối với một số ít website có thể google ko index phần này do lỗi trùng lặp nội dung, hay mắc phải một sai phạm nào đó trong bảng chỉ dẫn của google. Giải pháp tốt nhất lúc này là xóa nó đi. Trong trường hợp phần vùng đó là quan trọng đối với bạn và bạn chắc rằng đã tuân thủ đúng chỉ dẫn của google mà vẫn ko được index. .Hãy làm theo một trong 2 cách sau:
1. Sử dụng chức năng repost và thêm vào một số thông tin được update từ bạn và đưa nó về trang chủ dạng như một bài viết mới, để google crawl lại nó một lần nữa.
2. Vẫn giữ nguyên phân vùng đó, nhưng tối ưu hóa cấu trung nội liên kết trong cả phần vùng đó và trang web. Sử dụng các mạng 2.0 dạng như twitter, digg hay  link  để nhặm lôi kéo sự chú ý của google về phần vùng này.
VnTim™ Theo vavietnam

Google tìm thấy Website của bạn như thế nào?

Google tim thay Website cua ban nhu the nao?

VnTim™  ^-^
Tổng hợp 15 cách thức thông thường và không ngờ đến mà Google sử dụng để tiếp cận với nội dung Website của bạn. Rất nhiều Webmaster đã ngạc nhiên là máy tìm kiếm Google biết nhiều điều về Website của bạn hơn là bạn tưởng tượng : Đôi khi bạn tìm thấy các trang Web trong chỉ mục của Google dù không có một liên kết nào trỏ tới trang đó, hoặc đôi khi bạn lại không thể nào tìm thấy những trang mà trước đó chưa bao giờ Google tiếp cận.

Nhiều thảo luận xoay quanh vấn đề này, đặc biệt trong diễn đàn Webmaster World, xuất phát từ lý thuyết hoạt động của máy tìm kiếm và các quan sát thực tế, chúng ta có thể tổng hợp lại 15 cách chung sau mà Google có thể phát hiện ra Website của bạn :
  1. Các liên kết “Dofollow” (Cho phép bọ tìm kiếm lần theo các liên kết này) từ liên kết bên trong và bên ngoài trỏ tới một trang;
  2. Liên tưởng liên kết, ví dụ nếu tồn tại trang web có dạng đường dẫn “site.com/?product=1″ thì rất có thể cũng tồn tại “site.com/?product=2″;
  3. Các liên kết bên trong forms:

    Matt Cutts đã từng khẳng định rằng các liên kết nằm trong form có thể phân bổ thứ hạng PageRank. Google thường gán các liên kết ảo cho các form này và tìm kiếm thông tin thông qua các đường dẫn ảo của form bởi thế các đường dẫn ảo này được liên kết tới sơ đồ Website trong thuật toán của Google.

  4. Các liên kết được nhắp chọn trên trình duyệt sử dụng Google Toolbar hoặc kích hoạt hiển thị chỉ số thứ hạng PageRank, công cụ sẽ gửi thông tin truy vấn về máy chủ Google;
  5. Khi bạn dán các đường dẫn URL và trong ô tìm kiếm của Google. Bạn sẽ rất ngạc nhiên nếu biết rằng một số lượng rất lớn người dùng sử dụng ô tìm kiếm của Google để được chuyển đến địa chỉ Web thay vì dán thẳng vào thanh địa chỉ của trình duyêt;
  6. Liên kết tới Website của bạn chứa trong liên kết trực tiếp hình ảnh (image hotlinking) từ các Website khác chẳng hạn;
  7. Các Website khác liên kết tới các tệp tin CSS hay javascript trên Website của bạn;
  8. Các liên kết trong email mà máy tìm kiếm có thể truy cập (ví dụ Gmail);
  9. Các địa chỉ URL xuất hiện trong đồ họa hay phim ảnh Video;
  10. Đường dẫn URL xuất hiện trong các phần bình luận của mã nguồn HTML, bên trong phần tiêu đề, thẻ meta hoặc các thành phần phụ (thẻ alt, tên, id, v.v.) hoặc các thẻ phụ khác của mã nguồn HTML;
  11. Các liên kết trong các tệp tin Flash;
  12. Các  URL không liên kết (dạng văn bản không có nhắp chọn để chuyển đến địa chỉ URL hiển thị);
  13. Liên kết xuất hiện trong các tài liệu khác trang Web; ví dụ các tài liệu .doc, .pdf, .txt v.v.
  14. Các liên kết trong các phần mềm hay tiện ích của Google như gadgets, widgers
  15. Các liên kết quảng cáo (Adwords/Yahoo) hoặc các dịch vụ bản đồ địa điểm.
Ngoài ra có thể bổ sung thêm một số cách thức mà máy tìm kiếm Google có thể phát hiện ra tài nguyên trên Website của bạn :
  • Thông qua việc submit URL tại các máy tìm kiếm;
  • Thông qua việc ping đường dẫn nội dung tới các máy tìm kiếm;
Bạn có thể bổ sung thêm các cách thức mà bạn nghĩ Google có thể tiép cận với Website của bạn không?
VnTim™ Theo tin vavietnam

Thứ Hai, 18 tháng 5, 2009

TÌM KIẾM HIỆU QUẢ VỚI GOOGLE


Chắc chúng ta cũng đã từng nghe nhắc đến google hoặc có thể bạn đã từng làm việc với google .Google là một search engine (tạm dịch là cơ chế tìm kiếm) rất mạnh . Với Google,bạn có thể tìm được hầu hết những thứ bạn cần . "©2003 Google - Searching 3,083,324,652 web pages" as of Sunday, February 16, 2003”,hơn 3 triệu trang web đã được Google viếng thăm,một con số đáng quan tâm đúng không ?

Google được xem như máy chủ tìm kiếm lớn nhất và hiệu quả nhất hiện nay,nếu làm chủ được Google thì quả thật là tuyệt vời .Thay vì đãi cát tìm vàng giữa hàng tấn thông tin trên iNet,bạn chỉ tốn vài phút là có thể tìm được tất cả những gì bạn thích trong khi đó nếu không có Google,bạn sẽ tốn hàng ngày,thậm chí cả tuần để làm công việc nhàm chán này .

1.Google căn bản :

Để sử dụng Google,máy tính của bạn chỉ cần một trình duyệt căn bản (Internet Explorer,Netscape,…) và một kết nối Internet .Hãy gõ vào thanh Address dòng
www.google.com.vn và bắt đầu khám phá .

Đầu tiên bạn xác định từ khóa của thông tin muốn tìm kiếm,đây là một bước rất quan trọng,từ khóa thể hiện chủ đề của nguồn thông tin .Một điều cần chú ý đó là đôi khi kết quả trả về quá nhiều ,bạn chỉ cần quan tâm đến 20-30 results đầu tiên thôi .

Mặc định google có chứa tóan tử “AND”,nghĩa là nếu bạn không thay đổi từ khóa thì google sẽ tìm kiếm và đánh đấu tất cả những trang chứa từ khóa sau đó trả về trang kết quả .
Ví dụ : nhập chuỗi
Java ebook ,trang kết quả sẽ trả về tất cả những trang chứa chuỗi Java và ebook ,ví dụ như“java programming ebook” hay “Java certificate ebook”,nghĩa là tất cả những trang chứa đồng thời chữ Java và ebook .

Thế nhưng bây giờ yêu cầu của bạn có thay đổi một chút,bạn muốn kết quả trả về chứa một trong hai từ khóa Java hoặc ebook ? Rất may là Google có tóan tử OR ,bạn nhập và form dòng
Java OR ebook ,google sẽ tìm kiếm tất cả những trang chứa một trong hai ký tự trong chuỗi từ khóa thôi .

Trở về với ví dụ đầu tiên .Giả sử như tôi muốn tìm tất cả những trang chứa cả hai ký tự Java ebook liên tục nhau thì sao nhỉ . Đơn giản là bạn sử dụng dấu “+” : nhập chuỗi
Java+ebook và form tìm kiếm,thế là xong .

Tip : để kết quả thật sự chính xác,bạn nên dùng dấu “ “ quanh từ khóa,ví dụ
“ebook java”,đây là một cách tìm kiếm rất hiệu quả,bạn có thể dễ dàng “khống chế” được độ chính xác của kết quả trả về .

2.Tìm kiếm nâng cao :


Intitle : tìm kiếm dựa theo titles của trang web .Trở về với ví dụ trước ,tôi muốn kiếm một ít sách về java ,tôi gõ vào google dòng intitle:“Java ebook” ,kết quả sẽ khả quan hơn bước trên rất nhiều .Nên lưu ý rằng titles luôn phản ánh nội dung của trang web .Vì vậy search với function title sẽ hiệu quả hơn rất nhiều so với cách search keyword đơn giản .Theo mặc định google sẽ đánh giá nội dung trang web,do đó nếu tìm theo titles thông tin sẽ không cô đọng hơn .

Inurl : hạn chế kết quả tìm kiếm trong urls . Ví dụ bạn nhập dòng inurl:java world thì kết quả trả về làwww.javaworld.com .Đây là một function bạn nên dùng nếu bạn nhớ “mang máng” một url nào đó và muốn tìm lại .


Inanchor : tìm kiếm dựa vào phần text chứa liên kết .Vdu bạn nhập vào inanchor : O'Reilly and Associates thì kết quả sẽ tham chiếu đến O'Reilly and Associates

Filetype : tìm kiếm theo tên mở rộng file, ở ví dụ đầu tiên tôi muốn tìm kiếm một vài ebook java .Bây giờ để hiệu quả hơn tôi sẽ chỉ ra phần mở rộng của tập tin .Nhập vào google chuỗi sau : Java ebook filetype:chm (chm là chuẩn file help của microsoft và thường được dùng để làm ebook do tính tiện lợi của nó) hoặc java ebook filetype:pdf (pdf là chuẩn file của ebook cũng được dùng làm ebook) .Nice,tôi đã có được thứ cần tìm rồi đó .

Cache : xem thông tin của trang web chứa trong cache của google .Đây là một tính năng rất hay của google,mặc dù trang web bạn muốn xem không còn hiện hữu trên Internet nữa nhưng google vẫn lưu lại rất nhiều thông tin bên trong cache .Biết đâu bạn có thể tìm được nhiều thông tin cần thiết bằng cách này thì sao ?

cache:
vntim.blogspot.com

Trên đây là một số function hay dùng của googles,google còn có một số function nữa nhưng tôi nghĩ nếu làm tốt thì bây nhiều là đủ rồi .

Trick :

Directory Indexing – truy cập cấp thư mục

Bạn muốn truy cập vào các directory trên web để download thay vì một vài file mà là cả một tá files. Nếu muốn truy cập các thư mục chứa nhạc thì nhập vào chuỗi sau intitle:”index of” music,còn muốn truy cập các thư mục chứa ebook thì nhập intitle:”index of” ebook ,một list các link sẽ hiện ra,công việc còn lại là tìm xem có thứ mình cần hay không .Đây là cách rất hay bởi vì người ta thường đặt các file trong một thư mục và dấu chúng đi bằng file index.html (hay là một trang nào đó),cách này sẽ by pass và get tất cả những file chứa trong thư mục !


Lời khuyên cuối cùng dành cho bạn đó là hãy sử dụng các từ khóa,function và tóan tử một cách linh động .Kinh nghiệm sẽ giúp bạn tìm được 99% những gì bạn cần trên internet .Chúc vui .

SawyeR

tài liệu tham khảo : irc.dev-zone.com , google hacks and some tricks on the internet .

Thứ Hai, 4 tháng 5, 2009

Google xếp hạng cao thương hiệu trong kết quả tìm kiếm




Google xếp hạng cao thương hiệu trong kết quả tìm kiếm

Một trong những chủ đề thu hút sự chú ý của nhiều người nhất xoay quanh thương hiệu (branding) của các công ty. Thực tế Google đã thay đổi những gì ? Làm thế nào để tận dụng những thay đổi trong thuật toán để xếp hạng cao website của bạn ?

Thay đổi trong thuật toán xếp hạng Website Google

Bản chất liên kết

Việc Google thay đổi các thuật toán không phải là hiếm hoi, nên những gì người dùng và các Webmaster quan sát thấy không phải là chỉ những thay đổi mới trong ngày hôm qua. Trong khi nhiều Webmaster vẫn còn “ngây thơ” với hệ thống liên kết, hay đơn giản là việc đi rải rác liên kết (spam link), thì chúng tôixin mạn phép nhắc lại một vài thay đổi điển hình; những dấu hiệu sau có thể khiến cho website của bạn biến mất khỏi trang kết quả tìm kiếm của Google :


  • Quá nhiều liên kết lặp với cùng ký tự liên kết cố định;
  • Lạm dụng quá nhiều từ khóa, lặp đi lặp lại trên tiêu đề và trong trang;
  • Các từ khóa lặp, rời rạc, không ăn nhập với các từ cận kề hay trong cả câu;
  • Các cấu trúc từ rời rạc, không liên quan, ăn nhập với nhau.

Chỉ số xếp hạng Website PageRank

PageRank Google là một mô hình dựa trên thuật toán phân tích các siêu liên kết trên mạng Internet. Nhưng nếu bạn có đủ dữ liệu người dùng thì có lẽ không cần phải tốn kém phân tích, trích lọc nội dung Web mà có thể dựa trên dữ liệu người dùng, đa dạng và phong phú. Microsoft đã nghiên cứu ứng dụng theo hướng này và đặt đưới cái tên chỉ số xếp hạng BrowseRank. Trong phiên bản Internet Explorer 8, dữ liệu người dùng được ngầm định chuyển tới phân tích trên máy chủ Microsoft.

Google xếp hạng cao thương hiệu trong kết quả tìm kiếm BrowseRank

Tương tự, trình duyệt Google Chrome cũng ngầm định gửi thông tin về máy chủ và Google cũng khai thác dữ liệu người dùng thông qua tài khoản Google accounts, Google Analytics, Google Adsense, DoubleClick, Google AdWords, Google Reader, iGoogle, Feedburner, và Youtube.

Bộ lọc và các hình thức phạt của Google với các Website vi phạm

Google đánh tụt hạng những trang tạo ra các ký tự liên kết gồm các từ khóa cố định trong các liên kết được trao đổi.

Vẫn liên quan tới liên kết, yếu tố được coi như mạch máu của World Wide Web, Google đã đưa ra thẻ rel=nofollow, yếu tố thay đổi tính chất của liên kết siêu văn bản. Ngay sau đó, Matt Cutts, một kỹ sư Google, được mệnh danh Google Guy, đã khuyến nghị các liên kết được mua bán hay tài trợ, sẽ được liệt kê vào liên kết spam nếu không thêm thẻ rel=nofollow.

Sự bùng của blog cá nhân đã thúc đẩy việc ứng dụng thẻ rel=nofollow, và là công cụ hiệu quả chống lại spam và spammer ( Nhân đây xin nhắn các webmaster spammer Việt Nam đừng spam chúng tôivới liên kết của các bạn làm gì cho vô ích, không có giá trị gì trên các máy tìm kiếm, vì mình đều gắn thẻ rel=nofollow cho tất cả các liên kết bên ngoài).

Ngoài ra trong năm 2007, Google đã áp dụng chiến thuật tìm kiếm toàn năng bằng cách thêm các nội dung từ các cơ sở dữ liệu chuyên biệt trong kết quả tìm kiếm. Chúng ta có thể kể đến :


  • Google News
  • Video Youtube
  • TÌm kiếm theo sản phẩm trên Google
  • Bản đồ Google Maps
  • Thư viện Google Book

Với ba công cụ trên (rel=nofollow, mạng xã hội, tìm kiếm đa năng), cộng với dữ liệu của người dùng bầu chọn, nhận định, chúng ta khó mà qua mắt được người khổng lồ.

Lời khuyên về thương hiệu của Google cho cộng đồng SEO

Xuyên suốt các bài viết, hội thảo, video, Matt Cutts đếu khuyên các SEOers tập trung vào xây dựng nội dung có ích cho người dùng và luôn lẩn tránh những câu hỏi liên quan tới thuật toán của máy tìm kiếm.

Eric Schmidt, CEO của Google thì lại phản ứng có phần hơi khác, luôn đưa ra lịch trình của máy tìm kiếm với những tính năng nhiều hứa hẹn. Trong năm 2008, Eric Schmidt khiến cho những người làm SEO gội cạo những cũng phải tự đặt câu hỏi và xem lại chiến lược quảng bá của mình.

Phát biểu tại Google Campus tháng 10 năm 2008, Erich Schmidt nói :

“Internet đang nhanh chóng trở thành một cái giếng sâu trong đó, các thông tin sai lệch có thể được hưởng lợi”, Google CEO nhấn mạnh rằng thương hiệu ngày càng trở lên quan trọng báo hiệu độ tin cậy của nội dung.

“Thương hiệu chính là giải pháp, chứ không phải là khó khăn”, Ông Schmidt đã nhân mạnh “Thương hiệu chính là cách để bạn thoát khỏi giếng sâu này“.

Những ngày tiếp theo, chúng ta có thể nhận thấy những thay đổi lớn trong bảng xếp hạng của Google, rất nhiều Website đã mất thứ hạng đầu tiên trên trang kết quả của Google đối với các từ khóa chính. Thay vào đó là những nhãn mác, thương hiệu đã nổi tiếng, ví dụ :


  • 4 hãng hàng không đã chiếm vị trí đầu tiên cho từ khóa “airline tickets”;
  • Ít nhất 90% địa chỉ trên trang thứ nhất kết quả với từ khóa “auto insurance” thuộc về các nhãn nổi tiếng của các quốc gia;
  • 3 chương trình giáo dục trục tuyến phổ biến nhất xếp hạng cao với từ khóa “online degree”.

Các thương hiệu lớn đã bắt đầu xếp hạng cao trên Google, thường đến 80%, 90% đều xuất hiện trên trang nhất kết quả tìm kiếm với những từ khóa rất giá trị và cạnh tranh. Còn rất nhiều ví dụ khác mà các bạn có thể từ khám phá.

Webmaster Việt Nam phải xem lại chiến thuật SEO của mình ?

Rõ ràng đây là một thay đổi lớn trong thuật toán xếp hạng của Google, nhưng nó không hoàn toàn bất ngờ mà đã được tiên đoán từ từ. Trước sau gì, thì việc ứng dụng dữ liệu người dùng trong thuật toán của Google cũng sẽ cho kết quả tương tự thôi. Dù Google Việt Nam vẫn chưa áp dụng triệt để thương hiệu trong thuật toán của mình (có thể là chưa có nhiều thương hiệu quốc gia nổi tiếng chăng?), nhưng chúng tôicho rằng đây chỉ là vấn đề thời gian. Qua đây chúng ta cũng nhận thấy một điều hiển nhiên là :


  • Trong một cuộc chơi của những “ông lớn”, quảng bá thương hiệu online phải được kết hợp với các hoạt động quảng cáo offline và các phương tiện truyền thông khác để xây dựng một thương hiệu lớn. Thương hiệu lớn sẽ chi phối thói quen và sở thích của người dùng, trong đó thông tin ngày càng được người dùng tiếp cận nhiều hơn qua Internet. Việc đứng trong top trang kết quả của Google chỉ là hệ quả của những cố gắng này bên cạnh việc làm SEO tốt. Chứ SEO, trong một cuộc cạnh tranh lớn, bản thân nó không phải là chiếc đũa thần có thể mang lại danh tiếng cho thương hiệu của bạn. Đương nhiên, ai nói đến thương hiệu thì sẽ nói đến khách hàng và lợi nhuân. Tuy nhiên SEO sẽ giúp mang thương hiệu, sản phẩm, dịch vụ của các công ty đến với người dùng dễ dàng hơn, đứng trên góc độ của doanh nghiệp.
  • Đối với những công ty với thực lực khiêm tốn hơn, thì chiến dịch SEO quảng bá Web phải nghiên cứu từ khóa một cách hợp lý, tránh đối đầu với những thương hiệu mạnh và sử dụng những từ khóa riêng biệt với sản phầm dịch vụ của mình. Theo đuổi các từ khóa một cách khôn ngoan và kiên trì và chinh phục dần dần; từ những từ khóa dài hơn, chuyên ngành hơn cho đến những từ khóa ngắn và phổ biến.

Theo vietseo

Thứ Hai, 13 tháng 4, 2009

10 thủ thuật SEO tối ưu hóa tiêu đề thân thiện với Google

Tiêu đề bài viết là một trong những ít thông tin mà máy tìm kiếm cung cấp cho người tìm kiếm trên trang kết quả trước khi nội dung được hiển thị. Ví thế, Google cũng như những cỗ máy tìm kiếm khác rất coi trọng tiêu đề trang. Việc tối ưu hóa tiêu đề bài viết vì thế rất quan trọng, sau đây là 10 thủ thuật SEO tối ưu hóa tiêu đề bài viết.
  1. Google hiển thị từ 60 đến 70 ký tự đầu tiên của tiêu đề trong trang kết quả tìm kiếm. Vì thế bạn hãy đặt các từ khóa quan trọng nhất trong phần đầu tiên của tiêu đề bài viết và các từ khóa kiếm quan tọng hơn nằm lùi về phía sau. Nếu tiêu đè bài viết của bạn dài quá 70 ký tự, Google sẽ cắt bớt; Google chỉ lấy đến ký tự thứ 69 và thay thế dấu ba chấm "…" cho phần còn lại của tiêu đề;
  2. Đôi khi, thay vì bắt đầu tiêu đề của bài viết bằng một loạt từ khóa, thì bạn nên thêm các ký tự mang tính chất miêu tả, cung cấp thông tin về nội dung và đặt trước từ khóa quan trọng. Điều này sẽ giúp bài viết vượt qua bộ lọc của Google trong kết quả tìm kiếm (Và đương nhiên nó sẽ có thứ hạng ổn định hơn), trong khi mang lại thêm cho bạn thứ hạng cao đối với những từ khóa phụ (chứa trong phần đầu tiên của tiêu đề);
  3. Tiêu đề trang là một trong số ít thông tin mà Google cung cấp cho người dùng trong trang kết quả tìm kiếm trước khi người tìm kiếm chọn để hiển thị nội dung. Ví thế, tiêu đề bài viết là yếu tố quan trọng để thu hút sự chú ý của người tìm kiếm và kích thích họ nhắp chọn xem nội dung giữa rất nhiều trang kết quả khác của các đối thủ cạnh tranh. Đây là yếu tố quyết định và là cơ hội tạo ra sự khác biệt giữa chính bạn và các đối thủ khác về mặt chất lượng;
  4. Tiêu đề tốt sẽ tạo ra ý muốn trả lời và đặt câu hỏi, kích thích người đọc;
  5. Vì tiêu đề bài viết là một trong những yếu tố duy nhất mà máy tìm kiếm hiển thị cho người tìm kiếm trước khi xem nội dung trang, nên chúng sẽ gán trọng số cao cho các từ xuất hiện trên tiêu đề. Thêm nữa, rất nhiều người khi liên kết tới trang sẽ sử dụng tiêu đề bài viết như là ký tự liên kết (anchor text);
  6. Việc chèn các từ khóa một cách trùng lặp, giống nhau một cách hợp lý và dễ đọc cho phép bạn cải thiện độ tin cậy của chuỗi các từ khóa. Tuy nhiên, những từ khóa này phải được sắp xếp có ý nghĩa và dễ đọc cho người tìm kiếm chứ không phải cho bọ tìm kiếm. Thay vì nhồi nhét danh sách từ khóa vào trong phần tiêu đề thì bạn nên trình bày tiêu đề rõ ràng và mang tính miêu tả nội dung, sản phẩm hay dịch vụ Website của bạn;
  7. Đánh giá sai tiềm năng khách hàng bằng việc cung ứng các dịch vụ không tương thích sẽ làm giảm tỉ lệ chuyến đổi1 và lãng phí thời gian phục vụ cho các đối tượng không phải là khách hàng tiềm năng. Ví dụ, nếu sản phẩm của bạn là các mặt hàng cao cấp thì Website của bạn không cần phải tối ưu, quảng bá các từ khóa giá rẻ, hạ giá, giảm giá vì nó sẽ làm lãng phí thời gian;
  8. Mỗi trang trên Website của bạn nên có tiêu đề khác biệt. Trừ phi, nếu Website của bạn bị giới hạn về kích thước và độ hiển thị, tốt nhất không nên sử dụng tiêu đề trang theo cùng một công thức trên toàn Website. Bạn cũng không nên sử dụng cùng một từ khóa ở ngay đầu hoặc gần ngay đâu tiêu đề trang;
  9. Định dạng, thứ tự và lựa chọn từ cho từ ngữ của tiêu đề nên khác biệt (ít nhiều) với thẻ miêu tả description hoặc phần tiêu đề đầu trang;
  10. Nếu bạn có thương hiệu mạnh, bạn nên đặt nó ở phần cuối tiêu đề. Nếu bạn có một trong những thương hiệu tin cậy hàng đầu trên Internet (như eBay, Amazone, …) thì bạn nên đặt nó lên phần đầu của tiêu đề. Thông thường, tiêu đề của trang phải được tập tủng vào nội dung của trang và mục đích của người tìm kiếm hơn là thương hiệu Website.

Thứ Sáu, 10 tháng 4, 2009

6 thủ thuật SEO khiến website bị cấm

6 thủ thuật SEO bất chính khiến website bị cấm

Hầu như tất cả mọi doanh nghiệp lớn nhỏ, mới cũ đều có một mẫu số chung. Mẫu số chung đó là họ muốn tìm kiếm các khách hàng, đối tác và những triển vọng nhằm gia tăng vị trí chủ đạo và nâng cao thương hiệu với một mục đích cuối cùng là có thể tạo ra những cơ hội kinh doanh mới.

Một trong những cách hiệu quả nhất để thực hiện các điều này là tối ưu hóa công cụ tìm kiếm (SEO). Có rất nhiều phương pháp SEO hiệu quả có thể tối ưu hóa website doanh nghiệp của bạn, tuy nhiên bên cạnh đó cũng có một số thủ thuật bất chính không những hủy hoại danh tiếng công ty và khiến website của bạn bị Gooble ngăn cấm mà còn gây ra hàng loạt những rắc rối liên quan đến pháp luật.

Có một cuộc tranh luận đang diễn ra giữa các chuyên gia về những gì được xem là SEO “mũ trắng” và SEO “mũ đen”. Theo tôi,sự khác biệt lớn nhất chính là SEO “mũ trắng” giúp công cụ tìm kiếm đem tới người dùng những kết quả chất lượng hoạt động theo những hướng dẫn có sẵn. Mặt khác, SEO “mũ đen” bao hàm việc lợi dụng những giới hạn có sẵn trong tập hợp các qui tắc theo trình tự nhất định công cụ tìm kiếm.

Các chuyên gia thường bất đồng về những gì được xem là phương pháp SEO “mũ trắng” và SEO “mũ đen”. Theo tôi thì việc gọi những phương pháp này là gì không quan trọng, điều quan trọng ở đây là một số thủ thuật này là những ý tưởng tồi tệ và vì thế hầu hết các nhà tiếp thị nên tránh sử dụng chúng.

Những lý do thì luôn biến đổi nhưng có một khuôn mẫu chung đó là: tránh những thủ đoạn SEO nhằm đánh lừa công cụ tìm kiếm và bóp méo kết quả tìm kiếm. Đây là kinh nghiệm của cá nhân tôi: nếu một người đang thực hiện việc “xem xét thủ công” phát hiện ra thủ thuật sẵn có thì đó có lẽ là một thủ thuật rất dở.

Sẽ thật an toàn khi thừa nhận rằng nếu bạn cố gắng lợi dụng lỗ hổng trong thuật toán ngày nay, những lợi thế của bạn sẽ chỉ là nhất thời. Điều quan trọng hơn, bạn có thể đối mặt với rủi ro cao khi website của bạn bị phạt hay cấm.

6 thủ thuật SEO mà các nhà sản xuất nên tránh:

1. Link farms

Mọi người đều nhất quán rằng một trong những ảnh hưởng mạnh nhất trên việc xếp hạng tìm kiếm là số lượng và chất lượng những đường link liên kết đến một trang web. Link farm là một nhóm các websites được tạo ra với mục đích là nâng cao số lượng các đường link đến một website có sẵn. Những đường link này là “giả” (nhằm báo hiệu chất lượng website mà chúng liên kết) và vì thế chúng bóp méo kết quả công cụ tìm kiếm.

2. Automated Content Generation/Duplication

content_duplicationCác công cụ tìm kiếm rất thích nội dung. Chúng đặc biệt thích những nội dung nào được cập nhật thường xuyên. Điều không may là việc tạo ra những nội dung độc đáo như thế sẽ mất rất nhiều thời gian và công sức. Khi cố gắng tạo ra các mạng lưới công cụ tìm kiếm nhằm thiết lập nhiều trang web hơn từ một website, và thực hiện điều này thường xuyên sẽ khiến một số trang sẽ thử các nội dung được tạo tự động hoặc lấy nội dung của các website khác để đăng lại.

Thủ thuật này thường đi kèm với link farms (bởi vì nếu bạn tạo ra hàng ngàn site, bạn sẽ cần nội dung để đăng trên các site đó vì thế công cụ tìm kiếm sẽ đưa chúng vào danh mục liên kết)

Google rất giỏi trong việc xác định đâu là nội dung “tự nhiên” và đâu là nội dung không có giá trị được máy tính tạo ra. Còn về việc tự ý sao chép các nội dung từ những trang web khác là vi phạm luật sao chép và điều này được xem là vô đạo đức.

3. Keyword Stuffing

Thủ thuật này liên quan đến các phần trong trang web lặp lại nhiều lần một từ khóa nhất định để gây ảnh hưởng lên kết quả công cụ tìm kiếm. Nhiều năm trước các công cụ tìm kiếm đã vô hiệu hóa thủ thuật này, nhưng vì một vài lý do thủ thuật này hiện nay vẫn đang được sử dụng rộng rãi.

4. Cloaking

Thủ thuật này nhằm chuyển giao nội dung một website khác tới mạng lưới công cụ tìm kiếm thay vì tới người sử dụng. Động cơ thông thường đối với thủ thuật này là chuyển nội dung cho công cụ tìm kiếm nhằm xếp hạng trên một giới hạn nào đó thay vì gửi nội dung khác cho người sử dụng thực sự.

Công cụ tìm kiếm phát hiện điều này khá dễ dàng. Nếu bạn bị nghi ngờ sử dụng thủ thuật cloaking, rất dễ dàng để một người nào đó (như nhân viên của Google chẳng hạn) ghé thăm trang web của bạn và kiểm tra xem liệu bạn có đang cloaking hay không. Khi bị phát hiện thì thủ thuật này là một trong những biện pháp đáng tin cậy nhất để cấm website hoạt động.

5. Hidden Text

Thủ thuật này nhằm che giấu văn bản trên trang web khiến cho công cụ tìm kiếm sẽ nhập vào danh mục (nhằm mục đích tăng xếp hạng), những người truy cập sẽ không thấy được. Ví dụ đơn giản nhất chính là việc biến đổi văn bản màu trắng trên nền trắng.

Thủ thuật này dựa trên vài thứ đơn giản như các thẻ trong HTML, những kiểu CSS hoặc Javascript nhằm thay đổi trang web. Bất kể thủ thuật này tinh vi đến đâu nó cũng vẫn bị phát hiện dưới một vài chi tiết nhỏ.

6. Doorway/Gateway Pages

Thủ thuật này tương tự thủ thuật cloaking. Thay vì chuyển giao nội dung khác đến spiders, một trang khác lại hiện ra 1 trang nhất định để được xếp loại tốt trong công cụ tìm kiếm, nhưng sau đó lại gửi tới người sử dụng một trang khác. Rõ ràng đây không phải là điều thích thú cho những người sử dụng khi họ không kiếm được nội dung họ cần.

Thật sai lầm khi cố qua mặt các kỹ sư Google.

Hầu hết tất cả các thủ thuật này cho rằng công cụ tìm kiếm sẽ không tài nào phát hiện được.

Chúng dựa trên việc lợi dụng những giới hạn hiện tại của thuật toán dùng cho công cụ tìm kiếm. Bất kỳ chiến thuật Internet dựa trên việc qua mặt Google đều không phải là một chiến thuật thông minh.

Vì đối với hầu hết marketers, thay vì bỏ thời gian công sức vào những thủ thuật trên thì họ sẽ đầu tư vào 2 điều sau:

• Cải thiện website để được xếp hạng cao bởi vì những nội dung giá trị và khác biệt.

• Giúp công cụ tìm kiếm phát hiện ra nội dung vì lợi ích của người sử dụng. Hợp tác với công cụ tìm kiếm thay vì cố lợi dụng chúng là cách duy nhất giúp website bạn hoạt động hiệu quả trong tương lai.

Theo thuongmaivietnam.com

AdSense giúp Google đánh chỉ mục site tốt hơn?

Đây là một điều tôi tình cờ phát hiện ra khi đặt các block quảng cáo của Google trên blog của mình. Khi tôi mới xây dựng xong blog của mình, tôi đã đặt các block quảng cáo của Google, nhưng sau đó một thời gian tôi đã gỡ bỏ các quảng cáo của Google khỏi blog của mình bởi hai lí do:

Thứ nhất: “Nội dung là Vua - Content is the King”, đây là chiến lược lâu dài tôi áp dụng cho blog của mình. Chính vì thế tôi đã gỡ bỏ các quảng cáo của Google và quyết định phát triển nội dung cho blog và tìm mọi cách để quảng bá cho nó trước khi nghĩ đến việc kiếm tiền từ nó.

Thứ hai: Vì chưa được nhiều người biết đến và traffic còn thấp nên chắc chắn hiệu quả cũng không cao. Trong khoảng gần 1 tháng đặt block quảng cáo của Google, tôi chỉ kiếm được 9USD, mà đa số số tiền đó lại mang về từ giới thiệu người dùng download Firefox và từ thanh công cụ tìm kiếm của Google. Vì hiệu quả không cao, hơn nữa nó còn làm chậm tốc độ load blog của tôi nên tôi đã quyết định gỡ Google AdSense khỏi blog.

Sau khi gỡ bỏ Google AdSense, tôi miệt mài viết và viết và quảng bá blog của mình tại nhiều nơi, nhiều diễn đàn lớn với hi vọng Pagerank của họ sẽ giúp cho Google sẽ ghé thăm blog của tôi thường xuyên và đánh chỉ mục nhiều hơn. Nhưng kết quả lại không như tôi mong đợi.

Đây là các biểu đồ biểu thị mức độ thường xuyên các con Bot của Google ghé thăm để đánh chỉ mục cho blog:

Trước khi gỡ bỏ Google AdSense khỏi blog thì số lượng page trên blog của tôi được Google đánh chỉ mục là nhiều hơn hẳn các bộ máy tìm kiếm khác. Nhưng bây giờ, chính các bộ máy tìm kiếm khác lại đánh chỉ mục cho blog của tôi nhiều hơn, cụ thể các bạn có thể tham khảo kết quả ở 3 bộ máy tìm kiếm lớn trên mạng là Yahoo, Alltheweb và Altavista. Chúng hầu như đã đánh chỉ mục cho mọi ngõ ngách trong blog của tôi.

Còn Google thì sao? Kết quả càng ngày càng tệ đi, không những không ghé thăm thường xuyên như lúc còn đặt quảng cáo, không những không đánh chỉ mục thêm được một page nào cho blog của tôi mà thậm chí càng ngày số trang trong blog của tôi nằm trong index của Google ngày càng ít đi.

Trong quá trình dò tìm hướng phát triển cho blog, tôi đã thử qua và thay đổi nhiều lần Title và nhiều keyword mô tả về blog trong các thẻ meta để mong tìm ra một Title và một số keyword tối ưu hóa nhất cho blog của mình. Tôi nghờ rằng đây là một trong những nguyên nhân làm cho Google mất phương hướng khi index blog của tôi. Vậy còn nguyên nhân nào khác?

Trong khi Google ngày càng giảm mức độ thường xuyên ghé thăm và đánh chỉ mục cho blog thì Yahoo, Alltheweb và Altavista lại ngày càng tăng và hầu như chúng không bỏ qua bất kỳ ngõ ngách nào trên blog của tôi. Chính vì thế tôi nghĩ là còn một nguyên nhân khác khiến cho Google ít ghé thăm blog của tôi, và tôi nghĩ ngay đến nguyên nhân đó là do tôi đã gỡ bỏ Google AdSense khỏi blog.

Tại sao tôi lại đặt giả thiết như vậy?

Thứ nhất: Biểu đồ so sánh cho thấy rõ ràng là Google đã ít ghé thăm blog của tôi thường xuyên hơn sau khi tôi gỡ bỏ AdSense. Đây là sự thực hiển nhiên mà tôi nhìn thấy.

Thứ hai: Các con Bot và AdSense của Google chắc chắn phải có mối quan hệ với nhau. Chắc chắn rằng các từ khóa để hiển thị quảng cáo của AdSense sẽ lấy từ dữ liệu do các con Bot này thu thập được. Không dại gì mà Google lại phát triển hai hệ thống thu thập thông tin khác nhau cho Google Search và Google AdSense vì như thế là rất tốn kém và rất lãng phí. Chắc chắn rằng họ chỉ có một cơ sở dữ liệu để sử dụng chung cho cả Google Search và Google AdSense. Các con Bot sẽ giúp thu thập thông tin về các site để AdSense sử dụng và ngược lại AdSense sẽ giúp các con Bot hoạt động thường xuyên và hiệu quả hơn. Chính vì thế tôi nghĩ gỡ bỏ block quảng cáo của AdSense là một sai lầm.

Thứ ba: Tôi nghĩ rằng Google sẽ quan tâm và chú ý hơn tới các site có đặt quảng cáo của họ. Do lượng website và đặc biệt là blog đang mọc nên như nấm nên việc yêu cầu Google ghé thăm thường xuyên như trước kia là điều không thể. Và thực tế chúng ta thấy là mức độ ghé thăm các sie nhỏ của con Bot Google ngày càng ít và thưa đi. Chúng ta đều thừa nhận rằng Google mang mục đích cộng đồng là rất lớn, nhưng họ cũng phải vì chính họ nữa. Chính vì vậy họ cũng phải chú ý hơn các site có đặt quảng cáo của họ, đó cũng chính là tối ưu hóa lợi nhuận cho họ.

Với những suy luận này, tôi đã đưa ra giả thiết: “Đặt quảng cáo AdSense trên site sẽ giúp Google ghé thăm và đánh chỉ mục cho site thường xuyên hơn và tốt hơn”.

Đây có thể là một phát hiện mới của tôi, nhưng cũng có thể là một kiến thức cũ rích mọi người đã biết từ lâu mà tôi chưa biết. Điều này có thể đúng nhưng cũng có thể là sai, đơn giản vì đó chỉ là giả thiết mang tính cá nhân cho 1 trường hợp mà chưa được nhiều người kiểm chứng. Chính vì vậy tôi rất mong mọi người cùng bạn luận và cho ý kiến về đề tài này.

Và để làm sáng tỏ giả thiết này, tôi lại tiếp tục đặt quảng cáo Google AdSense trên blog của mình để kiểm chứng.

Theo phanmem.com

Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Trong những năm gần đây, một dạng trao đổi thông tin mới ra đời và phát triển với tốc độ rất nhanh, đó là blog (hay weblog). Blog thoạt đầu được phát triển như một dạng nhật ký trực tuyến với những suy nghĩ cá nhân được đưa lên web. Hiện nay, ứng dụng blog trở nên phong phú hơn và dễ thấy nhất là việc dùng blog làm một kênh thông tin nội bộ cũng như bên ngoài công ty.

Một trong các dịch vụ blog miễn phí khá nổi tiếng là dịch vụ Blogger của Google (www.blogger.com), nó cho phép bạn tạo và duy trì các blog trên máy chủ Blogger. Bài viết này không trình bày cách tạo một blog trên Blogger (việc này khá đơn giản và đã có khá nhiều bài viết hướng dẫn), mà chỉ hướng dẫn bạn cách đưa blog vào Google Sitemaps, để Google đánh chỉ mục cho blog của bạn nhằm tăng cơ hội xuất hiện trong kết quả tìm kiếm của Google.

Trước hết chúng ta hãy tìm hiểu qua về Google Sitemaps. Google Sitemaps hiện đang ở bản beta, được Google phát triển với mục đích cung cấp một cách thức đơn giản cho người dùng mô tả website của họ. Thông qua việc cung cấp cho Google Sitemaps thông tin của site (cấu trúc, các trang web quan trọng cũng như mức độ thay đổi của chúng...), bạn đã hướng dẫn cho công cụ dò tìm ("spider") của Google cách đọc thông tin và đánh chỉ mục cho website của bạn.

Dưới đây là hướng dẫn chi tiết cách đưa blog vào Google Sitemaps:

Bước 1: Đăng nhập vào Google Sitemaps (http://www.google.com/webmasters/sitemaps/siteoverview) thông qua tài khoản Google của bạn.
Ngay ở đầu trang bạn sẽ thấy ô nhập liệu để nhập site cần đánh chỉ mục. Hãy nhập vào đó địa chỉ (URL) blog của bạn (ví dụ: http://vntim.blogspot.com/)

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Sau đó nhấn nút OK. Blog của bạn sẽ được thêm vào tài khoản như hình dưới:

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Bước 2: Xác thực quyền của bạn trên blog vừa nhập
Nhấn vào liên kết Verify, bạn sẽ được chuyển đến trang có hình như sau:

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Google cung cấp hai phương pháp xác thực. Tuy nhiên ta chỉ chọn phương pháp thứ hai: Add META tag, vì đây là phương pháp duy nhất mà Google Blogger hỗ trợ.

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Sau khi chọn, trang web sẽ sinh ra mã thẻ META, ta sẽ chép đoạn mã này vào phần template của blog.

Bước 3: Dán thẻ META vào template của blog

Đăng nhập vào www.blogger.com. Vào blog của bạn, di chuyển đến tab Template.

Chèn đoạn mã thẻ META vào như ví dụ sau:

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Lưu lại thay đổi bằng cách nhấn nút Save Template.

Nhấn vào nút Republish Index only. Sau đó đợi vài giây cho đến khi blog của bạn được xuất bản trên web (publish) hoàn toàn.

Bước 4: Trở về lại Google Sitemaps để kết thúc quá trình xác thực.

Trở về lại Google Sitemaps, ta có thông báo: "Ive added the META tag in the home page of http://vntim.blogspot.com/".

Nhấn vào nút Verify để kết thúc quá trình xác thực.

Bước 5: Đến bước này blog của bạn đã được đưa vào Google Sitemaps. Tuy nhiên, bạn cần phải cung cấp cho Google địa chỉ chứa sitemap của blog của bạn. Ta sẽ dùng site feed (ATOM/XML) của blog làm sitemap.

Trở về hình ở bước một và nhấn vào liên kết "Add a Sitemap", bạn có được:

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Chọn Add General Web sitemap

Cung cấp địa chỉ URL blog của bạn, đó là địa chỉ của file atom.xml. Ví dụ http://vntim.blogspot.com/atom.xml (*):

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Nhấn vào nút Add Web Sitemap.

Bạn sẽ nhận được thông điệp xác nhận của Google:

"You have added a Sitemap to http://vntim.blogspot.com/. Reports may take several hours to update. Thank you for your patience!"

Chúc mừng! Bạn đã kết thúc quá trình đưa blog vào Google Sitemap. Bây giờ thì bạn chỉ còn phải đợi Google đánh chỉ mục cho blog của bạn.

(*) Chú ý: Bạn phải kích hoạt chức năng Site Feed cho blog của mình trước khi thực hiện bước này. Dưới đây là hướng dẫn.

Đăng nhập vào www.blogger.com . Vào blog của bạn, di chuyển đến tab Setting > Site Feed. Và thực hiện như hình sau:

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Lưu lại cấu hình và "publish" lại blog của bạn.

Bước 6: Kiểm tra kết quả đánh chỉ mục của Google

Sau khoảng vài giờ hoặc một ngày, bạn hãy kiểm tra tài khoản trên Google Sitemaps xem blog của mình đã được Google đánh chỉ mục chưa. Nếu Google đã kiểm tra blog, bạn sẽ có kết quả tương tự hình dưới:

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web

Tùy vào lượng tin, nội dung cũng như số lượng người truy cập mà trang blog của bạn có cơ hội xuất hiện trong kết quả tìm kiếm của Google hay không. Tuy nhiên, nếu từ khóa là tên của bạn hoặc các từ riêng biệt chỉ xuất hiện trên blog của bạn thì khả năng blog của bạn nằm trong Top 10 kết quả của Google là gần như chắc chắn.

Ví dụ sau đây kết quả của sử dụng tìm kiếm thông qua Google với từ khóa "le canh khanh":

vntim Thủ thuật giúp Google đánh chỉ mục cho Blog Web
Nếu blog của bạn khá nổi tiếng, nhiều người xem và bình luận thì cơ hội cho nó xuất hiện dưới nhiều từ khóa khác nhau là hoàn toàn có thể, còn không thì thông qua tên, bạn bè cũng dễ dàng tìm ra blog của bạn.

Thứ Hai, 16 tháng 2, 2009

kỹ thuật search trên Google (phần 7 tìm nhạc , phim trên google

?intitle:index. of? mp3 "keyword" -htm -html -asp -php "Last Modified" 2009
để tìm nhạc trên toàn bộ internet
"keyword" mp3 site:musicwebtown.com
để tìm nhạc trên 1 web cụ thể

Với keyword tên bài hát hoặc ca sỹ hoặc album
bạn cũng có thể thay MP3 bằng định dạng nhạc hay video bạn muốn tìm như MP4 FLV...
thay năm 2009 bằng năm bạn muốn tìm
Như vậy bạn đã có cả "ngân hàng" mp3 ! nhạc video file tài liệu ... trên mạng
muốn tải về máy có thể dùng IDM hoặc FlashGet down trực tiếp hàng loạt luôn

kỹ thuật search trên Google (phần 6 Duyệt mọi đường link của trang web từ Google)

Bạn muốn kiếm, đọc mọi link, thư mục từ 1 website nào đó thì có thể nhập vào hộp tìm kiếm của Google:

site:tên_trang_web

Ví dụ:

site:timkiemviet.blogspot.com (không có dấu cách nhé)

sẽ chỉ rất chi tiết cho bạn một số cách tìm kiếm "siêu hạng" khác: Tìm kiếm không chỉ là tìm kiếm !

Gõ vào hộp tìm kiếm cụm ký tự sau rồi enter:

2*450000*2

-> Kết quả:

2 * 450000 * 2 = 1800000

Còn rất nhiều, chịu khó dịch 1 chút Tiếng Anh nhé, đơn giản thôi mà, YOU CAN !

Bạn có thẻ vào linh sau đọc thêm bằng tiếng anh


http://www.google.com/help/calculator.html
http://www.google.com/support/

kỹ thuật search trên Google (phần 5 tìm file trên Rapidshare, megaupload)

* Tìm file video trên trang rapidshare:
+inurl:avi|mpg|wmv site:rapidshare.com

Thu hẹp hơn ví dụ riêng với Superman:
superman +inurl:avi|mpg|wmv site:rapidshare.com

* Tìm file chương trình trên rapidshare
+inurl:exe|rar|zip site:rapidshare.com

Thu hẹp hơn ví dụ riêng với từ hack:
hack +inurl:exe|rar|zip site:rapidshare.com

* Tìm kiếm file có định dạng âm nhạc:
+inurl:wma|mp3|ogg site:rapidshare.com

Ví dụ thu hẹp cách tìm kiếm chỉ riêng với từ words:
words +inurl:wma|mp3|ogg site:rapidshare.com

* Tìm kết tất cả file trên các thư mục của người dùng, trên rapidshare:
.* site:rapidshare.com


OK, tương tự, các bạn có thể thay loại file như rm, mpeg ... hoặc thay trang như rapidshare.de hoặc megaupload.com ...
Còn rất nhiều, hãy khám phá !!!

P.S: Cách khác để tìm file trên rapidshare là dùng phần mềm (Cách này hơi "đơ" so với cách tìm kiếm trực tiếp trên)

kỹ thuật search trên Google (phần 4 tìm kiểu file bất kỳ)

Nhập mã này vào trang google:
filetype: pdf intitle:"tài liệu cần tìm kiếm dạng Acrobat"
Ví dụ: filetype: pdf intitle:"Googlr-search"
-> Tìm kiếm tất cả các file .pdf trên mạng có tiêu đề là "Googlr-search"

Tương tự, bạn thay đổi loại file ở trên như .rar, .html ... để phong phú hơn cho việc tìm kiếm của bạn.

Ví dụ: Thay intitle thành allintitle sẽ thấy kết quả thu hẹp hơn

filetype: pdf allintitle:"Googlr-search"

kỹ thuật search trên Google (phần 3)

Mình biên dịch 1 số lệnh từ "Hacking exposed" (Stuart McClure, Joel Scambray & Grorge Kurtz) gửi các bạn "dùng tạm":

"index of/root"
inurl:"auth_user_file.txt"
"Index of /admin"
"Index of /password"
"Index of /mail"
"Index of /" +passwd
"Index of /" +password.txt
"Index of /" +.htaccess
index of ftp +.mdb allinurl:/cgi-bin/ +mailto

administrators.pwd.index
authors.pwd.index
service.pwd.index
filetype:config web
gobal.asax index

allintitle: "index of/admin"
allintitle: "index of/root"
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov

inurl:passwd filetype:txt
inurl:admin filetype:db
inurl:iisadmin
inurl:"auth_user_file.txt"
inurl:"wwwroot/*."

top secret site:mil
confidential site:mil

allinurl: winnt/system32/ (get cmd.exe)
allinurl:/bash_history

intitle:"Index of" .sh_history
intitle:"Index of" .bash_history
intitle:"index of" passwd
intitle:"index of" people.lst
intitle:"index of" pwd.db
intitle:"index of" etc/shadow
intitle:"index of" spwd
intitle:"index of" master.passwd
intitle:"index of" htpasswd
intitle:"index of" members OR accounts
intitle:"index of" user_carts OR user_cart


'input="hidden" name="price"'
Có thể nói có Google là có tất cả !?

kỹ thuật search trên Google (phần 2)

Vào google, nhập: "admin account info" filetype:log
hoặc gõ ngay trên khung tìm kiếm của google trên blog của tôi

Với từ khóa này , Google sẽ liệt kê 1 số file mà những server bị lỗi rò rĩ thông tin ra ngoài ~ Kết quả sẽ tùy theo tùy chọn của bạn ở những trang nước ngoài hay việt Nam !
1 file .txt là kết quả tìm kiếm của lệnh này ! Mình sẽ cho ví dụ :

Sau khi nhập lệnh trên và google cho kết quả -
log started at 07-08-05 18:06 ...... Default VirtualServer created 07-08-05 18:06:13,WARNING,Info,SERVER, admin account info: username: admin password: ie47ed 07-08-05 18:06:13,WARNING,Info ...
dako.da.ohost.de/Teamspeak2-Server/server.log - 3k - Đã lưu - Tương tự

log started at 18-06-05 23:49 ...18-06-05 23:49:39,WARNING,Info,SERVER, Default VirtualServer created 18-06-05 23:49:39,WARNING,Info,SERVER, admin account info: username: admin password: ...
www.ff-genesis.com/server/server.log - 3k - Đã lưu - Tương tự


đó là những file log server - Rất tuyệt bây giờ việc tiếp theo là chúng ta đi tìm password của admin server đó ~ Mình open file log.txt ra thì có nội dung sau :


---------------------------------------------------------------
-------------- log started at 18-06-05 23:49 -------------
---------------------------------------------------------------
18-06-05 23:49:38,ALL,Info,server, Server init initialized
18-06-05 23:49:38,ALL,Info,server, Server version: 2.0.20.1 Win32
18-06-05 23:49:38,WARNING,Info,SQL, created table ts2_servers
18-06-05 23:49:38,WARNING,Info,SQL, created table ts2_server_privileges
18-06-05 23:49:38,WARNING,Info,SQL, created table ts2_channels
18-06-05 23:49:38,WARNING,Info,SQL, created table ts2_channel_privileges
18-06-05 23:49:38,WARNING,Info,SQL, created table ts2_clients
18-06-05 23:49:38,WARNING,Info,SQL, created table ts2_bans
18-06-05 23:49:39,ALL,Info,server, Starting VirtualServer id:1 with port:8767
18-06-05 23:49:39,ERROR,All,SERVER, VirtualServer startup failed with port 8767, Exception: EIdCouldNotBindSocket.Could not bind socket. Address and port are already in use.
18-06-05 23:49:39,WARNING,Info,SERVER, Default VirtualServer created
18-06-05 23:49:39,WARNING,Info,SERVER, admin account info: username: admin password: 7qdpxy
18-06-05 23:49:39,WARNING,Info,SERVER, superadmin account info: username: superadmin password: c8hgvz
18-06-05 23:49:39,WARNING,Info,SERVER, there is no VirtualServer running!
18-06-05 23:49:40,ERROR,All,WEBINTERFACE, WebInterface startup failed with port 14534, Exception:Could not bind socket. Address and port are already in use.
18-06-05 23:49:40,ERROR,All,TCPQUERY, TCPQuery startup failed with port 51234, Exception: Could not bind socket. Address and port are already in use.
18-06-05 23:49:40,ALL,Info,server, Server init finished
18-06-05 23:52:08,ALL,Info,server, Server shutdown initialized
18-06-05 23:52:09,ALL,Info,server, Server shutdown finished
---------------------------------------------------------------
--------------- log ended at 18-06-05 23:52 --------------
---------------------------------------------------------------

bạn hãy nhìn kĩ những dòng in đậm nhé ~ đó chính là user va pass host , SQL của Server đó ! Tuyệt quá phải ko ~ còn thông tin host thì nằm URL đây , bạn hãy xem kĩ ~ công việc còn lại là tùy vào cái đầu bạn đó [IMG]file:///C:/DOCUME%7E1/ADMINI%7E1/LOCALS%7E1/Temp/msoclip1/04/clip_image001.gif[/IMG]

dako.da.ohost.de/Teamspeak2-Server/server.log - 3k -


log started at 18-06-05 23:49 ...18-06-05 23:49:39,WARNING,Info,SERVER,
www.ff-genesis.com/server/server.log -


+ LỆNH :index.of.password [ Dùng tìm pass Frontpage index.html ]
Khai thác qua 1 số page dạng Link liks "horny.htm" or "brittany.htm."

Vào Khung search nhập :index.of.password
Với từ khóa này google sẽ tìm kiếm và thống kê tất cả những file *sam từ những website chuyên dụng để cung cấp username cho chúng ta !

Đề hiểu thêm , bạn hãy xem kết quả mà Max tìm đc :

Index of /passwordIndex of /password. Name Last modified Size Description. [DIR] Parent Directory 20-May-2006 03:00 - [TXT] abpass.html 16-May-2003 23:55 5k [TXT] ...
www.nalga.org/password/ - 3k - Đã lưu - Tương tự


johnny.ihackstuff.com :: I'm j0hnny. I hack stuff.Click here for the Google search ==> index.of.password ... Your search - inurl:index.of.password - did not match any documents. Obsolete? I think so [IMG]file:///C:/DOCUME%7E1/ADMINI%7E1/LOCALS%7E1/Temp/msoclip1/04/clip_image002.gif[/IMG]...
johnny.ihackstuff.com/ index.php?module=prodreviews&func=showcontent&id=3 9 - 37k - 21 Tháng sáu 2006 - Đã lưu - Tương tự


johnny.ihackstuff.com :: I'm j0hnny. I hack stuff.index.of.password Admin rates it: Reviewer Rated 5 Stars Reviewer Rated 5 Stars Reviewer Rated 5 ... Click here for the Google search ==> index.of.password ...
johnny.ihackstuff.com/ index.php?module=prodreviews&func=showcontent&id=3 81 - 27k - Đã lưu - Tương tự


Index of /passwordIndex of /password. Name Last modified Size Description. [DIR] Parent Directory 10-Sep-2004 14:20 -
www.aai.unsw.edu.au/password/ - 1k - Đã lưu - Tương tự


Index of /password%20%5B4%20Rav%5D/Index of /password%20%5B4%20Rav%5D/. Size Last modified Name. 4096 Nov 13 1999 ./ 4096 Dec 15 2003 ../ 260 May 17 1999 passwd 2872 Nov 16 2000 ravproc.pl.
blacksmith.n0i.net/password%20%5B4%20Rav%5D/ - 1k - Đã lưu - Tương tự


inurl:index.of.password Directory listing contains password file(s ...inurl:index.of.password Directory listing contains password file(s)? intitle:"Index of" service.pwd Directory listing contains service.pwd file(s) ...
www.onlamp.com/security/ 2004/10/07/examples/signatures.txt - 5k - Đã lưu - Tương tự


đó là list mà google search đc ~ ta hãy thử tìm hiểu ở 1 website nhé !
Ok - ta sẽ tìm username va pass cũa member trang http://www.secukeeper.com

Bằng lệnh này google share cho ta kết quả : http://www.secukeeper.com/password-protect-folder-file/

Nhấp vào đây sẽ thấy thông tin của toàn bộ username web này !

kỹ thuật search trên Google (phần 1)

Google đã trở thành GodBrother - site đứng đầu để mọi người tìm kiếm. Mỗi khi tìm kiếm chúng ta đều nói với nhau vào google mà tìm Thế nhưng tại sao bạn tìm được mà tôi lại không tìm được ? Bạn có link download trực tiếp mà tôi không có ?
Bởi vì chúng ta chưa hiểu hết về Google, chúng ta chưa biết những từ khóa tìm kiếm "chưa từng công bố" ....Sau đây tôi sẽ hướng dẫn các bạn kỹ thuật search trên Google để tìm thấy mọi thứ mọi định dạng file
Trức hết ta hãy tìm hiểu chút kiến thức về từ khóa:
- Google sẽ loại bỏ các từ thông dụng trong các từ khóa, vd như "where", "how", "a", "the"... để tăng tốc độ tìm kiếm. Do đó nếu bạn muốn kết quả có các từ này, hãy thêm khoảng trắng và dấu cộng " +" (Đồng nghĩa với từ khóa AND) trước từ khóa đó, vd: "computer +how". Nếu bạn muốn tìm chính xác 1 chuỗi nào đó, hãy thêm ngoặc kép cho đoạn đó, vd: "where are you"

- Tương tự trên khi bạn muốn tìm kiếm 1 trang web nào đó theo từ khóa yêu cầu nhưng lại ko muốn xuất hiện từ khóa nào đó, bạn có thể dùng dấu trừ " -". VD bạn muốn tìm các diễn đàn di động nhưng không có nói về hacking, bạn có thể dùng từ khóa "mobile forum -hack"

- Tìm kiếm với "OR": Google cho phép dùng từ khóa "OR" (chữ hoa) giữa các từ khóa cần tìm để tìm các thông tin xuất hiện ít nhất 1 từ khoá. VD tìm nội dung "mobile OR forum", kết quả sẽ cho ra các trang có ít nhất 1 từ khoá "mobile" hoặc "forum" hoặc có cả hai.

- Tìm giới hạn theo tên miền (domain): Nếu bạn muốn tìm thông tin trong 1 website cụ thể nào đó, hãy dùng từ khóa "site:URL". VD tìm thông tin về Google Search trong trang http://timkiemviet.bloghspot.com/, bạn nhập "flashget :timkiemviet.bloghspot.com"

- Tìm kiếm các trang thông tin có liên kết đến trang bạn cần, bạn dùng từ khóa "link:URL". VD bạn tìm các trang web có liên kết đến trang timkiemviet.bloghspot.com, bạn nhập như sau: "link:timkiemviet.bloghspot.com"

- Tìm thông tin trong các tệp dữ liệu theo kiểu tệp cụ thể, bạn dùng từ khóa "filetype: phần_mở_rộng". VD muốn tìm các thông tin computer trong các file có kiểu PDF, bạn nhập nhưpần_mở_rộng". VD muốn tìm các thông tin mobile trong các file có kiểu PDF, bạn nhập như sau: "mobile filetype: pdf"

- Từ khóa "related:URL cho phép tìm các trang web có thông tin tương tự 1 trang web nào đó. VD tìm trang tương tự trang timkiemviet.bloghspot.com, bạn nhập từ khóa "related:timkiemviet.bloghspot.com"

- Từ khóa "info:URL" sẽ tìm các thông tin liên quan về 1 trang web nào đó. VD bạn nhập "info:timkiemviet.bloghspot.com" sẽ xuất các thông tin về trang timkiemviet.bloghspot.com

- Từ khóa "allintitle:từ_khóa" sẽ tìm các trang web có tiêu đề được chỉ ra sau dấu 2 chấm. VD muốn tìm các trang web có tiêu đề mobile, bạn dùng "allintitle:mobile"

- Từ khóa "intitle:từ_khóa_1 từ_khóa_2..." sẽ tìm các trang web có tiêu đề bắt buộc có chứa từ_khóa_1 và nội dung hoặc tiêu đề có chứa từ_khóa_2. VD "intitle:timkiemviet.bloghspot.com mobile" sẽ tìm các trang web có tiêu đề chứa từ "timkiemviet.bloghspot.com" và nội dung có từ "mobile"

- Từ khóa "allinurl:các_từ_khóa" sẽ tìm các trang web có địa chỉ URL bắt buộc chứa các từ khóa chỉ định. VD bạn tìm "allinurl timkiemviet.bloghspot.com" sẽ cho ra các trang web có địa chỉ chứa từ "timkiemviet.bloghspot.com"

- Từ khóa "inurl:từ_khóa_1 từ_khóa_2..." sẽ tìm các trang web có địa chỉ URL bắt buộc chứa từ_khóa_1 và nội dung trang web chứa từ_khóa_2. VD bạn tìm "inurl:timkiemviet.bloghspot.com mobile" sẽ cho ra các trang web có địa chỉ chứa từ "timkiemviet.bloghspot.com" và chỉ đến phần "mobile".


1. Dùng: parent directory
Tìm 1 file nào đó, vd music, software thì gõ parent directory trước, sau đó là định dạng bạn muốn tìm kiếm
VD:
“parent directory ” MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory ” /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
“parent directory “Xvid -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
“parent directory ” Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
“parent directory ” Name of Singer or album -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

2. Dùng: intitle: hoặc allintitle:
Chức năng dùng để tìm tên của cái mình cần nhanh nhất chứ kô phải là giới thiệu
vd: intitle:microsoft filetype:iso

3. Dùng: inurl:
chức năng để tìm tất cả các link dẫn đến cái mình tìm, kô phải chỉ là 1 tên, mà là đường dẫn trực tiếp
vd: inurl:microsoft filetype:iso

4.Dùng: site:
Chức năng: tìm toàn bộ domain liên quan đến cái cần tìm
vd: site:hackingspirits.com

5.Dùng filetype:
Chức năng: Tìm tất cả các file liên quan đến cái cần tìm như exe, rar, zip..
vd: filetype:doc site:gov

6. Dùng link:
Chức năng: tìm mọi link liên quan đến cái cần tìm
vd: link:www.securityfocus.com

7. Dùng related:
Chức năng: tìm tất cả các vấn đề dây dưa rễ má có liên quan đên vấn đề cần tìm
vd: related:www.securityfocus.com

8. Dùng cache:
Cái này dùng để tìm cache của cái mình cần xem nó nằm ở đâu
vd: cache:www.hackingspirits.com me

9.Dùng intext:
Dùng nếu bạn muốn tìm 1 từ cụ thể trong web cần tìm
vd: intext:exploits

10. Dùng phonebook:
Dùng để tìm địa chỉ
vd: phonebook:Lisa+CA

11. Dùng Index of
Dùng liệt kê cho bạn chi tiết
vd :
Index of /admin
Index of /passwd
Index of /password
Index of /mail
“Index of /” +passwd
“Index of /” +password.txt
“Index of /” +.htaccess
“Index of /secret”
“Index of /confidential”
“Index of /root”
“Index of /cgi-bin”
“Index of /credit-card”
“Index of /logs”
“Index of /config”

12. Dùng: allinurl:winnt/system32
Chức năng này giúp bạn vô thẳng các file đc bảo mật của nhiều máy chủ ( file Sys32)

13. Dùng allinurl:wwwboard/passwd.txt
Dùng để tìm pass admin của những forum bị lơi lỏng bảo mật Thay chỗ wwwboard bằng tên cụ thể
thông tin: http://www.securiteam.com/exploits/2BUQ4S0SAW.html

14. Dùng inurl:.bash_history
Để coi lại file history hay log của web đó, vd như số tài khoản…

15.Dùng inurl:config.txt
Để vô thẳng file config của server, để thay đổi thông số
thông tin: http://www.securiteam.com/securitynews/6M00H2K5PG.html

16. 1 số lệnh tìm kẽ hở
inurl:admin filetype:txt
inurl:admin filetype:db
inurl:admin filetype:cfg
inurl:mysql filetype:cfg
inurlasswd filetype:txt
inurl:iisadmin
inurl:auth_user_file.txt
inurlrders.txt
inurl:”wwwroot/*.”
inurl:adpassword.txt
inurl:webeditor.php
inurl:file_upload.php
inurl:gov filetypels “restricted”
index of ftp +.mdb allinurl:/cgi-bin/ +mailto
intitle:”Index of” .sh_history
intitle:”Index of” .bash_history
intitle:”index of” passwd
intitle:”index of” people.lst
intitle:”index of” pwd.db
intitle:”index of” etc/shadow
intitle:”index of” spwd
intitle:”index of” master.passwd
intitle:”index of” htpasswd
intitle:”index of” members OR accounts
intitle:”index of” user_carts OR user_cart
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov
allintitle: “index of/admin”
allintitle: “index of/root”
inurl:”auth_user_file.txt”
inurl:”wwwroot/*.*”
allinurl:/cgi-bin/ +mailto
inurlasswd filetype:txt
Index of ftp/ +.mp3
Index of music/
Index of films/
Index of “Your favorite artist/album/movie etc”
/exchange/login.asp
allinurl:/scripts/cart32.exe
allinurl:/CuteNews/show_archives.php
allinurl:/phpinfo.php
allinurl:/privmsg.php
allinurl:/privmsg.php

Ví dụ:
Bạn muốn tìm ebook về hack nhé.
Bình thường bạn gõ trong Google: hack ebook
Hãy so sánh kết quả đó nếu bạn dùng lệnh trên nhé:
1. +(”index of”) +(”/ebooks”|”/book”) +(chm|pdf|zip|rar) +hack
2. allinurl: +(rar|chm|zip|pdf|tgz) hack computer

Tìm tất cả file ở RapidShare thì Click vào Đây

Kết luận: Bạn có thể có tất cả file nhạc MP3 chất lượng cao, có tất có những "bộ phim hay", có tất cả những tài khoản ... Premium khi đọc một chút bài này !

Chủ Nhật, 4 tháng 1, 2009

Nguy cơ tiềm ẩn trên Google Search


Các chuyên gia bảo mật hôm 28/11 chính thức khởi động một chiến dịch nhằm hướng dẫn người dùng phân biệt những website độc hại được liệt kê trong trang kết quả tìm kiếm của Google Search.


Cho dù người dùng thực hiện tìm kiếm trên Google Search bằng những cụm từ bình thường - ví dụ "how to cisco router vpn dial in" hoặc “cell phones” - nhưng trên trang kết quả được hiển thị sau đó không hề thiếu các website độc hại.

“Số lượng website độc hại vô cùng lớn,” ông Alex Eckelberry - Giám đốc điều hành Sunbelt Software - cho biết. “Hiện chúng tôi đã phát hiện được 27 tên miền độc hại. Mỗi tên miền nói trên trỏ đến 1.499 trang web độc hại khác nhau. Tính ra số lượng website độc hại sẽ không dưới 40.000 trang”.

Những kẻ sở hữu các website độc hại này thường sử dụng các biện pháp như “comment spam” hoặc “blog spam” để tăng mức độ truy cập giúp đẩy cao xếp hạng của website trên Google Search. Nhờ đó những website đó được hiển thị nhiều hơn và ở vị trí cao hơn trên trang kết quả tìm kiếm của Google Search.

Hiện chưa có bằng chứng nào cho thấy tội phạm mạng bỏ tiền ra mua từ khoá tìm kiếm của Google. Tuy nhiên, chắc chắn một điều chúng đã thực hiện nhiều thủ đoạn để “bắt cóc” chiếm quyền điều khiển không ít website hợp pháp để giúp chúng phát tán mã độc.

“Chúng tìm mọi thủ đoạn để xuất hiện trên Google và chuyển hướng bất kỳ người dùng nào không để ý nhắp chuột vào website của chúng đến các website độc hại khác,” ông Eckelberry cho biết.

Hầu hết người dùng thường không mấy khi để ý và nghi ngờ những kết quả tìm kiếm trên Google bởi liên kết đến những website đó được hiển thị với những từ khoá rất phù hợp với mong muốn tìm kiếm và mang những tên miền cấp một “rất kêu”.

Một khi đã truy cập vào những website độc hại đó người dùng thường phải đối mặt với một thông báo giả mạo thiếu sót tính năng gì đó để có thể hiện thị tốt website. Nếu người dùng nhắp chuột vào thông báo đó thì đồng nghĩa họ đã chấp nhận tải về rất nhiều mã độc.

Ví dụ, Sunbelt Software đã phát hiện được có những website sẵn sàng cài đặt tới 25 loại mã độc khác nhau lên PC người dùng - như phần mềm chuyên gửi thư rác, rootkit, ăn cắp mật khẩu, trojan… nếu họ vô tình nhắp chuột truy cập vào. Bất kỳ PC nào không được cài đặt đầy đủ các bản vá lỗi đều sẽ phải lĩnh hậu quả khôn lường.

Các chuyên gia bảo mật khuyến cáo người dùng nên xem xét cẩn thận mỗi khi quyết định nhắp chuột vào một liên kết kết quả tìm kiếm nào đó. Có những website độc hại được Google nhận diện và cảnh báo đầy đủ. Người dùng nên tránh những website này đồng thời thường xuyên nâng cấp cài đặt các bản sửa lỗi mới nhất cho các phần mềm trên PC.

(Theo TTO/PCWorld)

Thứ Tư, 10 tháng 12, 2008

Vài mẹo vặt tìm kiếm với Google.

Google rõ ràng là một công cụ tìm kiếm tốt nhất trên Internet hiện nay. Nhưng phần lớn người dùng không tận dụng hết những ưu điểm của nó. Phải chăng bạn mới chỉ gõ vào một hoặc hai từ khóa rồi chờ đợi những kết quả tốt nhất? Đó có thể là phương pháp tìm kiếm nhanh nhất, nhưng với hơn 3 tỷ trang web có trong chỉ mục của Google thì bạn sẽ phải nỗ lực rất lớn để tìm ra kết quả cần thiết trong số các trang tìm được.

Nhưng Google là một công cụ đặc biệt xuất sắc có thể giúp cho việc khám phá Internet của bạn trở nên dễ dàng hơn. Các tùy chọn tìm kiếm của Google vượt ra khỏi phạm vi của các từ khóa đơn giản, các trang web, và thậm chí là cả những lập trình viên của nó nữa. Hãy xem xét tới một số tùy chọn ít được biết tới của Google.

Mẹo vặt tìm kiếm câu lệnh

Sử dụng một câu lệnh đặc biệt là một phương thức để Google nhận biết bạn muốn hạn chế việc tìm kiếm trong những thành phần hay những đặc điểm nhất định của các trang web. Google có một danh sách khá đầy đủ các thành phần câu lệnh của nó tại www.google.com/help/operators.html. Sau đây là một số thao tác cao cấp có thể giúp bạn thu hẹp phạm vi kết quả tìm kiếm.

Đặt “Intitle:” ở đầu của một từ hay một cụm từ truy vấn (thí dụ: intitle: “Three Blind Mice”) sẽ giới hạn kết quả tìm kiếm của bạn chỉ trong tiêu đề của các trang web.

Còn “Intext:” thì làm cái việc ngược lại với “intitle:”, nó chỉ tìm kiếm trong phần văn bản nội dung của trang mà bỏ qua tiêu đề, các liên kết v.v… “Intext” rất phù hợp khi bạn muốn tìm những nội dung thường xuất hiện trong địa chỉ URL.

“Link:” sẽ giúp bạn biết được những trang nào liên kết tới trang mà bạn quan tâm hoặc những liên kết tới các trang khác trong trang đó. Thí dụ, bạn hãy thử gõ:

“link:http://www.pcmag.com”.

Bạn có thể sử dụng toán tử “site:” (toán tử này giúp bạn hạn chế kết quả trong các vùng tên miền ở cấp cao nhất) cùng với “intitle:” để tìm kiếm những kiểu trang nhất định. Thí dụ, hãy tìm các trang giáo dục nói về Mark Twain bằng cách tìm kiếm với: “intitle:”Mark Twain”site:edu”. Hãy thử nghiệm kết hợp nhiều thành phần khác; bạn sẽ tìm ra một vài cách thức để tìm kiếm thông tin hữu hiệu hơn.

Những dịch vụ ít được biết đến của Google

Google có một số dịch vụ giúp bạn thực hiện một vài công việc mà có thể bạn chưa bao giờ nghĩ rằng có thể sử dụng Google để hoàn thành. Thí dụ, tính năng máy tính mới của Google (www.google.com/help/features.html#calculator) cho phép bạn có thể thực hiện các phép toán và việc chuyển đổi từ hộp tìm kiếm. Có một thí dụ vui, bạn hãy thử với truy vấn “Answer to life the universe and everything”.

Hãy để cho Google giúp bạn kiểm tra lỗi chính tả với các yêu cầu tìm kiếm của bạn. Hãy thử gõ một từ hoặc một cụm từ sai lỗi chính tả vào hộp thoại tìm kiếm (thí dụ: “thre blund mise”) và Google sẽ gợi ý cho bạn cách viết thích hợp hơn. Việc này không phải lúc nào cũng hoàn hảo; sẽ tốt hơn khi từ mà bạn cần tìm có sẵn trong từ điểm. Khi bạn muốn tìm một từ viết đúng chính tả, hãy nhìn xuống trang kết quả, nơi lặp lại yêu cầu tìm kiếm của bạn. (Nếu bạn đang tìm kiếm với “three blind mice”, phía dưới cửa sổ tìm kiếm sẽ xuất hiện một thông báo dạng như “Search the web for “three blind mice”). Bạn sẽ phát hiện được mình có thể bấm chuột vào mỗi từ trong cụm từ đó để biết được định nghĩa của nó trong từ điển.

Mở rộng khả năng tìm kiếm

Google còn đưa ra một số dịch vụ giúp bạn làm rõ hơn tìm kiếm của mình. Google Groups (http:// groups.google.com) lập chỉ mục hàng triệu các thông điệp từ các cuộc thảo luận trên Usenet từ nhiều thập kỷ nay. Google thậm chí còn giúp cho việc mua sắm của bạn với 2 công cụ: Froogle (http://froogle.google.com), với chỉ mục các hàng hóa từ các cửa hiệu trực tuyến, và Google Catalogs (http://catalogs.google.com), với nhiều sản phẩm nổi bật từ hơn 6.000 trang catalogs trong một chỉ mục tìm kiếm được. Bạn có thể tìm được danh sách đầy đủ các công cụ và dịch vụ của Google tại.

Có thể bạn đã quen sử dụng Google thông qua trình duyệt của mình. Vậy đã bao giờ bạn nghĩ tới việc sử dụng Google bên ngoài trình duyệt của mình chưa?

Google Alert (www.googlealert.com) sẽ giám sát các điều kiện tìm kiếm của bạn và sẽ gửi thư điện tử thông báo cho bạn biết thông tin về những bổ sung mới vào chỉ mục của google. (Google Alert không phải là chi nhánh của Google; nó sử dụng các hàm dịch vụ Web API của Google để thực hiện tìm kiếm của nó). Nếu bạn quan tâm tới những câu chuyện mới hơn là những nội dung Web chung chung, hãy thử xem xét bản beta của Google News Alerts (www.google.com/newsalerts). Dịch vụ này (là một chi nhánh của Google) sẽ giám sát tới 50 truy vấn trong mỗi địa chỉ e-mail và sẽ gửi cho bạn thông tin về những câu chuyện mới phù hợp với truy vấn của bạn. (Gợi ý: Hãy sử dụng các thành phần câu lệnh “intitle:” và “source:” với Google News để giới hạn số thông báo mà bạn nhận được).

Trong năm 2002, Google đã đưa ra các hàm Google API (giao diện lập trình ứng dụng), một phương thức giúp các lập trình viên có thể tiếp cận các kết quả từ cơ chế tìm kiếm của Google mà không vi phạm các điều khoản của Google. Rất nhiều người đã tạo được các ứng dụng hữu ích (và đôi lúc không hữu ích lắm nhưng thú vị) không có sẵn ở Google, mà điển hình là Google Alert. Với rất nhiều ứng dụng, bạn sẽ phải cần khóa API, hiện có miễn phí tại www.google.com/apis.

Với rất nhiều đặc tính tìm kiếm khác nhau của mình, Google đã vượt xa khỏi một công cụ tìm kiếm thông thường. Hãy thử nghiệm một số mẹo được đưa ra trên đây, bạn sẽ bị ngạc nhiên với số lượng các phương thức khác nhau mà Google làm tăng hiệu quả công việc tìm kiếm trên mạng của bạn.

Tìm kiếm trong một khoảng thời gian

Daterange: (ngày bắt đầu - ngày kết thúc). Bạn có thể giới hạn tìm kiếm của mình trong số các trang được lập chỉ mục trong một khoảng thời gian nhất định. Daterange: sẽ tìm kiếm với thời gian là khi các trang được lập chỉ mục, chứ không phải thời gian các trang đó được tạo ra. Toán tử này có thể giúp bạn chắc chắn rằng kết qủa thu được sẽ là những nội dung mới, hoặc bạn có thể sử dụng nó để loại từ những chủ đề mới tạo mà tập trung vào tìm kiếm những kết quả cũ hơn.

Thêm một số ứng dụng Google API

Staggernation cung cấp 3 công cụ dựa trên các hàm Google AIP. Công cụ tìm kiếm Web theo những máy chủ Google API (GAWSH) sẽ cung cấp một danh sách những máy chủ Web mà bạn cần tìm (www.staggernation.com/gawsh). Khi bạn bấm vào hình tam giác bên cạnh mỗi tên máy chủ, bạn sẽ nhận được một danh sách kết quả về máy chủ đó. Còn công cụ phác thảo trình duyệt liên quan Google API (GARBO) thì phức tạp hơn một chút: Bạn phải lựa chọn kết quả mình muốn tìm là những trang có liên quan tới địa chỉ URL mà bạn nhập vào đó hay là những trang liên kết tới địa chỉ đó (www.staggernation.com/garbo/). Bấm vào hình tam giác bên cạnh mỗi địa chỉ URL, bạn sẽ nhận được một danh sách các trang liên kết hoặc có liên quan tới địa chỉ này. Còn CapeMail là một ứng dụng tìm kiếm thư điện tử cho phép bạn gửi một thư điện tử tới google@capeclear.com với tiêu đề của thư chính là nội dung truy vấn của bạn. Sau đó bạn sẽ nhận được 10 kết quả đầu tiên. Có thể bạn chẳng cần dùng tới nó hàng ngày, nhưng nếu điện thoại di động của bạn có khả năng gửi e-mail mà không duyệt web được, thì đây cũng là một địa chỉ hữu ích mà bạn nên biết.




Theo PC Magazine

Cách đưa công cụ tìm kiếm google vào web Blog