Tài liệu tổng hợp các bài viết SEO
Bên trong việc tìm kiếm
Với quy mô của Web, với số lượng quá lớn các trang không được truy cập đến trong nhiều năm và trang
có chứa những từ quá phổ biến dẫn đến những site không liên quan, việc lập chỉ mục dù chỉ một phần
của Web để có thể trả về kết quả phù hợp là một quá trình đòi hỏi rất nhiều công sức to lớn.
Tuy nhiên, về căn bản, công việc này rất đơn giản: chương trình phần mềm thông minh sẽ “chu du”
khắp trên Web, tìm kiếm và lưu trữ bất cứ thông tin nào chưa có trong chỉ mục và thường là lưu toàn bộ
trang Web. Thông tin thu thập được có thể từ những trang đã được lập chỉ mục trước đó nhưng đã thay
đổi, liên kết đến những trang chưa được lập chỉ mục và các địa chỉ Web do các công ty thứ ba đưa lên.
Một khi các chỉ mục đã được tập hợp lại, chúng sẽ được kiểm tra để loại bỏ những thông tin trùng lắp,
chẳng hạn như các phiên bản khác nhau của cùng một site (site dự phòng); loại bỏ những trang lập lại
quá nhiều lần cùng từ khoá. Một số search engine còn có khả năng gán trạng thái đặc biệt cho trang
Web có dùng siêu thẻ (metatag) chứa các thành phần mô tả thông tin. Một số search engine có khả
năng phân tích nội dung trang Web và cho biết tần suất mà những trang khác liên kết đến trang này.
Như vậy, trang Web càng phổ biến thì nội dung của nó càng dễ tìm kiếm.
Khi người dùng đưa yêu cầu tìm kiếm thông tin cho search engine hay dịch vụ thư mục, các giải thuật
tinh vi bên trong sẽ được kích hoạt. Mỗi search engine có một cách xử lý khác nhau đối với thông tin mà
nó nhận được từ người dùng, nhưng mục tiêu thì giống nhau: dự đoán người dùng cần gì và trả về
thông tin tương ứng. Những vấn tin của người dùng thường được phân tích rất chi tiết để phát hiện
những sai sót chính tả trong từ khoá hay liệu thông tin này đã được tìm kiếm chưa.
Tóm tắt nội dung tài liệu: Tài liệu tổng hợp các bài viết SEO
Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 1 Tài liệu tổng hợp các bài viết SEO- Search Engine Optimization (căn bản) Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 2 Contents I. TỔNG QUAN VỀ SEO ............................................................................................................................. 4 1.1 Search Engine là gì? ........................................................................................................................... 4 1.2 Search Engine làm việc như thế nào? ................................................................................................. 6 1.3 SEO là gì? ........................................................................................................................................ 10 1.4 Kết quả tự nhiên và kết quả được tài trợ (Google SEO và Google Adwords) .................................... 10 1.5 Mục đích của các Search Engine Optimization ................................................................................. 13 1.6 SEO là nghệ thuật hay khoa học ? .................................................................................................... 13 II. CÁC SEARCH ENGINE XẾP HẠNG CÁC TRANG WEB NHƯ THẾ NÀO?.................................................. 15 III QUY TRÌNH THỰC HIỆN 1 CHIẾN DỊCH SEO ..................................................................................... 17 3.1 Nghiên cứu & xác định từ khóa......................................................................................................... 18 3.2 Tối ưu hóa trong trang .................................................................................................................... 19 3.3 Tối ưu hóa ngoài trang ..................................................................................................................... 20 3.4 Theo dõi thứ hạng ............................................................................................................................ 21 IV. NGHIÊN CỨU & XÁC ĐỊNH TỪ KHÓA ................................................................................................ 21 4.1 Thực tế quá trình chọn keyword cho 1 Website ................................................................................ 21 4.2 Nghiên cứu từ khóa .......................................................................................................................... 23 4.2.1 Nghiên cứu từ khóa mục tiêu trước khi SEO .................................................................................. 23 4.2.2 Bốn bước nghiên cứu từ khóa thiết kế web ................................................................................... 25 4.3 Sử dụng các công cụ nghiên cứu từ khóa ......................................................................................... 27 4.3.1 Công cụ gợi ý từ khóa trong seo .................................................................................................... 27 4.3.2 10 công cụ nghiên cứu từ khóa miễn phí hay nhất ...................................................................... 28 4.3.4 công cụ keyword của google.......................................................................................................... 31 4.3.5 Tối ưu keyword cho seo tốt hơn ................................................................................................... 39 V. TỐI ƯU HÓA TRONG TRANG (ON-PAGE OPTIMIZATION) .................................................................. 41 5.1 Tối ưu snippets với thẻ meta description .......................................................................................... 41 5.2 tối ưu hóa thẻ meta descriptions .............................................................................................. 43 5.3 TỐI ƯU CÁC THÀNH PHẦN CỦA HTML .............................................................................................. 45 5.3.1 tối ưu metal Title ........................................................................................................................... 45 5.3.2 Tối ưu hóa thẻ Alt và Title Image cho hình ảnh ............................................................................. 45 5.3.3 nội dung trong phần body ............................................................................................................. 47 5.3.4 Sử dụng thật tốt các thẻ : H1 ,H2 , H3 ,P, LI ................................................................................. 47 5.3.5 Nội dung trong liên kết .................................................................................................................. 47 5.3.5 Tối ưu hóa cấu trúc URL trở nên thân thiện với công cụ tìm kiếm ................................................. 47 Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 3 5.4 TỐI ƯU BỐ CỤC CỦA TRANG ............................................................................................................ 49 5.5 TỐI ƯU NAVIGATOR & MENU ........................................................................................................... 52 5.6 CSS & SEO ........................................................................................................................................ 53 5.7 TRÙNG LẶP NỘI DUNG- NỘI DUNG KÉP ........................................................................................... 60 5.7.1 Nội dung kép và phương pháp phát hiện mới của Google .............................................................. 60 5.7.2 cách tránh lỗi Trùng lặp nội dung (Duplicate Content) ................................................................... 62 5.8 SEO & VỊ TRÍ ĐỊA LÝ ........................................................................................................................ 63 5.8 CÁC VẤN ĐỀ LIÊN QUAN ĐẾN KHẢ NĂNG LẬP CHỈ MỤC................................................................... 66 5.8.1 Đạt nhiều chỉ mục từ Google (Google Index) ................................................................................. 66 5.8.2 Làm thế nào để tạo google sitemap cho website của bạn ............................................................. 67 5.8.3 cách làm sitemap cho yahoo .......................................................................................................... 69 5.8.4 - 7 bước làm tăng tốc độ index webiste của Google ...................................................................... 70 5.8.5 Để Google index các videos của bạn? ............................................................................................ 71 5.8.6 Các cách ngăn không cho google index một số trang trên website ................................................ 71 5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm ................................................................................. 72 5.19 Robots.txt & Googlebot - Allow & Disallow ...................................................................................... 74 5.19 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở trang chủ .................................... 76 Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 4 I. TỔNG QUAN VỀ SEO 1.1 Search Engine là gì? Search engine phần mềm cung cấp các địa chỉ Web có chứa một hay nhiều thông tin, từ khoá mà người dùng cần tìm kiếm. Thuật ngữ search engine đôi lúc được dùng không chính xác để chỉ các chỉ mục Web do các biên tập viên biên soạn. Web crawler còn được gọi là spider (con nhện) là một phần của search engine, chuyên “chu du” khắp Web, sao chép từng trang nó tìm được và lập chỉ mục các từ khóa, tên trang. Hãy thử tưởng tượng một cuộc sống hoàn toàn không có niên giám điện thoại hay một trợ giúp nào khác. Sử dụng điện thoại lúc đó sẽ trở nên rất khó khăn. Điều này cũng tương tự như dùng Web mà không có công cụ tìm kiếm (search engine). Với search engine, bạn chỉ cần biết một vài thông tin hay từ khoá là có thể tìm được nơi cần đến. Theo một nghiên cứu do công ty Zona Research (Mỹ) tiến hành năm 1999 thì search engine hiện là phương thức tìm kiếm thông tin trên Web được sử dụng nhiều nhất, nó chiếm tới 77% tổng thời gian tìm kiếm. Theo kết quả khảo sát người tiêu dùng của một công ty khác vào năm 1999 thì 88% người dùng trực tuyến có sử dụng một search engine và 72% có dùng một search engine để tìm kiếm hàng hoá bán lẻ. Đối với nhiều người dùng, search engine là yếu tố định hình nên bức tranh về kho thông tin trên Web. Tuy nhiên, một nghiên cứu gần đây của NEC Research Institute và Inktomy cho thấy có tới hơn một tỷ trang Web riêng biệt trên Internet và hầu hết các search engine đã bỏ qua không lập chỉ mục cho 1/4 số trang này. Mặt khác, khoảng 7-14% những nội dung đã được lập chỉ mục lại không còn tồn tại trên Net. Bên trong việc tìm kiếm Với quy mô của Web, với số lượng quá lớn các trang không được truy cập đến trong nhiều năm và trang có chứa những từ quá phổ biến dẫn đến những site không liên quan, việc lập chỉ mục dù chỉ một phần của Web để có thể trả về kết quả phù hợp là một quá trình đòi hỏi rất nhiều công sức to lớn. Tuy nhiên, về căn bản, công việc này rất đơn giản: chương trình phần mềm thông minh sẽ “chu du” khắp trên Web, tìm kiếm và lưu trữ bất cứ thông tin nào chưa có trong chỉ mục và thường là lưu toàn bộ trang Web. Thông tin thu thập được có thể từ những trang đã được lập chỉ mục trước đó nhưng đã thay đổi, liên kết đến những trang chưa được lập chỉ mục và các địa chỉ Web do các công ty thứ ba đưa lên. Một khi các chỉ mục đã được tập hợp lại, chúng sẽ được kiểm tra để loại bỏ những thông tin trùng lắp, chẳng hạn như các phiên bản khác nhau của cùng một site (site dự phòng); loại bỏ những trang lập lại quá nhiều lần cùng từ khoá. Một số search engine còn có khả năng gán trạng thái đặc biệt cho trang Web có dùng siêu thẻ (metatag) chứa các thành phần mô tả thông tin. Một số search engine có khả năng phân tích nội dung trang Web và cho biết tần suất mà những trang khác liên kết đến trang này. Như vậy, trang Web càng phổ biến thì nội dung của nó càng dễ tìm kiếm. Khi người dùng đưa yêu cầu tìm kiếm thông tin cho search engine hay dịch vụ thư mục, các giải thuật tinh vi bên trong sẽ được kích hoạt. Mỗi search engine có một cách xử lý khác nhau đối với thông tin mà nó nhận được từ người dùng, nhưng mục tiêu thì giống nhau: dự đoán người dùng cần gì và trả về Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 5 thông tin tương ứng. Những vấn tin của người dùng thường được phân tích rất chi tiết để phát hiện những sai sót chính tả trong từ khoá hay liệu thông tin này đã được tìm kiếm chưa. Nguyên lý hoạt động Một Search Engine hoạt động theo các bước sau: Web crawling Indexing Searhing Search Engine làm việc bằng cách lưu trữ thông tin về nhiều trang Web trên WWW. Những thông tin này sẽ được thu thập bởi các Spider (chính là Web crawling) và nội dung của mỗi trang sẽ được phân tích để SE quyết định nên index cái nào (ví dụ, những từ khoá được thu thập từ các titles, heading hay một số trường đặc biệt gọi là meta tags) để trả về những thông tin mà người tìm kiếm mong muốn nhất. Dữ liệu về những trang Web sẽ được lưu trữ tại các cơ sở dữ liệu chỉ mục để sử dụng cho những lần truy vấn sau. Một số Search Engine, như Google chẳng hạn, sẽ lưu trữ toàn bộ hay một phần trang gốc (được xem như một cache) cũng như thông tin về trang Web đó, trái lại với một số SE khác, như AltaVista, sẽ lữu trữ tất cả các từ của những trang mà nó tìm thấy. Khi người dùng nhập vào các Search Engine một truy vấn (chủ yếu là các keyword), các SE này sẽ kiểm các index của nó và cung cấp danh sách các trang Web phù hợp nhất, thường là các cụm từ ngắn hay một phần của một đoạn văn bản. Hầu hết các Search Engine đều sử dụng các Boolean Operators (toán tử luận lý) như AND, OR và NOT để xác định các search query (truy vấn tìm kiếm). Một số SE khác lại sử dụng những phương pháp tiên tiến hơn như Proximity Search (tìm kiếm gần kề) để cho phép người dùng xác định được khoảng cách giữa các từ khoá. Dịch vụ thư mục Các dịch vụ thư mục như của Yahoo và hỏi-đáp như của Ask Jeeves không dùng phần mềm thu thập tự động thông tin Web. Thay vào đó, các biên tập viên sẽ thực hiện việc tổng hợp thư mục Web một cách thủ công. Mặc dù Yahoo không lập chỉ mục trang Web như cách của search engine nhưng nó thực sự cung cấp dữ liệu chất lượng cao. Tuy nhiên, với mức tăng trưởng hàng năm 70% tổng số trang Web từ nay đến 2003 theo như dự báo của International Data Corp. thì những dịch vụ thư mục kiểu này sẽ phải gia tăng liên tục số lượng biên tập viên để có thể duy trì được tính hữu dụng của dịch vụ. Một loại search engine lai mới đang xuất hiện, sử dụng phương pháp phân tích ngôn ngữ để xác định dịch vụ thư mục, search engine hay cơ sở dữ liệu sẽ đáp ứng tốt nhất cho yêu cầu tìm kiếm thông tin Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 6 của người dùng. Ví dụ, vấn tin “dân số Việt Nam” sẽ trả về thông tin điều tra dân số của Việt Nam, liên kết đến các Web site, thư mục và các thông tin có liên quan. Tương lai của việc tìm kiếm Một số search engine đã có tính năng tìm kiếm các đối tượng thay vì văn bản – chẳng hạn ảnh của một “ngôi sao” nào đó ở dạng JPEG. Tuy nhiên, còn rất nhiều nội dung multimedia như hình ảnh động của Shockware, Flash và dạng âm thanh, hình ảnh liên tục, hiện thời chưa thể lập chỉ mục được. XML là một ngôn ngữ mô tả nội dung, không chỉ có khả năng chuyển tải thông tin mà còn có các thẻ định danh để mô tả thông tin này có ý nghĩa gì. Search engine có thể lập chỉ mục trang Web XML dễ dàng hơn nhờ những thẻ này cho biết thông tin tương ứng xuất hiện ở đâu trên trang. Ví dụ, thẻ định danh “125” báo cho search engine biết rằng 125 là giá. Điều này cho phép search engine so sánh giá của nhiều nhà bán lẻ khác nhau một cách dễ dàng và nhanh chóng. 1.2 Search Engine làm việc như thế nào? Internet và World Wide Web có đến hàng trăm triệu website có sẵn mang các thông tin về nhiều chủ đề khác nhau. Tuy nhiên hầu hết chúng đều được đặt tiêu đề theo ý thích của tác giả, và được đặt trên máy chủ với các tên khó hiểu. Khi bạn cần biết về một chủ đề nào thì sẽ phải đọc các trang nào? Phần lớn mọi người khi băn khoăn về vấn đề này họ sẽ sử dụng một công cụ tìm kiếm trên Internet (Internet search engine). Search engine trên Internet là các site đặc biệt trên web, được thiết kế để giúp mọi người tìm kiếm thông tin được lưu trên các site khác nhau. Có nhiều cách khác nhau trong cách tìm kiếm này, nhưng tất cả chúng đều thực hiện ba nhiệm vụ cơ bản: Tìm kiếm Internet – hoặc chọn các mẩu thông tin trên Internet – dựa trên các từ quan trọng Giữ một chỉ mục cho các từ tìm thấy cùng với địa chỉ tìm thấy chúng Cho phép người dùng tìm kiếm các từ hoặc cụm từ được tìm kiếm trong chỉ mục đó. Các cỗ máy tìm kiếm trước kia đều giữ chỉ mục của hàng trăm ngàn trang web và tài liệu, chúng thường nhận có thể một hoặc hai nghìn yêu cầu tìm kiếm mỗi ngày. Ngày nay, cỗ máy tìm kiếm hàng đầu đánh chỉ mục hàng trăm triệu trang và đáp trả đến hàng chục tri ... ít. Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 71 Với việc bạn làm theo các bước này bạn sẽ thấy rằng site của bạn sẽ rất nhanh chóng được phổ biến rộng rải. Mình không chắc chắn trong 24h bạn sẽ thành công, nhưng điều đó là có thể. Cách làm này chắc chắn sẽ rút ngắn thời gian index site từ vài tuần xuống chỉ còn vài ngày. 5.8.5 Để Google index các videos của bạn? Cách đơn giản và hữu hiệu nhất để Google chú ý tới các videos trên website là tạo ra và maintain Video Sitemap. Video Sitemap sẽ cung cấp cho Google những thông tin thiết yếu về videos của bạn, bao gồm cả URL của trang để có thể tìm thấy videos, titles của videos, keywords, hình ảnh thumbnail, độ dài và những thông tin khác. Sitemaps cũng cho phép xác định khoảng thời gian mỗi video có hiệu lực. điều này vô cùng quan trọng đối với những nội dung có khoảng thời gian xem nhất định. Khi chúng hết hiệu lực, chúng ta có thể gỡ chúng xuống. Một khi Sitemap được tạo, bạn có thể đang ký URL của Sitemap file ở Google Webmaster Tools hoặc qua file robots.txt của bạn. Khi một video được index, nó sẽ xuất hiện trong kết quả tìm kiếm của web mà chúng ta gọi là Video Onebox (một dạng videos có liên quan tới những chủ đề được tìm kiếm) và trong kết quả tìm kiếm videos, Google Video. Kết quả tìm kiếm video sẽ ngay lập tức được xác định bởi hình ảnh, độ dài và miêu tả. Sau đây là một ví dụ cho kết quả tìm kiếm Video từ CNN.com từ Google. Chúng tôi khuyến khích việc đăng ký Video Sitemaps và luôn cập nhật những thông tin mới nhất. Hãy vào Video Sitemap được cập nhật gần đây nhất của chúng tôi (Help Center) và tận dụng diễn đàn hỗ trợ Sitemap. Nếu như bạn đăng ký file Video Sitemap qua Webmaster Tools và bạn cũng có thể chia sẻ kinh nghiệm hay những khó khăn của bạn tại đây 5.8.6 Các cách ngăn không cho google index một số trang trên website Đôi khi mọi webmaster cố gắng tìm mọi cách đề webstie của họ được index nhanh nhất và nhiều nhất. Nhưng cũng có nhiều khi họ lại không muốn Google và các search engine index một số trang trong website của họ. Vậy trong trường hợp này có cách nào để ngăn chặn không cho Google để mắt đến hay không ? Câu trả lời là có, rất nhiều là đằng khác. Ở bài viết này mình sẽ đề cử 3 trong số rất nhiều cách ngăn chặn Google bot crwaling webite của bạn. Tất nhiên đây là nhưng cách đã được sử dụng thành công & hoàn toàn tuân thủ đúng các quy định của Google dành cho webmaster. 1. Sử dụng tài khoản: Cách hữu hiệu nhất là sử dụng tài khoản bao gồm username & password để khóa phần không muốn “bị” index lại. Tất nhiên ở đây hơi phức tạp khi phải sử dụng hay cấu hình lại hệ thống, nhưng thât sự đây là cách hiệu quả nhất có thể sử dụng. Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 72 2. Sử dụng nofollow meta header tag: Cách thứ 2 cũng hiểu quả không kém so với cách sử dụng tại khoản đề khóa phần không muốn index lại. Đó là sử dụng Nofollow Meta Header tag, việc này cũng khá đơn giản. Bạn chỉ cần soạn danh sách các trang không muốn được index và gáng vào mỗi trang thêm 1 thẻ meta nữa là meta=nofollow, vậy là song. Việc làm này sẽ giúp Google bỏ qua những trang này khi bắt đầu crawl webstie của bạn. Tuy nhiên việc này cũng có thể không đem đến hiệu quả như móng muốn trong trường hợp bán sở hữu quá nhiều trang mà không muốn Google index bất cứ trang nào, việc đó vừa gây khó khắn trong việc viết bài vừa đem đến cho Google sự nghi ngại không đáng có. Thực ra bản chất của Google bot rất muốn được index thông tin trên các website, để góp phần nâng cao chất lượng của kết quả tìm kiếm cũng như khẳng định giá trị của Google, vì thế nên mới có việc nhiều ngày gần đây các bác làm báo bên Mĩ đòi Google trả tiền mới cho index thông tin là vậy. 3. Sử dụng nofollow tag: Cách thứ 3 là cách đơn giản và có lẽ phổ biến nhất hiện nay, đó là sử dụng nofolow tag ngay tại đường link dẫn đến trang thông tin. Cách làm thì chắc không phải nói nhiều các bạn cũng biết chỉ cần thêm rel=nofollow. Nhưng cần hiểu rõ bản chất của vấn đề 1 chút đề cho dễ làm việc. Phương pháp hoạt động của Google index thông tin thông qua các đường link tồn tại trên các website, vì vậy khi mà một đường link nào đó dẫn đến các trang chứa thông tin được khóa trước ngay từ đầu bằng thẻ rel=nofollow thì Google Bot sẽ tự động không index những trang này. Xin nhắc lài là không index, chứ thực ra thì Google cũng có nghía qua trang web cảu bạn rồi. Thẻ rel=nofolow ở đây được xem như một khung của bằng gương, Google sẽ vẫn xem qua website của bạn thông qua tâm gương ấy, nhưng nó sẽ không index website của bạn. Trên là 3 cách theo đánh giá của mình là hiệu quả nhất, chắc chắn sẽ có nhiều cách khác tốt & đơn gian hơn. Nếu bạn biết một trong số đó, hãy cũng chia sẽ nhé. 5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm Tính khả dụng (usability) và thứ hạng của trang Web trên máy tìm kiếm. Cách tối ưu, quảng bá trang Web. Liệu các máy tìm kiếm, công vụ tìm kiếm có để ý đến tính khả dụng (usability) của trang Web ? Có sự khác biệt nào giữa một trang dễ dàng duyệt với các trang khác không ? Bài viết này sẽ đề cập tới tính khả dụng và thứ hạng của trang Web trên máy tìm kiếm. Một bằng sáng chế của Yahoo đã chỉ ra rằng các máy tìm kiếm có tính đến khía cạnh thiết kế của trang Web.Tài liệu này chứa rất nhiều chỉ số mà máy tìm kiếm sẽ dùng đến để xác định tính khả dụng của trang Web. Tính khả dụng nào quan trọng với máy tìm kiếm Bằng sáng chế nói trên có trích một đoạn ngắn giải thích tại sao máy tìm kiếm lại tính đến tính khả dụng của trang Web : Việc tạo một trang Web dễ dàng và thoải mái khi sử dụng là rất quan trọng, điều này đặc biệt quan trọng hơn đối với những trang Web muốn kiếm tiền.[...] Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 73 Nếu một trang nào đó không dễ dàng và thoải mái khi duyệt, thì khả năng kiếm tiền từ trang này sẽ bị triệt tiêu rất nhiều. Một trong những chỉ số qui ước trang Web có dễ dàng và thoải mái hay không khi sử dụng được gọi là “tính hỗn loạn” (clutter) Trang Web với tính khả dụng tốt thường là những trang có tỉ lệ khoán chuyển1 cao hơn các trang “hỗn loạn”. Ngoài ra các trang có tính khả dụng cao thì thường có chất lượng cao hơn các trang khác và các máy tìm kiếm sẽ cố gắng hiển thị các trang có tính khả dụng cao trong trang kết của tìm kiếm. Các nhân tố máy tìm kiếm xác định tính hỗn loạn Bằng sáng chế của Yahoo cung cấp danh sách của 51 nhân tố trong trang Web cho phép phân tích để định ra tính “hỗn loạn” của một trang Web : 1. Tổng số liên kết 2. Tổng số từ 3. Tổng số hình ảnh (không phải hình ảnh quảng cáo) 4. Vùng hình ảnh hiện thị trên màn hình (không phải hình ảnh quảng cáo) 5. Kích cỡ trang 6. Diện tích trang (tổng) 7. Chiều dài trang 8. Tổng số bảng 9. Số bảng cột tối đa (của từng bảng) 10. Số bảng dòng tối đa (của từng bảng) 11. Tổng số cột 12. Tổng số dòng 13. Tổng số ô 14. Trung bình khoảng cách ngoài (từng bảng) 15. Trung bình khoảng cách trong (từng bảng) 16. Kích cỡ phần quan sát được trên màn hình 17. Vùng quan sát được trên màn hình 18. Vị trí trung tâm của trọng tâm so với giữa trang 19. Tổng số kích cỡ font dùng cho liên kết 20. Tổng số kích cỡ font dùng cho tiêu đề 21. Tổng số kích cỡ font dùng cho phần văn bản 22. Tổng số kích cỡ font 23. Dàn trang đẹp 24. Tổng số mã màu (trừ quảng cáo) 25. Căn lề các thành phần của trang 26. Đọ sáng của trang 27. Chiều ngang cố định và tương đối của trang 28. Trọng lượng trang (thời gian tải trang) 29. Tổng số quảng cáo 30. Diện tích tổng của các quảng cáo 31. Diện tích của từng quảng cáo đơn 32. Diện tích của quảng cáo kích thước lớn nhất trước tầm quan sát 33. Diện tích quảng cáo lớn nhất 34. Tông diện tích các quảng cáo lớn nhất nằm trên tầm quan sát trang 35. Khoảng cách từ quảng cáo tới nội dung trang 36. Tổng số quảng cáo bên ngoài nằm trên tầm nhìn của trang 37. Tổng số quảng cáo bên ngoài nằm dưới tầm nhìn của trang 38. Tổng số quảng cáo bên ngoài 39. Tổng số quảng cáo bên trong nằm trên tầm nhìn của trang Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 74 40. Tổng số quảng cáo bên trong nằm dưới tầm nhìn của trang 41. Tổng số quảng cáo bên trong 42. Tổng số liên kết quảng cáo tài trợ nằm trên tầm quan sát 43. Tổng số liên kết quảng cáo tài trợ nằm dưới tầm quan sát 44. Tổng số liên kết quảng cáo tài trợ 45. Tổng số hình ảnh quảng cáo nằm trên tầm quan sát 46. Tổng số hình ảnh quảng cáo nằm dưới tầm quan sát 47. Tổng số hình ảnh quảng cáo 48. Tổng số quảng cáo dạng chữ nằm trên tầm quan sát 49. Tổng số quảng cáo dạng chữ nằm dưới tầm quan sát 50. Tổng số quảng cáo dạng chữ 51. Vị trí quảng cáo trên trang Theo bằng sáng chế này thì Yahoo sẽ tính đến sự có mặt của các hình động và các ảnh flash quảng cáo cũng như độ sáng trung bình của các quảng cáo này. Tối ưu trang Web của bạn Một trang Web với tính khả dụng cao sẽ cải thiện đáng kể tỉ lệ khoán chuyển trên trang. Nếu trang Web của bạn có rất nhiều khách ghé thăm nhưng lại chỉ bán được rất ít hay rất ít tác vụ mong muốn được thực thi thì bạn chắc chắn là trang Web đó rất “hỗn loạn” và bạn phải cải thiện tính khả dụng trang Web đó. Google cũng đã có một bằng sáng chế tương tự với cái tên “phát hiện và loại bỏ các tài liệu gây phiền hà”. Qua đó, các trang Web được thiết kế tốt sẽ được đánh giá cao hơn và đương nhiên là có thứ hạng cao hơn. Bởi vậy mã nguồn HTML trang web của bạn phải gây được ấn tượng tốt cho các công cụ tìm kiếm. Nếu chúng không thấy nội dung hợp lý thì những trang này không thể có thứ hạng cao trên các máy tìm kiếm. 5.10 Robots.txt & Googlebot - Allow & Disallow Khả năng tìm kiếm của các spider là rất lơn, chúng có thể lùng xục khắp nơi trên website của bạn. Với bài viết này chúng ta sẻ cũng tìm hiểm cách thức sử dụng file robots.txt để quy định các spider, đặc biệt là googlebot. Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web Các User Agent của Google Google có vài user-agent chính. Bạn có thể ngăn chúng bằng cách thêm tên của bọ tìm kiếm tương ứng và trong dòng User-agent tương ứng trong bảng ghi robots.txt. Nếu bạn chặn Googlebot thì có nghĩa là bạn chặn tất cả các bọ tìm kiếm với từ khóa “Googlebot”. Googlebot: Đánh chỉ số từ các chỉ mục cũ và mới của Google. Googlebot-Mobile: Đánh chỉ số cho các thiết bị cầm tay hoặc di động. Googlebot-Image: Đánh chỉ số các tệp tin ảnh. Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 75 Mediapartners-Google: Xuất hiện trong các trang dăng quảng cáo của Google Adsense. Adsbot-Google: Đánh chỉ số các trang được nhà quảng cáo sử dụng giới thiệu sản phẩm hay dịch vụ thông qua Google Adwords. Nó cho phép đánh giá chất lượng của trang dùng dịch vụ Adwords. Chặn Googlebot Để chặn toàn bộ Googlebot thì bạn thêm cú pháp sau vào file robots loại trừ : User-agent: Googlebot Disallow: / Cho phép Googlebot Trong trường hợp bạn muốn chặn tất cả các bọ tìm kiếm khác trừ một robot, Googlebot chẳng hạn, thì bạn có thể sử dụng cú pháp sau. Tuy nhiên nếu bạn không muốn trang liên quan biến mất khỏi kết quả tìm kiếm của các máy tìm kiếm như Yahoo, MSN Live hay Ask thì bạn không nên làm như thế. User-agent: * Disallow: / User-agent: Googlebot Disallow: Cho phép mở rộng Google hỗ trợ cú pháp mở rộng “Allow” trong tệp tin robots.txt. Có nhiều máy tìm kiếm không hỗ trợ phần mở rộng này, vì thế bạn nên tham khảo kỹ. Dòng lệnh “Allow” hoạt động cũng giống như “Disallow” chỉ khác là nó liệt kê các thư mục hay trang bạn cho phép đánh chỉ số. Bạn có thể sử dụng đồng thời “Allow” và “Disallow” cùng nhau. Chẳng hạn để cấm tất cả các trang trong một thư mục “seotips” chẳng hạn, trừ tệp tin “toi-uu-hoa.html”, bạn hãy làm như sau : User-agent: Googlebot Disallow: /seotips/ Allow: /seotips/toi-uu-hoa.html Còn trong trường hợp bạn muốn chặn Googlebot và sau đó lại vẫn muốn cho các bot khác của Google (Googlebot-Mobile) chẳng hạn, bạn có thể sử dụng lệnh Allow như sau : User-agent: Googlebot Disallow: / User-agent: Googlebot-Mobile Allow: / Sử dụng mẫu tổ hợp Đặc biệt hữu ích trong trường hợp bạn không muốn phải liệt kê tất cả các trang mà bạn muốn chặn. Đây là phần đuôi mở rộng mà GoogleBot hỗ trợ. Chú ý là các máy tìm kiếm khác chưa chắc đã hỗ trợ tính năng này. Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 76 Mẫu tổ hợp chuỗi các ký tự sử dụng dấu sao (*) Bạn có thể sử dụng dấu sao (*) để liệt kê tổ hợp chuỗi các lkys tự. Ví dụ bạn có thể chặn một loạt các thư mục con bắt đầu bằng chữ wp (ví dụ wp-admin, wp-content cho blog WordPress) như sau : User-agent: Googlebot Disallow: /wp*/ Để chặn tất cả đường dẫn URL mà chứa ký tự (?) chứa tham biến (trong ngôn ngữ PHP), bạn hãy làm như sau : User-agent: * Disallow: /*? Kiểm tra phần kết của chuỗi ký tự URL bằng $ Bạn cũng có thể sử dụng dấu dollard ($) để liệt kê các URL có phần kết tương ứng. Ví dụ để chặn tất cả các đường dẫn URL kết thúc với pdf (phiên bản pdf trên website để tránh trùng nội dung chẳng hạn) : User-agent: Googlebot Disallow: /*.pdf$ Bạn cũng có thể sử dụng tổ hợp kết này với lệnh Allow. Ví dụ nếu như có dấu hỏi ? tương ứng với một session ID, bạn có thể loại trừ chúng để tránh cho GoogleBot phải đánh chỉ số một nội dung trùng lặp. Thế nhưng các URLs kết thúc bởi dấu hỏi ? lại là một phiên bản trang mà bạn muốn thêm vào. Trong trường hợp này, hãy đặt tệp tin robots.txt của bạn như sau : User-agent: * Allow: /*?$ Disallow: /*? Dòng lệnh Disallow:/ *? sẽ chặn tất cả các URL có chứa ký tự ? (Cụ thể là nó sẽ chặn tất cả các URL bắt đầu bằng tên miền, tiếp theo các ký tự, tiếp theo là dấu hỏi ?, tiếp theo bởi bất kể ký tự nào khác) Dòng lệnh Allow: /*?$ sẽ cho phép bất kể đường dẫn nào kết thúc bởi dấu hỏi ? (Cụ thể là với bất kể URL nào bắt đầu bằng tên miên, theo bởi chuỗi ký tự, theo tiêp bởi dấu hỏi ?, không có ký tự nào nằm sau dấu hỏi này). 5.11 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở trang chủ việc các bạn ra sức làm SEO, cố gắng nhồi nhét càng nhiều keyword càng tốt vào trang chủ của website bạn đang là một thực tế thường thấy ở Việt Nam. Một số webmaster chỉ chú trọng làm SEO cho 1 trang duy nhất mà quên rằng, chính những phần content, những trang nhỏ trong website mới chính là nguồn thu về traffic chủ yếu cho webite của bạn. Nhưng việc làm này chỉ có tác dụng đẩy bạn vào 1 cuộc chiếc không cân sức với những ông lớn trong lĩnh vưc của bạn, một cuộc cạnh tranh mà bạn khó có khả năng chiến thắng. Tài liệu SEO căn bản Phạm Duy Anh duyanhphamkiller@gmail.com Page 77 Hãy cố gắng chia đều sức mạng quảng bá của website, để những trang con trong website gánh bớt 1 phần trách nhiệm về traffic cho website của bạn. Sức mạnh phải được kết hợp từ tông thể website chứ không phải tập trung hết cả và home page. Trang chủ là trang đầu tiên của direct traffic nhưng nó không phải là trang đâu tiên của referring traffic và search engine traffic. tham khảo trên trang làm SEO thì ở 2 bài viết khác nhau thì description và keywords khác nhau và liên quan đến bài viết đó
File đính kèm:
- tai_lieu_tong_hop_cac_bai_viet_seo.pdf