Tài liệu tổng hợp các bài viết SEO

Bên trong việc tìm kiếm

Với quy mô của Web, với số lượng quá lớn các trang không được truy cập đến trong nhiều năm và trang

có chứa những từ quá phổ biến dẫn đến những site không liên quan, việc lập chỉ mục dù chỉ một phần

của Web để có thể trả về kết quả phù hợp là một quá trình đòi hỏi rất nhiều công sức to lớn.

Tuy nhiên, về căn bản, công việc này rất đơn giản: chương trình phần mềm thông minh sẽ “chu du”

khắp trên Web, tìm kiếm và lưu trữ bất cứ thông tin nào chưa có trong chỉ mục và thường là lưu toàn bộ

trang Web. Thông tin thu thập được có thể từ những trang đã được lập chỉ mục trước đó nhưng đã thay

đổi, liên kết đến những trang chưa được lập chỉ mục và các địa chỉ Web do các công ty thứ ba đưa lên.

Một khi các chỉ mục đã được tập hợp lại, chúng sẽ được kiểm tra để loại bỏ những thông tin trùng lắp,

chẳng hạn như các phiên bản khác nhau của cùng một site (site dự phòng); loại bỏ những trang lập lại

quá nhiều lần cùng từ khoá. Một số search engine còn có khả năng gán trạng thái đặc biệt cho trang

Web có dùng siêu thẻ (metatag) chứa các thành phần mô tả thông tin. Một số search engine có khả

năng phân tích nội dung trang Web và cho biết tần suất mà những trang khác liên kết đến trang này.

Như vậy, trang Web càng phổ biến thì nội dung của nó càng dễ tìm kiếm.

Khi người dùng đưa yêu cầu tìm kiếm thông tin cho search engine hay dịch vụ thư mục, các giải thuật

tinh vi bên trong sẽ được kích hoạt. Mỗi search engine có một cách xử lý khác nhau đối với thông tin mà

nó nhận được từ người dùng, nhưng mục tiêu thì giống nhau: dự đoán người dùng cần gì và trả về

thông tin tương ứng. Những vấn tin của người dùng thường được phân tích rất chi tiết để phát hiện

những sai sót chính tả trong từ khoá hay liệu thông tin này đã được tìm kiếm chưa.

pdf 77 trang kimcuc 3260
Bạn đang xem 20 trang mẫu của tài liệu "Tài liệu tổng hợp các bài viết SEO", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tài liệu tổng hợp các bài viết SEO

Tài liệu tổng hợp các bài viết SEO
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 1 
Tài liệu tổng hợp các bài viết 
SEO- Search Engine Optimization 
(căn bản) 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 2 
Contents 
I. TỔNG QUAN VỀ SEO ............................................................................................................................. 4 
1.1 Search Engine là gì? ........................................................................................................................... 4 
1.2 Search Engine làm việc như thế nào? ................................................................................................. 6 
1.3 SEO là gì? ........................................................................................................................................ 10 
1.4 Kết quả tự nhiên và kết quả được tài trợ (Google SEO và Google Adwords) .................................... 10 
1.5 Mục đích của các Search Engine Optimization ................................................................................. 13 
1.6 SEO là nghệ thuật hay khoa học ? .................................................................................................... 13 
II. CÁC SEARCH ENGINE XẾP HẠNG CÁC TRANG WEB NHƯ THẾ NÀO?.................................................. 15 
III QUY TRÌNH THỰC HIỆN 1 CHIẾN DỊCH SEO ..................................................................................... 17 
3.1 Nghiên cứu & xác định từ khóa......................................................................................................... 18 
3.2 Tối ưu hóa trong trang .................................................................................................................... 19 
3.3 Tối ưu hóa ngoài trang ..................................................................................................................... 20 
3.4 Theo dõi thứ hạng ............................................................................................................................ 21 
IV. NGHIÊN CỨU & XÁC ĐỊNH TỪ KHÓA ................................................................................................ 21 
4.1 Thực tế quá trình chọn keyword cho 1 Website ................................................................................ 21 
4.2 Nghiên cứu từ khóa .......................................................................................................................... 23 
4.2.1 Nghiên cứu từ khóa mục tiêu trước khi SEO .................................................................................. 23 
4.2.2 Bốn bước nghiên cứu từ khóa thiết kế web ................................................................................... 25 
4.3 Sử dụng các công cụ nghiên cứu từ khóa ......................................................................................... 27 
4.3.1 Công cụ gợi ý từ khóa trong seo .................................................................................................... 27 
4.3.2 10 công cụ nghiên cứu từ khóa miễn phí hay nhất ...................................................................... 28 
4.3.4 công cụ keyword của google.......................................................................................................... 31 
4.3.5 Tối ưu keyword cho seo tốt hơn ................................................................................................... 39 
V. TỐI ƯU HÓA TRONG TRANG (ON-PAGE OPTIMIZATION) .................................................................. 41 
5.1 Tối ưu snippets với thẻ meta description .......................................................................................... 41 
5.2 tối ưu hóa thẻ meta descriptions .............................................................................................. 43 
5.3 TỐI ƯU CÁC THÀNH PHẦN CỦA HTML .............................................................................................. 45 
5.3.1 tối ưu metal Title ........................................................................................................................... 45 
5.3.2 Tối ưu hóa thẻ Alt và Title Image cho hình ảnh ............................................................................. 45 
5.3.3 nội dung trong phần body ............................................................................................................. 47 
5.3.4 Sử dụng thật tốt các thẻ : H1 ,H2 , H3 ,P, LI ................................................................................. 47 
5.3.5 Nội dung trong liên kết .................................................................................................................. 47 
5.3.5 Tối ưu hóa cấu trúc URL trở nên thân thiện với công cụ tìm kiếm ................................................. 47 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 3 
5.4 TỐI ƯU BỐ CỤC CỦA TRANG ............................................................................................................ 49 
5.5 TỐI ƯU NAVIGATOR & MENU ........................................................................................................... 52 
5.6 CSS & SEO ........................................................................................................................................ 53 
5.7 TRÙNG LẶP NỘI DUNG- NỘI DUNG KÉP ........................................................................................... 60 
5.7.1 Nội dung kép và phương pháp phát hiện mới của Google .............................................................. 60 
5.7.2 cách tránh lỗi Trùng lặp nội dung (Duplicate Content) ................................................................... 62 
5.8 SEO & VỊ TRÍ ĐỊA LÝ ........................................................................................................................ 63 
5.8 CÁC VẤN ĐỀ LIÊN QUAN ĐẾN KHẢ NĂNG LẬP CHỈ MỤC................................................................... 66 
5.8.1 Đạt nhiều chỉ mục từ Google (Google Index) ................................................................................. 66 
5.8.2 Làm thế nào để tạo google sitemap cho website của bạn ............................................................. 67 
5.8.3 cách làm sitemap cho yahoo .......................................................................................................... 69 
5.8.4 - 7 bước làm tăng tốc độ index webiste của Google ...................................................................... 70 
5.8.5 Để Google index các videos của bạn? ............................................................................................ 71 
5.8.6 Các cách ngăn không cho google index một số trang trên website ................................................ 71 
5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm ................................................................................. 72 
5.19 Robots.txt & Googlebot - Allow & Disallow ...................................................................................... 74 
5.19 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở trang chủ .................................... 76 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 4 
I. TỔNG QUAN VỀ SEO 
1.1 Search Engine là gì? 
Search engine phần mềm cung cấp các địa chỉ Web có chứa một hay nhiều thông tin, từ khoá mà 
người dùng cần tìm kiếm. Thuật ngữ search engine đôi lúc được dùng không chính xác để chỉ các chỉ 
mục Web do các biên tập viên biên soạn. 
Web crawler còn được gọi là spider (con nhện) là một phần của search engine, chuyên “chu du” khắp 
Web, sao chép từng trang nó tìm được và lập chỉ mục các từ khóa, tên trang. 
Hãy thử tưởng tượng một cuộc sống hoàn toàn không có niên giám điện thoại hay một trợ giúp nào 
khác. Sử dụng điện thoại lúc đó sẽ trở nên rất khó khăn. Điều này cũng tương tự như dùng Web mà 
không có công cụ tìm kiếm (search engine). Với search engine, bạn chỉ cần biết một vài thông tin hay từ 
khoá là có thể tìm được nơi cần đến. 
Theo một nghiên cứu do công ty Zona Research (Mỹ) tiến hành năm 1999 thì search engine hiện là 
phương thức tìm kiếm thông tin trên Web được sử dụng nhiều nhất, nó chiếm tới 77% tổng thời gian 
tìm kiếm. Theo kết quả khảo sát người tiêu dùng của một công ty khác vào năm 1999 thì 88% người 
dùng trực tuyến có sử dụng một search engine và 72% có dùng một search engine để tìm kiếm hàng 
hoá bán lẻ. 
Đối với nhiều người dùng, search engine là yếu tố định hình nên bức tranh về kho thông tin trên Web. 
Tuy nhiên, một nghiên cứu gần đây của NEC Research Institute và Inktomy cho thấy có tới hơn một tỷ 
trang Web riêng biệt trên Internet và hầu hết các search engine đã bỏ qua không lập chỉ mục cho 1/4 
số trang này. Mặt khác, khoảng 7-14% những nội dung đã được lập chỉ mục lại không còn tồn tại trên 
Net. 
Bên trong việc tìm kiếm 
Với quy mô của Web, với số lượng quá lớn các trang không được truy cập đến trong nhiều năm và trang 
có chứa những từ quá phổ biến dẫn đến những site không liên quan, việc lập chỉ mục dù chỉ một phần 
của Web để có thể trả về kết quả phù hợp là một quá trình đòi hỏi rất nhiều công sức to lớn. 
Tuy nhiên, về căn bản, công việc này rất đơn giản: chương trình phần mềm thông minh sẽ “chu du” 
khắp trên Web, tìm kiếm và lưu trữ bất cứ thông tin nào chưa có trong chỉ mục và thường là lưu toàn bộ 
trang Web. Thông tin thu thập được có thể từ những trang đã được lập chỉ mục trước đó nhưng đã thay 
đổi, liên kết đến những trang chưa được lập chỉ mục và các địa chỉ Web do các công ty thứ ba đưa lên. 
Một khi các chỉ mục đã được tập hợp lại, chúng sẽ được kiểm tra để loại bỏ những thông tin trùng lắp, 
chẳng hạn như các phiên bản khác nhau của cùng một site (site dự phòng); loại bỏ những trang lập lại 
quá nhiều lần cùng từ khoá. Một số search engine còn có khả năng gán trạng thái đặc biệt cho trang 
Web có dùng siêu thẻ (metatag) chứa các thành phần mô tả thông tin. Một số search engine có khả 
năng phân tích nội dung trang Web và cho biết tần suất mà những trang khác liên kết đến trang này. 
Như vậy, trang Web càng phổ biến thì nội dung của nó càng dễ tìm kiếm. 
Khi người dùng đưa yêu cầu tìm kiếm thông tin cho search engine hay dịch vụ thư mục, các giải thuật 
tinh vi bên trong sẽ được kích hoạt. Mỗi search engine có một cách xử lý khác nhau đối với thông tin mà 
nó nhận được từ người dùng, nhưng mục tiêu thì giống nhau: dự đoán người dùng cần gì và trả về 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 5 
thông tin tương ứng. Những vấn tin của người dùng thường được phân tích rất chi tiết để phát hiện 
những sai sót chính tả trong từ khoá hay liệu thông tin này đã được tìm kiếm chưa. 
Nguyên lý hoạt động 
Một Search Engine hoạt động theo các bước sau: 
Web crawling 
Indexing 
Searhing 
Search Engine làm việc bằng cách lưu trữ thông tin về nhiều trang Web trên WWW. Những thông tin 
này sẽ được thu thập bởi các Spider (chính là Web crawling) và nội dung của mỗi trang sẽ được phân 
tích để SE quyết định nên index cái nào (ví dụ, những từ khoá được thu thập từ các titles, heading hay 
một số trường đặc biệt gọi là meta tags) để trả về những thông tin mà người tìm kiếm mong muốn 
nhất. Dữ liệu về những trang Web sẽ được lưu trữ tại các cơ sở dữ liệu chỉ mục để sử dụng cho những 
lần truy vấn sau. Một số Search Engine, như Google chẳng hạn, sẽ lưu trữ toàn bộ hay một phần trang 
gốc (được xem như một cache) cũng như thông tin về trang Web đó, trái lại với một số SE khác, như 
AltaVista, sẽ lữu trữ tất cả các từ của những trang mà nó tìm thấy. 
Khi người dùng nhập vào các Search Engine một truy vấn (chủ yếu là các keyword), các SE này sẽ kiểm 
các index của nó và cung cấp danh sách các trang Web phù hợp nhất, thường là các cụm từ ngắn hay 
một phần của một đoạn văn bản. Hầu hết các Search Engine đều sử dụng các Boolean 
Operators (toán tử luận lý) như AND, OR và NOT để xác định các search query (truy vấn tìm 
kiếm). Một số SE khác lại sử dụng những phương pháp tiên tiến hơn như Proximity Search 
(tìm kiếm gần kề) để cho phép người dùng xác định được khoảng cách giữa các từ khoá. 
Dịch vụ thư mục 
Các dịch vụ thư mục như của Yahoo và hỏi-đáp như của Ask Jeeves không dùng phần mềm thu thập tự 
động thông tin Web. Thay vào đó, các biên tập viên sẽ thực hiện việc tổng hợp thư mục Web một cách 
thủ công. Mặc dù Yahoo không lập chỉ mục trang Web như cách của search engine nhưng nó thực sự 
cung cấp dữ liệu chất lượng cao. Tuy nhiên, với mức tăng trưởng hàng năm 70% tổng số trang Web từ 
nay đến 2003 theo như dự báo của International Data Corp. thì những dịch vụ thư mục kiểu này sẽ phải 
gia tăng liên tục số lượng biên tập viên để có thể duy trì được tính hữu dụng của dịch vụ. 
Một loại search engine lai mới đang xuất hiện, sử dụng phương pháp phân tích ngôn ngữ để xác định 
dịch vụ thư mục, search engine hay cơ sở dữ liệu sẽ đáp ứng tốt nhất cho yêu cầu tìm kiếm thông tin 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 6 
của người dùng. Ví dụ, vấn tin “dân số Việt Nam” sẽ trả về thông tin điều tra dân số của Việt Nam, liên 
kết đến các Web site, thư mục và các thông tin có liên quan. 
Tương lai của việc tìm kiếm 
Một số search engine đã có tính năng tìm kiếm các đối tượng thay vì văn bản – chẳng hạn ảnh của một 
“ngôi sao” nào đó ở dạng JPEG. Tuy nhiên, còn rất nhiều nội dung multimedia như hình ảnh động của 
Shockware, Flash và dạng âm thanh, hình ảnh liên tục, hiện thời chưa thể lập chỉ mục được. 
XML là một ngôn ngữ mô tả nội dung, không chỉ có khả năng chuyển tải thông tin mà còn có các thẻ 
định danh để mô tả thông tin này có ý nghĩa gì. Search engine có thể lập chỉ mục trang Web XML dễ 
dàng hơn nhờ những thẻ này cho biết thông tin tương ứng xuất hiện ở đâu trên trang. Ví dụ, thẻ định 
danh “125” báo cho search engine biết rằng 125 là giá. Điều này cho phép search engine so sánh giá 
của nhiều nhà bán lẻ khác nhau một cách dễ dàng và nhanh chóng. 
1.2 Search Engine làm việc như thế nào? 
Internet và World Wide Web có đến hàng trăm triệu website có sẵn mang các thông tin về nhiều chủ đề 
khác nhau. Tuy nhiên hầu hết chúng đều được đặt tiêu đề theo ý thích của tác giả, và được đặt trên 
máy chủ với các tên khó hiểu. Khi bạn cần biết về một chủ đề nào thì sẽ phải đọc các trang nào? Phần 
lớn mọi người khi băn khoăn về vấn đề này họ sẽ sử dụng một công cụ tìm kiếm trên Internet (Internet 
search engine). 
Search engine trên Internet là các site đặc biệt trên web, được thiết kế để giúp mọi người tìm kiếm 
thông tin được lưu trên các site khác nhau. Có nhiều cách khác nhau trong cách tìm kiếm này, nhưng 
tất cả chúng đều thực hiện ba nhiệm vụ cơ bản: 
 Tìm kiếm Internet – hoặc chọn các mẩu thông tin trên Internet – dựa trên các từ quan trọng 
 Giữ một chỉ mục cho các từ tìm thấy cùng với địa chỉ tìm thấy chúng 
 Cho phép người dùng tìm kiếm các từ hoặc cụm từ được tìm kiếm trong chỉ mục đó. 
Các cỗ máy tìm kiếm trước kia đều giữ chỉ mục của hàng trăm ngàn trang web và tài liệu, chúng thường 
nhận có thể một hoặc hai nghìn yêu cầu tìm kiếm mỗi ngày. Ngày nay, cỗ máy tìm kiếm hàng đầu đánh 
chỉ mục hàng trăm triệu trang và đáp trả đến hàng chục tri ...  ít. 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 71 
Với việc bạn làm theo các bước này bạn sẽ thấy rằng site của bạn sẽ rất nhanh chóng được phổ biến 
rộng rải. Mình không chắc chắn trong 24h bạn sẽ thành công, nhưng điều đó là có thể. Cách làm này 
chắc chắn sẽ rút ngắn thời gian index site từ vài tuần xuống chỉ còn vài ngày. 
5.8.5 Để Google index các videos của bạn? 
Cách đơn giản và hữu hiệu nhất để Google chú ý tới các videos trên website là tạo ra và maintain Video 
Sitemap. Video Sitemap sẽ cung cấp cho Google những thông tin thiết yếu về videos của bạn, bao gồm 
cả URL của trang để có thể tìm thấy videos, titles của videos, keywords, hình ảnh thumbnail, độ dài và 
những thông tin khác. Sitemaps cũng cho phép xác định khoảng thời gian mỗi video có hiệu lực. điều 
này vô cùng quan trọng đối với những nội dung có khoảng thời gian xem nhất định. Khi chúng hết hiệu 
lực, chúng ta có thể gỡ chúng xuống. 
Một khi Sitemap được tạo, bạn có thể đang ký URL của Sitemap file ở Google Webmaster Tools hoặc 
qua file robots.txt của bạn. 
Khi một video được index, nó sẽ xuất hiện trong kết quả tìm kiếm của web mà chúng ta gọi là Video 
Onebox (một dạng videos có liên quan tới những chủ đề được tìm kiếm) và trong kết quả tìm kiếm 
videos, Google Video. Kết quả tìm kiếm video sẽ ngay lập tức được xác định bởi hình ảnh, độ dài và 
miêu tả. 
Sau đây là một ví dụ cho kết quả tìm kiếm Video từ CNN.com từ Google. 
Chúng tôi khuyến khích việc đăng ký Video Sitemaps và luôn cập nhật những thông tin mới nhất. Hãy 
vào Video Sitemap được cập nhật gần đây nhất của chúng tôi (Help Center) và tận dụng diễn đàn hỗ trợ 
Sitemap. Nếu như bạn đăng ký file Video Sitemap qua Webmaster Tools và bạn cũng có thể chia sẻ kinh 
nghiệm hay những khó khăn của bạn tại đây 
5.8.6 Các cách ngăn không cho google index một số trang trên website 
Đôi khi mọi webmaster cố gắng tìm mọi cách đề webstie của họ được index nhanh nhất và nhiều nhất. 
Nhưng cũng có nhiều khi họ lại không muốn Google và các search engine index một số trang trong 
website của họ. Vậy trong trường hợp này có cách nào để ngăn chặn không cho Google để mắt đến hay 
không ? Câu trả lời là có, rất nhiều là đằng khác. 
Ở bài viết này mình sẽ đề cử 3 trong số rất nhiều cách ngăn chặn Google bot crwaling webite của bạn. 
Tất nhiên đây là nhưng cách đã được sử dụng thành công & hoàn toàn tuân thủ đúng các quy định của 
Google dành cho webmaster. 
1. Sử dụng tài khoản: 
Cách hữu hiệu nhất là sử dụng tài khoản bao gồm username & password để khóa phần không muốn “bị” 
index lại. Tất nhiên ở đây hơi phức tạp khi phải sử dụng hay cấu hình lại hệ thống, nhưng thât sự đây là 
cách hiệu quả nhất có thể sử dụng. 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 72 
2. Sử dụng nofollow meta header tag: 
Cách thứ 2 cũng hiểu quả không kém so với cách sử dụng tại khoản đề khóa phần không muốn index 
lại. Đó là sử dụng Nofollow Meta Header tag, việc này cũng khá đơn giản. Bạn chỉ cần soạn danh sách 
các trang không muốn được index và gáng vào mỗi trang thêm 1 thẻ meta nữa là meta=nofollow, vậy là 
song. Việc làm này sẽ giúp Google bỏ qua những trang này khi bắt đầu crawl webstie của bạn. 
Tuy nhiên việc này cũng có thể không đem đến hiệu quả như móng muốn trong trường hợp bán sở hữu 
quá nhiều trang mà không muốn Google index bất cứ trang nào, việc đó vừa gây khó khắn trong việc 
viết bài vừa đem đến cho Google sự nghi ngại không đáng có. Thực ra bản chất của Google bot rất 
muốn được index thông tin trên các website, để góp phần nâng cao chất lượng của kết quả tìm kiếm 
cũng như khẳng định giá trị của Google, vì thế nên mới có việc nhiều ngày gần đây các bác làm báo bên 
Mĩ đòi Google trả tiền mới cho index thông tin là vậy. 
3. Sử dụng nofollow tag: 
Cách thứ 3 là cách đơn giản và có lẽ phổ biến nhất hiện nay, đó là sử dụng nofolow tag ngay tại đường 
link dẫn đến trang thông tin. Cách làm thì chắc không phải nói nhiều các bạn cũng biết chỉ cần thêm 
rel=nofollow. Nhưng cần hiểu rõ bản chất của vấn đề 1 chút đề cho dễ làm việc. Phương pháp hoạt 
động của Google index thông tin thông qua các đường link tồn tại trên các website, vì vậy khi mà một 
đường link nào đó dẫn đến các trang chứa thông tin được khóa trước ngay từ đầu bằng thẻ 
rel=nofollow thì Google Bot sẽ tự động không index những trang này. Xin nhắc lài là không index, chứ 
thực ra thì Google cũng có nghía qua trang web cảu bạn rồi. Thẻ rel=nofolow ở đây được xem như một 
khung của bằng gương, Google sẽ vẫn xem qua website của bạn thông qua tâm gương ấy, nhưng nó sẽ 
không index website của bạn. 
Trên là 3 cách theo đánh giá của mình là hiệu quả nhất, chắc chắn sẽ có nhiều cách khác tốt & đơn gian 
hơn. Nếu bạn biết một trong số đó, hãy cũng chia sẽ nhé. 
5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm 
Tính khả dụng (usability) và thứ hạng của trang Web trên máy tìm kiếm. Cách tối ưu, quảng 
bá trang Web. 
Liệu các máy tìm kiếm, công vụ tìm kiếm có để ý đến tính khả dụng (usability) của trang Web ? Có sự 
khác biệt nào giữa một trang dễ dàng duyệt với các trang khác không ? Bài viết này sẽ đề cập tới tính 
khả dụng và thứ hạng của trang Web trên máy tìm kiếm. 
Một bằng sáng chế của Yahoo đã chỉ ra rằng các máy tìm kiếm có tính đến khía cạnh thiết kế của trang 
Web.Tài liệu này chứa rất nhiều chỉ số mà máy tìm kiếm sẽ dùng đến để xác định tính khả dụng của 
trang Web. 
Tính khả dụng nào quan trọng với máy tìm kiếm 
Bằng sáng chế nói trên có trích một đoạn ngắn giải thích tại sao máy tìm kiếm lại tính đến tính khả dụng 
của trang Web : 
Việc tạo một trang Web dễ dàng và thoải mái khi sử dụng là rất quan trọng, điều này đặc biệt quan 
trọng hơn đối với những trang Web muốn kiếm tiền.[...] 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 73 
Nếu một trang nào đó không dễ dàng và thoải mái khi duyệt, thì khả năng kiếm tiền từ trang này sẽ bị 
triệt tiêu rất nhiều. Một trong những chỉ số qui ước trang Web có dễ dàng và thoải mái hay không khi sử 
dụng được gọi là “tính hỗn loạn” (clutter) 
Trang Web với tính khả dụng tốt thường là những trang có tỉ lệ khoán chuyển1 cao hơn các trang “hỗn 
loạn”. Ngoài ra các trang có tính khả dụng cao thì thường có chất lượng cao hơn các trang khác và các 
máy tìm kiếm sẽ cố gắng hiển thị các trang có tính khả dụng cao trong trang kết của tìm kiếm. 
Các nhân tố máy tìm kiếm xác định tính hỗn loạn 
Bằng sáng chế của Yahoo cung cấp danh sách của 51 nhân tố trong trang Web cho phép phân tích để 
định ra tính “hỗn loạn” của một trang Web : 
1. Tổng số liên kết 
2. Tổng số từ 
3. Tổng số hình ảnh (không phải hình ảnh quảng cáo) 
4. Vùng hình ảnh hiện thị trên màn hình (không phải hình ảnh quảng cáo) 
5. Kích cỡ trang 
6. Diện tích trang (tổng) 
7. Chiều dài trang 
8. Tổng số bảng 
9. Số bảng cột tối đa (của từng bảng) 
10. Số bảng dòng tối đa (của từng bảng) 
11. Tổng số cột 
12. Tổng số dòng 
13. Tổng số ô 
14. Trung bình khoảng cách ngoài (từng bảng) 
15. Trung bình khoảng cách trong (từng bảng) 
16. Kích cỡ phần quan sát được trên màn hình 
17. Vùng quan sát được trên màn hình 
18. Vị trí trung tâm của trọng tâm so với giữa trang 
19. Tổng số kích cỡ font dùng cho liên kết 
20. Tổng số kích cỡ font dùng cho tiêu đề 
21. Tổng số kích cỡ font dùng cho phần văn bản 
22. Tổng số kích cỡ font 
23. Dàn trang đẹp 
24. Tổng số mã màu (trừ quảng cáo) 
25. Căn lề các thành phần của trang 
26. Đọ sáng của trang 
27. Chiều ngang cố định và tương đối của trang 
28. Trọng lượng trang (thời gian tải trang) 
29. Tổng số quảng cáo 
30. Diện tích tổng của các quảng cáo 
31. Diện tích của từng quảng cáo đơn 
32. Diện tích của quảng cáo kích thước lớn nhất trước tầm quan sát 
33. Diện tích quảng cáo lớn nhất 
34. Tông diện tích các quảng cáo lớn nhất nằm trên tầm quan sát trang 
35. Khoảng cách từ quảng cáo tới nội dung trang 
36. Tổng số quảng cáo bên ngoài nằm trên tầm nhìn của trang 
37. Tổng số quảng cáo bên ngoài nằm dưới tầm nhìn của trang 
38. Tổng số quảng cáo bên ngoài 
39. Tổng số quảng cáo bên trong nằm trên tầm nhìn của trang 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 74 
40. Tổng số quảng cáo bên trong nằm dưới tầm nhìn của trang 
41. Tổng số quảng cáo bên trong 
42. Tổng số liên kết quảng cáo tài trợ nằm trên tầm quan sát 
43. Tổng số liên kết quảng cáo tài trợ nằm dưới tầm quan sát 
44. Tổng số liên kết quảng cáo tài trợ 
45. Tổng số hình ảnh quảng cáo nằm trên tầm quan sát 
46. Tổng số hình ảnh quảng cáo nằm dưới tầm quan sát 
47. Tổng số hình ảnh quảng cáo 
48. Tổng số quảng cáo dạng chữ nằm trên tầm quan sát 
49. Tổng số quảng cáo dạng chữ nằm dưới tầm quan sát 
50. Tổng số quảng cáo dạng chữ 
51. Vị trí quảng cáo trên trang 
Theo bằng sáng chế này thì Yahoo sẽ tính đến sự có mặt của các hình động và các ảnh flash quảng cáo 
cũng như độ sáng trung bình của các quảng cáo này. 
Tối ưu trang Web của bạn 
Một trang Web với tính khả dụng cao sẽ cải thiện đáng kể tỉ lệ khoán chuyển trên trang. Nếu trang Web 
của bạn có rất nhiều khách ghé thăm nhưng lại chỉ bán được rất ít hay rất ít tác vụ mong muốn được 
thực thi thì bạn chắc chắn là trang Web đó rất “hỗn loạn” và bạn phải cải thiện tính khả dụng trang Web 
đó. 
Google cũng đã có một bằng sáng chế tương tự với cái tên “phát hiện và loại bỏ các tài liệu gây phiền 
hà”. Qua đó, các trang Web được thiết kế tốt sẽ được đánh giá cao hơn và đương nhiên là có thứ hạng 
cao hơn. 
Bởi vậy mã nguồn HTML trang web của bạn phải gây được ấn tượng tốt cho các công cụ tìm kiếm. Nếu 
chúng không thấy nội dung hợp lý thì những trang này không thể có thứ hạng cao trên các máy tìm 
kiếm. 
5.10 Robots.txt & Googlebot - Allow & Disallow 
Khả năng tìm kiếm của các spider là rất lơn, chúng có thể lùng xục khắp nơi trên website của bạn. Với 
bài viết này chúng ta sẻ cũng tìm hiểm cách thức sử dụng file robots.txt để quy định các spider, đặc biệt 
là googlebot. 
 Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web 
Các User Agent của Google 
Google có vài user-agent chính. Bạn có thể ngăn chúng bằng cách thêm tên của bọ tìm kiếm tương ứng 
và trong dòng User-agent tương ứng trong bảng ghi robots.txt. Nếu bạn chặn Googlebot thì có nghĩa là 
bạn chặn tất cả các bọ tìm kiếm với từ khóa “Googlebot”. 
Googlebot: Đánh chỉ số từ các chỉ mục cũ và mới của Google. 
Googlebot-Mobile: Đánh chỉ số cho các thiết bị cầm tay hoặc di động. 
Googlebot-Image: Đánh chỉ số các tệp tin ảnh. 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 75 
Mediapartners-Google: Xuất hiện trong các trang dăng quảng cáo của Google Adsense. 
Adsbot-Google: Đánh chỉ số các trang được nhà quảng cáo sử dụng giới thiệu sản phẩm hay dịch vụ 
thông qua Google Adwords. Nó cho phép đánh giá chất lượng của trang dùng dịch vụ Adwords. 
Chặn Googlebot 
Để chặn toàn bộ Googlebot thì bạn thêm cú pháp sau vào file robots loại trừ : 
User-agent: Googlebot 
Disallow: / 
Cho phép Googlebot 
Trong trường hợp bạn muốn chặn tất cả các bọ tìm kiếm khác trừ một robot, Googlebot chẳng hạn, thì 
bạn có thể sử dụng cú pháp sau. Tuy nhiên nếu bạn không muốn trang liên quan biến mất khỏi kết quả 
tìm kiếm của các máy tìm kiếm như Yahoo, MSN Live hay Ask thì bạn không nên làm như thế. 
User-agent: * 
Disallow: / 
User-agent: Googlebot 
Disallow: 
Cho phép mở rộng 
Google hỗ trợ cú pháp mở rộng “Allow” trong tệp tin robots.txt. Có nhiều máy tìm kiếm không hỗ trợ 
phần mở rộng này, vì thế bạn nên tham khảo kỹ. Dòng lệnh “Allow” hoạt động cũng giống như 
“Disallow” chỉ khác là nó liệt kê các thư mục hay trang bạn cho phép đánh chỉ số. 
Bạn có thể sử dụng đồng thời “Allow” và “Disallow” cùng nhau. Chẳng hạn để cấm tất cả các trang 
trong một thư mục “seotips” chẳng hạn, trừ tệp tin “toi-uu-hoa.html”, bạn hãy làm như sau : 
User-agent: Googlebot 
Disallow: /seotips/ 
Allow: /seotips/toi-uu-hoa.html 
Còn trong trường hợp bạn muốn chặn Googlebot và sau đó lại vẫn muốn cho các bot khác của Google 
(Googlebot-Mobile) chẳng hạn, bạn có thể sử dụng lệnh Allow như sau : 
User-agent: Googlebot 
Disallow: / 
User-agent: Googlebot-Mobile 
Allow: / 
Sử dụng mẫu tổ hợp 
Đặc biệt hữu ích trong trường hợp bạn không muốn phải liệt kê tất cả các trang mà bạn muốn chặn. 
Đây là phần đuôi mở rộng mà GoogleBot hỗ trợ. Chú ý là các máy tìm kiếm khác chưa chắc đã hỗ trợ 
tính năng này. 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 76 
Mẫu tổ hợp chuỗi các ký tự sử dụng dấu sao (*) 
Bạn có thể sử dụng dấu sao (*) để liệt kê tổ hợp chuỗi các lkys tự. Ví dụ bạn có thể chặn một loạt các 
thư mục con bắt đầu bằng chữ wp (ví dụ wp-admin, wp-content cho blog WordPress) như sau : 
User-agent: Googlebot 
Disallow: /wp*/ 
Để chặn tất cả đường dẫn URL mà chứa ký tự (?) chứa tham biến (trong ngôn ngữ PHP), bạn hãy làm 
như sau : 
User-agent: * 
Disallow: /*? 
Kiểm tra phần kết của chuỗi ký tự URL bằng $ 
Bạn cũng có thể sử dụng dấu dollard ($) để liệt kê các URL có phần kết tương ứng. Ví dụ để chặn tất cả 
các đường dẫn URL kết thúc với pdf (phiên bản pdf trên website để tránh trùng nội dung chẳng hạn) : 
User-agent: Googlebot 
Disallow: /*.pdf$ 
Bạn cũng có thể sử dụng tổ hợp kết này với lệnh Allow. Ví dụ nếu như có dấu hỏi ? tương ứng với một 
session ID, bạn có thể loại trừ chúng để tránh cho GoogleBot phải đánh chỉ số một nội dung trùng lặp. 
Thế nhưng các URLs kết thúc bởi dấu hỏi ? lại là một phiên bản trang mà bạn muốn thêm vào. Trong 
trường hợp này, hãy đặt tệp tin robots.txt của bạn như sau : 
User-agent: * 
Allow: /*?$ 
Disallow: /*? 
Dòng lệnh Disallow:/ *? sẽ chặn tất cả các URL có chứa ký tự ? (Cụ thể là nó sẽ chặn tất cả các URL 
bắt đầu bằng tên miền, tiếp theo các ký tự, tiếp theo là dấu hỏi ?, tiếp theo bởi bất kể ký tự nào khác) 
Dòng lệnh Allow: /*?$ sẽ cho phép bất kể đường dẫn nào kết thúc bởi dấu hỏi ? (Cụ thể là với bất kể 
URL nào bắt đầu bằng tên miên, theo bởi chuỗi ký tự, theo tiêp bởi dấu hỏi ?, không có ký tự nào nằm 
sau dấu hỏi này). 
5.11 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở 
trang chủ 
việc các bạn ra sức làm SEO, cố gắng nhồi nhét càng nhiều keyword càng tốt vào trang chủ của website 
bạn đang là một thực tế thường thấy ở Việt Nam. Một số webmaster chỉ chú trọng làm SEO cho 1 trang 
duy nhất mà quên rằng, chính những phần content, những trang nhỏ trong website mới chính là nguồn 
thu về traffic chủ yếu cho webite của bạn. Nhưng việc làm này chỉ có tác dụng đẩy bạn vào 1 cuộc chiếc 
không cân sức với những ông lớn trong lĩnh vưc của bạn, một cuộc cạnh tranh mà bạn khó có khả năng 
chiến thắng. 
Tài liệu SEO căn bản Phạm Duy Anh 
duyanhphamkiller@gmail.com Page 77 
Hãy cố gắng chia đều sức mạng quảng bá của website, để những trang con trong website gánh bớt 1 
phần trách nhiệm về traffic cho website của bạn. Sức mạnh phải được kết hợp từ tông thể website chứ 
không phải tập trung hết cả và home page. Trang chủ là trang đầu tiên của direct traffic nhưng nó 
không phải là trang đâu tiên của referring traffic và search engine traffic. 
tham khảo trên trang làm SEO thì ở 2 bài viết khác nhau thì description và keywords khác nhau và liên 
quan đến bài viết đó 

File đính kèm:

  • pdftai_lieu_tong_hop_cac_bai_viet_seo.pdf