Tài liệu tổng hợp các bài viết SEO

Bên trong việc tìm kiếm

Với quy mô của Web, với số lượng quá lớn các trang không được truy cập đến trong nhiều năm và trang

có chứa những từ quá phổ biến dẫn đến những site không liên quan, việc lập chỉ mục dù chỉ một phần

của Web để có thể trả về kết quả phù hợp là một quá trình đòi hỏi rất nhiều công sức to lớn.

Tuy nhiên, về căn bản, công việc này rất đơn giản: chương trình phần mềm thông minh sẽ “chu du”

khắp trên Web, tìm kiếm và lưu trữ bất cứ thông tin nào chưa có trong chỉ mục và thường là lưu toàn bộ

trang Web. Thông tin thu thập được có thể từ những trang đã được lập chỉ mục trước đó nhưng đã thay

đổi, liên kết đến những trang chưa được lập chỉ mục và các địa chỉ Web do các công ty thứ ba đưa lên.

Một khi các chỉ mục đã được tập hợp lại, chúng sẽ được kiểm tra để loại bỏ những thông tin trùng lắp,

chẳng hạn như các phiên bản khác nhau của cùng một site (site dự phòng); loại bỏ những trang lập lại

quá nhiều lần cùng từ khoá. Một số search engine còn có khả năng gán trạng thái đặc biệt cho trang

Web có dùng siêu thẻ (metatag) chứa các thành phần mô tả thông tin. Một số search engine có khả

năng phân tích nội dung trang Web và cho biết tần suất mà những trang khác liên kết đến trang này.

Như vậy, trang Web càng phổ biến thì nội dung của nó càng dễ tìm kiếm.

Khi người dùng đưa yêu cầu tìm kiếm thông tin cho search engine hay dịch vụ thư mục, các giải thuật

tinh vi bên trong sẽ được kích hoạt. Mỗi search engine có một cách xử lý khác nhau đối với thông tin mà

nó nhận được từ người dùng, nhưng mục tiêu thì giống nhau: dự đoán người dùng cần gì và trả về

thông tin tương ứng. Những vấn tin của người dùng thường được phân tích rất chi tiết để phát hiện

những sai sót chính tả trong từ khoá hay liệu thông tin này đã được tìm kiếm chưa.

77 trang kimcuc 15160

Download

Bạn đang xem 20 trang mẫu của tài liệu "Tài liệu tổng hợp các bài viết SEO", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tài liệu tổng hợp các bài viết SEO

Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 1
Tài liệu tổng hợp các bài viết
SEO- Search Engine Optimization
(căn bản)
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 2
Contents
I. TỔNG QUAN VỀ SEO ............................................................................................................................. 4
1.1 Search Engine là gì? ........................................................................................................................... 4
1.2 Search Engine làm việc như thế nào? ................................................................................................. 6
1.3 SEO là gì? ........................................................................................................................................ 10
1.4 Kết quả tự nhiên và kết quả được tài trợ (Google SEO và Google Adwords) .................................... 10
1.5 Mục đích của các Search Engine Optimization ................................................................................. 13
1.6 SEO là nghệ thuật hay khoa học ? .................................................................................................... 13
II. CÁC SEARCH ENGINE XẾP HẠNG CÁC TRANG WEB NHƯ THẾ NÀO?.................................................. 15
III QUY TRÌNH THỰC HIỆN 1 CHIẾN DỊCH SEO ..................................................................................... 17
3.1 Nghiên cứu & xác định từ khóa......................................................................................................... 18
3.2 Tối ưu hóa trong trang .................................................................................................................... 19
3.3 Tối ưu hóa ngoài trang ..................................................................................................................... 20
3.4 Theo dõi thứ hạng ............................................................................................................................ 21
IV. NGHIÊN CỨU & XÁC ĐỊNH TỪ KHÓA ................................................................................................ 21
4.1 Thực tế quá trình chọn keyword cho 1 Website ................................................................................ 21
4.2 Nghiên cứu từ khóa .......................................................................................................................... 23
4.2.1 Nghiên cứu từ khóa mục tiêu trước khi SEO .................................................................................. 23
4.2.2 Bốn bước nghiên cứu từ khóa thiết kế web ................................................................................... 25
4.3 Sử dụng các công cụ nghiên cứu từ khóa ......................................................................................... 27
4.3.1 Công cụ gợi ý từ khóa trong seo .................................................................................................... 27
4.3.2 10 công cụ nghiên cứu từ khóa miễn phí hay nhất ...................................................................... 28
4.3.4 công cụ keyword của google.......................................................................................................... 31
4.3.5 Tối ưu keyword cho seo tốt hơn ................................................................................................... 39
V. TỐI ƯU HÓA TRONG TRANG (ON-PAGE OPTIMIZATION) .................................................................. 41
5.1 Tối ưu snippets với thẻ meta description .......................................................................................... 41
5.2 tối ưu hóa thẻ meta descriptions .............................................................................................. 43
5.3 TỐI ƯU CÁC THÀNH PHẦN CỦA HTML .............................................................................................. 45
5.3.1 tối ưu metal Title ........................................................................................................................... 45
5.3.2 Tối ưu hóa thẻ Alt và Title Image cho hình ảnh ............................................................................. 45
5.3.3 nội dung trong phần body ............................................................................................................. 47
5.3.4 Sử dụng thật tốt các thẻ : H1 ,H2 , H3 ,P, LI ................................................................................. 47
5.3.5 Nội dung trong liên kết .................................................................................................................. 47
5.3.5 Tối ưu hóa cấu trúc URL trở nên thân thiện với công cụ tìm kiếm ................................................. 47
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 3
5.4 TỐI ƯU BỐ CỤC CỦA TRANG ............................................................................................................ 49
5.5 TỐI ƯU NAVIGATOR & MENU ........................................................................................................... 52
5.6 CSS & SEO ........................................................................................................................................ 53
5.7 TRÙNG LẶP NỘI DUNG- NỘI DUNG KÉP ........................................................................................... 60
5.7.1 Nội dung kép và phương pháp phát hiện mới của Google .............................................................. 60
5.7.2 cách tránh lỗi Trùng lặp nội dung (Duplicate Content) ................................................................... 62
5.8 SEO & VỊ TRÍ ĐỊA LÝ ........................................................................................................................ 63
5.8 CÁC VẤN ĐỀ LIÊN QUAN ĐẾN KHẢ NĂNG LẬP CHỈ MỤC................................................................... 66
5.8.1 Đạt nhiều chỉ mục từ Google (Google Index) ................................................................................. 66
5.8.2 Làm thế nào để tạo google sitemap cho website của bạn ............................................................. 67
5.8.3 cách làm sitemap cho yahoo .......................................................................................................... 69
5.8.4 - 7 bước làm tăng tốc độ index webiste của Google ...................................................................... 70
5.8.5 Để Google index các videos của bạn? ............................................................................................ 71
5.8.6 Các cách ngăn không cho google index một số trang trên website ................................................ 71
5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm ................................................................................. 72
5.19 Robots.txt & Googlebot - Allow & Disallow ...................................................................................... 74
5.19 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở trang chủ .................................... 76
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 4
I. TỔNG QUAN VỀ SEO
1.1 Search Engine là gì?
Search engine phần mềm cung cấp các địa chỉ Web có chứa một hay nhiều thông tin, từ khoá mà
người dùng cần tìm kiếm. Thuật ngữ search engine đôi lúc được dùng không chính xác để chỉ các chỉ
mục Web do các biên tập viên biên soạn.
Web crawler còn được gọi là spider (con nhện) là một phần của search engine, chuyên “chu du” khắp
Web, sao chép từng trang nó tìm được và lập chỉ mục các từ khóa, tên trang.
Hãy thử tưởng tượng một cuộc sống hoàn toàn không có niên giám điện thoại hay một trợ giúp nào
khác. Sử dụng điện thoại lúc đó sẽ trở nên rất khó khăn. Điều này cũng tương tự như dùng Web mà
không có công cụ tìm kiếm (search engine). Với search engine, bạn chỉ cần biết một vài thông tin hay từ
khoá là có thể tìm được nơi cần đến.
Theo một nghiên cứu do công ty Zona Research (Mỹ) tiến hành năm 1999 thì search engine hiện là
phương thức tìm kiếm thông tin trên Web được sử dụng nhiều nhất, nó chiếm tới 77% tổng thời gian
tìm kiếm. Theo kết quả khảo sát người tiêu dùng của một công ty khác vào năm 1999 thì 88% người
dùng trực tuyến có sử dụng một search engine và 72% có dùng một search engine để tìm kiếm hàng
hoá bán lẻ.
Đối với nhiều người dùng, search engine là yếu tố định hình nên bức tranh về kho thông tin trên Web.
Tuy nhiên, một nghiên cứu gần đây của NEC Research Institute và Inktomy cho thấy có tới hơn một tỷ
trang Web riêng biệt trên Internet và hầu hết các search engine đã bỏ qua không lập chỉ mục cho 1/4
số trang này. Mặt khác, khoảng 7-14% những nội dung đã được lập chỉ mục lại không còn tồn tại trên
Net.
Bên trong việc tìm kiếm
Với quy mô của Web, với số lượng quá lớn các trang không được truy cập đến trong nhiều năm và trang
có chứa những từ quá phổ biến dẫn đến những site không liên quan, việc lập chỉ mục dù chỉ một phần
của Web để có thể trả về kết quả phù hợp là một quá trình đòi hỏi rất nhiều công sức to lớn.
Tuy nhiên, về căn bản, công việc này rất đơn giản: chương trình phần mềm thông minh sẽ “chu du”
khắp trên Web, tìm kiếm và lưu trữ bất cứ thông tin nào chưa có trong chỉ mục và thường là lưu toàn bộ
trang Web. Thông tin thu thập được có thể từ những trang đã được lập chỉ mục trước đó nhưng đã thay
đổi, liên kết đến những trang chưa được lập chỉ mục và các địa chỉ Web do các công ty thứ ba đưa lên.
Một khi các chỉ mục đã được tập hợp lại, chúng sẽ được kiểm tra để loại bỏ những thông tin trùng lắp,
chẳng hạn như các phiên bản khác nhau của cùng một site (site dự phòng); loại bỏ những trang lập lại
quá nhiều lần cùng từ khoá. Một số search engine còn có khả năng gán trạng thái đặc biệt cho trang
Web có dùng siêu thẻ (metatag) chứa các thành phần mô tả thông tin. Một số search engine có khả
năng phân tích nội dung trang Web và cho biết tần suất mà những trang khác liên kết đến trang này.
Như vậy, trang Web càng phổ biến thì nội dung của nó càng dễ tìm kiếm.
Khi người dùng đưa yêu cầu tìm kiếm thông tin cho search engine hay dịch vụ thư mục, các giải thuật
tinh vi bên trong sẽ được kích hoạt. Mỗi search engine có một cách xử lý khác nhau đối với thông tin mà
nó nhận được từ người dùng, nhưng mục tiêu thì giống nhau: dự đoán người dùng cần gì và trả về
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 5
thông tin tương ứng. Những vấn tin của người dùng thường được phân tích rất chi tiết để phát hiện
những sai sót chính tả trong từ khoá hay liệu thông tin này đã được tìm kiếm chưa.
Nguyên lý hoạt động
Một Search Engine hoạt động theo các bước sau:
Web crawling
Indexing
Searhing
Search Engine làm việc bằng cách lưu trữ thông tin về nhiều trang Web trên WWW. Những thông tin
này sẽ được thu thập bởi các Spider (chính là Web crawling) và nội dung của mỗi trang sẽ được phân
tích để SE quyết định nên index cái nào (ví dụ, những từ khoá được thu thập từ các titles, heading hay
một số trường đặc biệt gọi là meta tags) để trả về những thông tin mà người tìm kiếm mong muốn
nhất. Dữ liệu về những trang Web sẽ được lưu trữ tại các cơ sở dữ liệu chỉ mục để sử dụng cho những
lần truy vấn sau. Một số Search Engine, như Google chẳng hạn, sẽ lưu trữ toàn bộ hay một phần trang
gốc (được xem như một cache) cũng như thông tin về trang Web đó, trái lại với một số SE khác, như
AltaVista, sẽ lữu trữ tất cả các từ của những trang mà nó tìm thấy.
Khi người dùng nhập vào các Search Engine một truy vấn (chủ yếu là các keyword), các SE này sẽ kiểm
các index của nó và cung cấp danh sách các trang Web phù hợp nhất, thường là các cụm từ ngắn hay
một phần của một đoạn văn bản. Hầu hết các Search Engine đều sử dụng các Boolean
Operators (toán tử luận lý) như AND, OR và NOT để xác định các search query (truy vấn tìm
kiếm). Một số SE khác lại sử dụng những phương pháp tiên tiến hơn như Proximity Search
(tìm kiếm gần kề) để cho phép người dùng xác định được khoảng cách giữa các từ khoá.
Dịch vụ thư mục
Các dịch vụ thư mục như của Yahoo và hỏi-đáp như của Ask Jeeves không dùng phần mềm thu thập tự
động thông tin Web. Thay vào đó, các biên tập viên sẽ thực hiện việc tổng hợp thư mục Web một cách
thủ công. Mặc dù Yahoo không lập chỉ mục trang Web như cách của search engine nhưng nó thực sự
cung cấp dữ liệu chất lượng cao. Tuy nhiên, với mức tăng trưởng hàng năm 70% tổng số trang Web từ
nay đến 2003 theo như dự báo của International Data Corp. thì những dịch vụ thư mục kiểu này sẽ phải
gia tăng liên tục số lượng biên tập viên để có thể duy trì được tính hữu dụng của dịch vụ.
Một loại search engine lai mới đang xuất hiện, sử dụng phương pháp phân tích ngôn ngữ để xác định
dịch vụ thư mục, search engine hay cơ sở dữ liệu sẽ đáp ứng tốt nhất cho yêu cầu tìm kiếm thông tin
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 6
của người dùng. Ví dụ, vấn tin “dân số Việt Nam” sẽ trả về thông tin điều tra dân số của Việt Nam, liên
kết đến các Web site, thư mục và các thông tin có liên quan.
Tương lai của việc tìm kiếm
Một số search engine đã có tính năng tìm kiếm các đối tượng thay vì văn bản – chẳng hạn ảnh của một
“ngôi sao” nào đó ở dạng JPEG. Tuy nhiên, còn rất nhiều nội dung multimedia như hình ảnh động của
Shockware, Flash và dạng âm thanh, hình ảnh liên tục, hiện thời chưa thể lập chỉ mục được.
XML là một ngôn ngữ mô tả nội dung, không chỉ có khả năng chuyển tải thông tin mà còn có các thẻ
định danh để mô tả thông tin này có ý nghĩa gì. Search engine có thể lập chỉ mục trang Web XML dễ
dàng hơn nhờ những thẻ này cho biết thông tin tương ứng xuất hiện ở đâu trên trang. Ví dụ, thẻ định
danh “125” báo cho search engine biết rằng 125 là giá. Điều này cho phép search engine so sánh giá
của nhiều nhà bán lẻ khác nhau một cách dễ dàng và nhanh chóng.
1.2 Search Engine làm việc như thế nào?
Internet và World Wide Web có đến hàng trăm triệu website có sẵn mang các thông tin về nhiều chủ đề
khác nhau. Tuy nhiên hầu hết chúng đều được đặt tiêu đề theo ý thích của tác giả, và được đặt trên
máy chủ với các tên khó hiểu. Khi bạn cần biết về một chủ đề nào thì sẽ phải đọc các trang nào? Phần
lớn mọi người khi băn khoăn về vấn đề này họ sẽ sử dụng một công cụ tìm kiếm trên Internet (Internet
search engine).
Search engine trên Internet là các site đặc biệt trên web, được thiết kế để giúp mọi người tìm kiếm
thông tin được lưu trên các site khác nhau. Có nhiều cách khác nhau trong cách tìm kiếm này, nhưng
tất cả chúng đều thực hiện ba nhiệm vụ cơ bản:
Tìm kiếm Internet – hoặc chọn các mẩu thông tin trên Internet – dựa trên các từ quan trọng
Giữ một chỉ mục cho các từ tìm thấy cùng với địa chỉ tìm thấy chúng
Cho phép người dùng tìm kiếm các từ hoặc cụm từ được tìm kiếm trong chỉ mục đó.
Các cỗ máy tìm kiếm trước kia đều giữ chỉ mục của hàng trăm ngàn trang web và tài liệu, chúng thường
nhận có thể một hoặc hai nghìn yêu cầu tìm kiếm mỗi ngày. Ngày nay, cỗ máy tìm kiếm hàng đầu đánh
chỉ mục hàng trăm triệu trang và đáp trả đến hàng chục tri ... ít.
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 71
Với việc bạn làm theo các bước này bạn sẽ thấy rằng site của bạn sẽ rất nhanh chóng được phổ biến
rộng rải. Mình không chắc chắn trong 24h bạn sẽ thành công, nhưng điều đó là có thể. Cách làm này
chắc chắn sẽ rút ngắn thời gian index site từ vài tuần xuống chỉ còn vài ngày.
5.8.5 Để Google index các videos của bạn?
Cách đơn giản và hữu hiệu nhất để Google chú ý tới các videos trên website là tạo ra và maintain Video
Sitemap. Video Sitemap sẽ cung cấp cho Google những thông tin thiết yếu về videos của bạn, bao gồm
cả URL của trang để có thể tìm thấy videos, titles của videos, keywords, hình ảnh thumbnail, độ dài và
những thông tin khác. Sitemaps cũng cho phép xác định khoảng thời gian mỗi video có hiệu lực. điều
này vô cùng quan trọng đối với những nội dung có khoảng thời gian xem nhất định. Khi chúng hết hiệu
lực, chúng ta có thể gỡ chúng xuống.
Một khi Sitemap được tạo, bạn có thể đang ký URL của Sitemap file ở Google Webmaster Tools hoặc
qua file robots.txt của bạn.
Khi một video được index, nó sẽ xuất hiện trong kết quả tìm kiếm của web mà chúng ta gọi là Video
Onebox (một dạng videos có liên quan tới những chủ đề được tìm kiếm) và trong kết quả tìm kiếm
videos, Google Video. Kết quả tìm kiếm video sẽ ngay lập tức được xác định bởi hình ảnh, độ dài và
miêu tả.
Sau đây là một ví dụ cho kết quả tìm kiếm Video từ CNN.com từ Google.
Chúng tôi khuyến khích việc đăng ký Video Sitemaps và luôn cập nhật những thông tin mới nhất. Hãy
vào Video Sitemap được cập nhật gần đây nhất của chúng tôi (Help Center) và tận dụng diễn đàn hỗ trợ
Sitemap. Nếu như bạn đăng ký file Video Sitemap qua Webmaster Tools và bạn cũng có thể chia sẻ kinh
nghiệm hay những khó khăn của bạn tại đây
5.8.6 Các cách ngăn không cho google index một số trang trên website
Đôi khi mọi webmaster cố gắng tìm mọi cách đề webstie của họ được index nhanh nhất và nhiều nhất.
Nhưng cũng có nhiều khi họ lại không muốn Google và các search engine index một số trang trong
website của họ. Vậy trong trường hợp này có cách nào để ngăn chặn không cho Google để mắt đến hay
không ? Câu trả lời là có, rất nhiều là đằng khác.
Ở bài viết này mình sẽ đề cử 3 trong số rất nhiều cách ngăn chặn Google bot crwaling webite của bạn.
Tất nhiên đây là nhưng cách đã được sử dụng thành công & hoàn toàn tuân thủ đúng các quy định của
Google dành cho webmaster.
1. Sử dụng tài khoản:
Cách hữu hiệu nhất là sử dụng tài khoản bao gồm username & password để khóa phần không muốn “bị”
index lại. Tất nhiên ở đây hơi phức tạp khi phải sử dụng hay cấu hình lại hệ thống, nhưng thât sự đây là
cách hiệu quả nhất có thể sử dụng.
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 72
2. Sử dụng nofollow meta header tag:
Cách thứ 2 cũng hiểu quả không kém so với cách sử dụng tại khoản đề khóa phần không muốn index
lại. Đó là sử dụng Nofollow Meta Header tag, việc này cũng khá đơn giản. Bạn chỉ cần soạn danh sách
các trang không muốn được index và gáng vào mỗi trang thêm 1 thẻ meta nữa là meta=nofollow, vậy là
song. Việc làm này sẽ giúp Google bỏ qua những trang này khi bắt đầu crawl webstie của bạn.
Tuy nhiên việc này cũng có thể không đem đến hiệu quả như móng muốn trong trường hợp bán sở hữu
quá nhiều trang mà không muốn Google index bất cứ trang nào, việc đó vừa gây khó khắn trong việc
viết bài vừa đem đến cho Google sự nghi ngại không đáng có. Thực ra bản chất của Google bot rất
muốn được index thông tin trên các website, để góp phần nâng cao chất lượng của kết quả tìm kiếm
cũng như khẳng định giá trị của Google, vì thế nên mới có việc nhiều ngày gần đây các bác làm báo bên
Mĩ đòi Google trả tiền mới cho index thông tin là vậy.
3. Sử dụng nofollow tag:
Cách thứ 3 là cách đơn giản và có lẽ phổ biến nhất hiện nay, đó là sử dụng nofolow tag ngay tại đường
link dẫn đến trang thông tin. Cách làm thì chắc không phải nói nhiều các bạn cũng biết chỉ cần thêm
rel=nofollow. Nhưng cần hiểu rõ bản chất của vấn đề 1 chút đề cho dễ làm việc. Phương pháp hoạt
động của Google index thông tin thông qua các đường link tồn tại trên các website, vì vậy khi mà một
đường link nào đó dẫn đến các trang chứa thông tin được khóa trước ngay từ đầu bằng thẻ
rel=nofollow thì Google Bot sẽ tự động không index những trang này. Xin nhắc lài là không index, chứ
thực ra thì Google cũng có nghía qua trang web cảu bạn rồi. Thẻ rel=nofolow ở đây được xem như một
khung của bằng gương, Google sẽ vẫn xem qua website của bạn thông qua tâm gương ấy, nhưng nó sẽ
không index website của bạn.
Trên là 3 cách theo đánh giá của mình là hiệu quả nhất, chắc chắn sẽ có nhiều cách khác tốt & đơn gian
hơn. Nếu bạn biết một trong số đó, hãy cũng chia sẽ nhé.
5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm
Tính khả dụng (usability) và thứ hạng của trang Web trên máy tìm kiếm. Cách tối ưu, quảng
bá trang Web.
Liệu các máy tìm kiếm, công vụ tìm kiếm có để ý đến tính khả dụng (usability) của trang Web ? Có sự
khác biệt nào giữa một trang dễ dàng duyệt với các trang khác không ? Bài viết này sẽ đề cập tới tính
khả dụng và thứ hạng của trang Web trên máy tìm kiếm.
Một bằng sáng chế của Yahoo đã chỉ ra rằng các máy tìm kiếm có tính đến khía cạnh thiết kế của trang
Web.Tài liệu này chứa rất nhiều chỉ số mà máy tìm kiếm sẽ dùng đến để xác định tính khả dụng của
trang Web.
Tính khả dụng nào quan trọng với máy tìm kiếm
Bằng sáng chế nói trên có trích một đoạn ngắn giải thích tại sao máy tìm kiếm lại tính đến tính khả dụng
của trang Web :
Việc tạo một trang Web dễ dàng và thoải mái khi sử dụng là rất quan trọng, điều này đặc biệt quan
trọng hơn đối với những trang Web muốn kiếm tiền.[...]
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 73
Nếu một trang nào đó không dễ dàng và thoải mái khi duyệt, thì khả năng kiếm tiền từ trang này sẽ bị
triệt tiêu rất nhiều. Một trong những chỉ số qui ước trang Web có dễ dàng và thoải mái hay không khi sử
dụng được gọi là “tính hỗn loạn” (clutter)
Trang Web với tính khả dụng tốt thường là những trang có tỉ lệ khoán chuyển1 cao hơn các trang “hỗn
loạn”. Ngoài ra các trang có tính khả dụng cao thì thường có chất lượng cao hơn các trang khác và các
máy tìm kiếm sẽ cố gắng hiển thị các trang có tính khả dụng cao trong trang kết của tìm kiếm.
Các nhân tố máy tìm kiếm xác định tính hỗn loạn
Bằng sáng chế của Yahoo cung cấp danh sách của 51 nhân tố trong trang Web cho phép phân tích để
định ra tính “hỗn loạn” của một trang Web :
1. Tổng số liên kết
2. Tổng số từ
3. Tổng số hình ảnh (không phải hình ảnh quảng cáo)
4. Vùng hình ảnh hiện thị trên màn hình (không phải hình ảnh quảng cáo)
5. Kích cỡ trang
6. Diện tích trang (tổng)
7. Chiều dài trang
8. Tổng số bảng
9. Số bảng cột tối đa (của từng bảng)
10. Số bảng dòng tối đa (của từng bảng)
11. Tổng số cột
12. Tổng số dòng
13. Tổng số ô
14. Trung bình khoảng cách ngoài (từng bảng)
15. Trung bình khoảng cách trong (từng bảng)
16. Kích cỡ phần quan sát được trên màn hình
17. Vùng quan sát được trên màn hình
18. Vị trí trung tâm của trọng tâm so với giữa trang
19. Tổng số kích cỡ font dùng cho liên kết
20. Tổng số kích cỡ font dùng cho tiêu đề
21. Tổng số kích cỡ font dùng cho phần văn bản
22. Tổng số kích cỡ font
23. Dàn trang đẹp
24. Tổng số mã màu (trừ quảng cáo)
25. Căn lề các thành phần của trang
26. Đọ sáng của trang
27. Chiều ngang cố định và tương đối của trang
28. Trọng lượng trang (thời gian tải trang)
29. Tổng số quảng cáo
30. Diện tích tổng của các quảng cáo
31. Diện tích của từng quảng cáo đơn
32. Diện tích của quảng cáo kích thước lớn nhất trước tầm quan sát
33. Diện tích quảng cáo lớn nhất
34. Tông diện tích các quảng cáo lớn nhất nằm trên tầm quan sát trang
35. Khoảng cách từ quảng cáo tới nội dung trang
36. Tổng số quảng cáo bên ngoài nằm trên tầm nhìn của trang
37. Tổng số quảng cáo bên ngoài nằm dưới tầm nhìn của trang
38. Tổng số quảng cáo bên ngoài
39. Tổng số quảng cáo bên trong nằm trên tầm nhìn của trang
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 74
40. Tổng số quảng cáo bên trong nằm dưới tầm nhìn của trang
41. Tổng số quảng cáo bên trong
42. Tổng số liên kết quảng cáo tài trợ nằm trên tầm quan sát
43. Tổng số liên kết quảng cáo tài trợ nằm dưới tầm quan sát
44. Tổng số liên kết quảng cáo tài trợ
45. Tổng số hình ảnh quảng cáo nằm trên tầm quan sát
46. Tổng số hình ảnh quảng cáo nằm dưới tầm quan sát
47. Tổng số hình ảnh quảng cáo
48. Tổng số quảng cáo dạng chữ nằm trên tầm quan sát
49. Tổng số quảng cáo dạng chữ nằm dưới tầm quan sát
50. Tổng số quảng cáo dạng chữ
51. Vị trí quảng cáo trên trang
Theo bằng sáng chế này thì Yahoo sẽ tính đến sự có mặt của các hình động và các ảnh flash quảng cáo
cũng như độ sáng trung bình của các quảng cáo này.
Tối ưu trang Web của bạn
Một trang Web với tính khả dụng cao sẽ cải thiện đáng kể tỉ lệ khoán chuyển trên trang. Nếu trang Web
của bạn có rất nhiều khách ghé thăm nhưng lại chỉ bán được rất ít hay rất ít tác vụ mong muốn được
thực thi thì bạn chắc chắn là trang Web đó rất “hỗn loạn” và bạn phải cải thiện tính khả dụng trang Web
đó.
Google cũng đã có một bằng sáng chế tương tự với cái tên “phát hiện và loại bỏ các tài liệu gây phiền
hà”. Qua đó, các trang Web được thiết kế tốt sẽ được đánh giá cao hơn và đương nhiên là có thứ hạng
cao hơn.
Bởi vậy mã nguồn HTML trang web của bạn phải gây được ấn tượng tốt cho các công cụ tìm kiếm. Nếu
chúng không thấy nội dung hợp lý thì những trang này không thể có thứ hạng cao trên các máy tìm
kiếm.
5.10 Robots.txt & Googlebot - Allow & Disallow
Khả năng tìm kiếm của các spider là rất lơn, chúng có thể lùng xục khắp nơi trên website của bạn. Với
bài viết này chúng ta sẻ cũng tìm hiểm cách thức sử dụng file robots.txt để quy định các spider, đặc biệt
là googlebot.
Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web
Các User Agent của Google
Google có vài user-agent chính. Bạn có thể ngăn chúng bằng cách thêm tên của bọ tìm kiếm tương ứng
và trong dòng User-agent tương ứng trong bảng ghi robots.txt. Nếu bạn chặn Googlebot thì có nghĩa là
bạn chặn tất cả các bọ tìm kiếm với từ khóa “Googlebot”.
Googlebot: Đánh chỉ số từ các chỉ mục cũ và mới của Google.
Googlebot-Mobile: Đánh chỉ số cho các thiết bị cầm tay hoặc di động.
Googlebot-Image: Đánh chỉ số các tệp tin ảnh.
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 75
Mediapartners-Google: Xuất hiện trong các trang dăng quảng cáo của Google Adsense.
Adsbot-Google: Đánh chỉ số các trang được nhà quảng cáo sử dụng giới thiệu sản phẩm hay dịch vụ
thông qua Google Adwords. Nó cho phép đánh giá chất lượng của trang dùng dịch vụ Adwords.
Chặn Googlebot
Để chặn toàn bộ Googlebot thì bạn thêm cú pháp sau vào file robots loại trừ :
User-agent: Googlebot
Disallow: /
Cho phép Googlebot
Trong trường hợp bạn muốn chặn tất cả các bọ tìm kiếm khác trừ một robot, Googlebot chẳng hạn, thì
bạn có thể sử dụng cú pháp sau. Tuy nhiên nếu bạn không muốn trang liên quan biến mất khỏi kết quả
tìm kiếm của các máy tìm kiếm như Yahoo, MSN Live hay Ask thì bạn không nên làm như thế.
User-agent: *
Disallow: /
User-agent: Googlebot
Disallow:
Cho phép mở rộng
Google hỗ trợ cú pháp mở rộng “Allow” trong tệp tin robots.txt. Có nhiều máy tìm kiếm không hỗ trợ
phần mở rộng này, vì thế bạn nên tham khảo kỹ. Dòng lệnh “Allow” hoạt động cũng giống như
“Disallow” chỉ khác là nó liệt kê các thư mục hay trang bạn cho phép đánh chỉ số.
Bạn có thể sử dụng đồng thời “Allow” và “Disallow” cùng nhau. Chẳng hạn để cấm tất cả các trang
trong một thư mục “seotips” chẳng hạn, trừ tệp tin “toi-uu-hoa.html”, bạn hãy làm như sau :
User-agent: Googlebot
Disallow: /seotips/
Allow: /seotips/toi-uu-hoa.html
Còn trong trường hợp bạn muốn chặn Googlebot và sau đó lại vẫn muốn cho các bot khác của Google
(Googlebot-Mobile) chẳng hạn, bạn có thể sử dụng lệnh Allow như sau :
User-agent: Googlebot
Disallow: /
User-agent: Googlebot-Mobile
Allow: /
Sử dụng mẫu tổ hợp
Đặc biệt hữu ích trong trường hợp bạn không muốn phải liệt kê tất cả các trang mà bạn muốn chặn.
Đây là phần đuôi mở rộng mà GoogleBot hỗ trợ. Chú ý là các máy tìm kiếm khác chưa chắc đã hỗ trợ
tính năng này.
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 76
Mẫu tổ hợp chuỗi các ký tự sử dụng dấu sao (*)
Bạn có thể sử dụng dấu sao (*) để liệt kê tổ hợp chuỗi các lkys tự. Ví dụ bạn có thể chặn một loạt các
thư mục con bắt đầu bằng chữ wp (ví dụ wp-admin, wp-content cho blog WordPress) như sau :
User-agent: Googlebot
Disallow: /wp*/
Để chặn tất cả đường dẫn URL mà chứa ký tự (?) chứa tham biến (trong ngôn ngữ PHP), bạn hãy làm
như sau :
User-agent: *
Disallow: /*?
Kiểm tra phần kết của chuỗi ký tự URL bằng $
Bạn cũng có thể sử dụng dấu dollard ($) để liệt kê các URL có phần kết tương ứng. Ví dụ để chặn tất cả
các đường dẫn URL kết thúc với pdf (phiên bản pdf trên website để tránh trùng nội dung chẳng hạn) :
User-agent: Googlebot
Disallow: /*.pdf$
Bạn cũng có thể sử dụng tổ hợp kết này với lệnh Allow. Ví dụ nếu như có dấu hỏi ? tương ứng với một
session ID, bạn có thể loại trừ chúng để tránh cho GoogleBot phải đánh chỉ số một nội dung trùng lặp.
Thế nhưng các URLs kết thúc bởi dấu hỏi ? lại là một phiên bản trang mà bạn muốn thêm vào. Trong
trường hợp này, hãy đặt tệp tin robots.txt của bạn như sau :
User-agent: *
Allow: /*?$
Disallow: /*?
Dòng lệnh Disallow:/ *? sẽ chặn tất cả các URL có chứa ký tự ? (Cụ thể là nó sẽ chặn tất cả các URL
bắt đầu bằng tên miền, tiếp theo các ký tự, tiếp theo là dấu hỏi ?, tiếp theo bởi bất kể ký tự nào khác)
Dòng lệnh Allow: /*?$ sẽ cho phép bất kể đường dẫn nào kết thúc bởi dấu hỏi ? (Cụ thể là với bất kể
URL nào bắt đầu bằng tên miên, theo bởi chuỗi ký tự, theo tiêp bởi dấu hỏi ?, không có ký tự nào nằm
sau dấu hỏi này).
5.11 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở
trang chủ
việc các bạn ra sức làm SEO, cố gắng nhồi nhét càng nhiều keyword càng tốt vào trang chủ của website
bạn đang là một thực tế thường thấy ở Việt Nam. Một số webmaster chỉ chú trọng làm SEO cho 1 trang
duy nhất mà quên rằng, chính những phần content, những trang nhỏ trong website mới chính là nguồn
thu về traffic chủ yếu cho webite của bạn. Nhưng việc làm này chỉ có tác dụng đẩy bạn vào 1 cuộc chiếc
không cân sức với những ông lớn trong lĩnh vưc của bạn, một cuộc cạnh tranh mà bạn khó có khả năng
chiến thắng.
Tài liệu SEO căn bản Phạm Duy Anh
[email protected] Page 77
Hãy cố gắng chia đều sức mạng quảng bá của website, để những trang con trong website gánh bớt 1
phần trách nhiệm về traffic cho website của bạn. Sức mạnh phải được kết hợp từ tông thể website chứ
không phải tập trung hết cả và home page. Trang chủ là trang đầu tiên của direct traffic nhưng nó
không phải là trang đâu tiên của referring traffic và search engine traffic.
tham khảo trên trang làm SEO thì ở 2 bài viết khác nhau thì description và keywords khác nhau và liên
quan đến bài viết đó

File đính kèm:

tai_lieu_tong_hop_cac_bai_viet_seo.pdf