SEARCH ENGINE – CỖ MÁY TÌM KIẾM
Search Engine là công cụ trên nền tảng giúp người dùng dễ dàng tiếp cận hơn với kho nội dung số đồ sộ trên mạng Internet, thông qua những từ khoá mà người dùng tìm kiếm, sau đó nhận lại bảng nhiều kết quả có liên quan tới chủ đề tìm kiếm đó.
Theo Wikipedia:“Công cụ tìm kiếm là một hệ thống phần mềm được thiết kế để tìm kiếm thông tin trên mạng World Wide Web. Kết quả tìm kiếm được trình bày dưới dạng các kết quả gọi là trang kết quả tìm kiếm (SERPs – Search Engine Report Page). Kết quả tìm kiếm có thể là sự kết hợp của các trang web, hình ảnh và các loại tệp khác.
Một số công cụ tìm kiếm cũng khai thác dữ liệu có sẵn trong CSDL hoặc thư mục mở. Không giống các thư mục web, chỉ được duy trì bởi quản trị viên, các công cụ tìm kiếm được duy trì theo thời gian thực bằng cách thực hiện các thuật toán thu thập thông tin web.”
Nhằm giảm thiểu tối đa thời gian cho người tìm kiếm, Search Engine hiện nay có 3 thành phần chính và được chạy theo thời gian thực bao gồm:
- Web Crawler (còn gọi là “Bot” hay “Spider”): Thành phần đầu tiên của Search Engine sẽ giúp cỗ máy tìm kiếm thu thập dữ liệu của tất cả các trang web, bao gồm tất cả các nội dung trên trang, tần suất lên kết của các trang web khác tới website này (hay còn gọi là backlink). Việc thu thập dữ liệu thông qua Bot sẽ được thực hiện liên tục và chỉ kết thúc khi tất cả dữ liệu đã được thu thập hết.
- Web Index (công cụ lập chỉ mục): Sau khi Web Crawler thu thập tất cả dữ liệu trên Internet về máy chủ Search Engine, việc tiếp theo Web Index sẽ lưu toàn bộ dữ liệu đã thu thập của từng trang web một cách khoa học và tối ưu nhất. Dữ liệu được mã hoá và lập chỉ mục trong cơ sở dữ liệu gốc của Search Engine. Khi phát sinh một truy vấn tìm kiếm trên máy chủ, Search Engine sẽ không phải tìm thông tin trên từng website mà chỉ việc sử dụng dữ liệu đã được lưu trong máy chủ sau đó trả về kết quả tìm kiếm cho người dùng sao cho phù hợp nhất. Như vậy, xét về bản chất, mỗi khi người dùng tìm kiếm thông tin trên mạng Internet, họ chỉ đang tìm kiếm thông tin trên những bản sao lưu website bất kỳ mà công cụ Search Engine đã lưu trước đó.
- Trang kết quả tìm kiếm (SERPs): Toàn bộ những gì công cụ tìm kiếm đã trích xuất từ máy chủ của họ, phù hợp với từ khoá tìm kiếm của người dùng sẽ được hiển thị ở đây, dưới dạng bảng kết quả trực quan, phục vụ nhu cầu của người dùng.
Search Engine đang là một mảnh đất màu mỡ trong thời kỳ bùng nổ Internet hiện nay, tuy số lượng công cụ tìm kiếm ngày càng phát triển, nhưng chất lượng của mỗi phần mềm tìm kiếm thì lại không giống nhau.
Theo báo cáo của Wikipedia cập nhật tháng 3 năm 2017, đứng đầu danh sách công cụ tìm kiếm được sử dụng nhiều nhất hiện nay là Google với 80.52% thị phần. Đứng sau là các công cụ như Bing (6.92%), Baidu (5.94%) và Yahoo (5.35%).
Tuy nhiên, ở một số khu vực nhất định thì Google không phải công cụ tìm kiếm lớn nhất. Tại Nga, Yandex chiếm thị phần 61,9%, so với 28,3% của Google. Tại Trung Quốc, Baidu là công cụ tìm kiếm chiếm vị trí đầu bảng tại Quốc gia đông dân nhất thế giới này. Tại Hàn Quốc, 70% truy vấn tìm kiếm thông qua Naver. Hay Yahoo! Nhật Bản và Yahoo! Đài Loan là những con đường phổ biến nhất cho tìm kiếm trên mạng tại Nhật Bản và Đài Loan.
Việt Nam là một trường hợp ngoại lệ, Cốc Cốc – công cụ tìm kiếm có tuổi đời non trẻ lại được sử dụng nhiều nhất. Tuy nhiên, các kết quả trả về trên mạng tìm kiếm này lại được trích xuất từ Google, do đó Google vẫn là công cụ được sử dụng nhiều nhất tại Việt Nam hiện nay.
Hy vọng với thông tin về Search Engine trên sẽ giúp các bạn có những kiến thức cơ bản nhất trong quá trình tìm hiểu về thế giới SEO nói riêng cũng như Marketing Online nói chung.