Năm 2002, Sitaram Iyer và Peter Druschel của Đại học Rice, cùng với Antony Rowstron từ bộ phận tìm kiếm của Microsoft đã trình bày một bài báo có tên Squirrel. Đây là một bộ nhớ đệm* web mới trên nền tảng mạng ngang hàng và phi tập trung.
*bộ nhớ đệm (cache): là nơi lưu trữ các dữ liệu nằm chờ các ứng dụng hay phần cứng xử lý.
Mạng Internet ngang hàng (P2P)
Với Squirrel, thay vì sử dụng hệ thống bộ nhớ đệm web hiện nay, các trình duyệt trên máy tính bàn có thể chia sẻ bộ đệm cục bộ của chúng để tạo nên một bộ nhớ hiệu quả và có thể mở rộng. Mô hình phân cấp mới sẽ làm giảm nhu cầu về phần cứng chuyên dụng và mọi chi phí quản trị liên quan.
Nhóm nghiên cứu cũng đã đánh giá các thuật toán lưu trữ web phân tán của Squirrel và phát hiện ra rằng nó thể hiện hiệu suất mạnh mẽ. Hiệu suất này có thể tương đương với bộ nhớ đệm tập trung khi nó giảm tỷ lệ, sử dụng băng thông và độ trễ. Quan trọng nhất, việc áp dụng mạng lưới phân cấp sẽ giúp bộ nhớ có khả năng mở rộng, tự tổ chức và phục hồi cho các lỗi của nút (node).
Vấn đề của bộ nhớ đệm hiện nay
Bộ nhớ đệm web là một kỹ thuật quan trọng, chúng thường được triển khai hoàn chỉnh trên các máy chuyên dụng tại các hệ thống mạng công ty và nhà cung cấp dịch vụ Internet. Do đó, cách tiếp cận truyền thống chỉ có thể thông qua việc sử dụng phần cứng chuyên dụng đắt tiền và như vậy, sẽ phải chịu chi phí quản trị liên tục.
Nếu có sự tăng trưởng về người dùng, các nâng cấp phần cứng sẽ cần thiết vì nó phải đối mặt với các vấn đề về khả năng mở rộng. Hơn nữa, các máy chủ chuyên dụng thường đại diện cho một lỗi duy nhất. Nếu bộ nhớ đệm của các máy này không hoạt động, nó có thể từ chối truy cập vào nội dung web được lưu trữ đối với tất cả mọi người trong mạng lưới.
Bộ nhớ đệm phân cấp của Squirrel
Squirrel tạo điều kiện cho việc chia sẻ các đối tượng web giữa các nút của khách hàng. Thay vì duy trì một bộ nhớ đệm cục bộ, Squirrel có thể lấy các nút này để xuất ra bộ đệm của nó sang các nút khác trong mạng. Lúc này sẽ có một bộ nhớ đệm cực lớn được chia sẻ với mỗi nút duyệt và các trang web lưu trữ.
Trong hệ thống bộ nhớ ngang hàng, Squirrel sẽ có lợi thế đáng kể từ việc gộp các tài nguyên từ nhiều máy tính bàn nhưng vẫn đạt được chức năng và hiệu suất của một bộ nhớ đệm chuyên dụng mà không cần bổ sung phần cứng.
Khi có sự gia tăng trong các nút của khách hàng, số lượng tài nguyên được chia sẻ cũng sẽ gia tăng. Với mô hình ngang hàng này, Squirrel có thể mở rộng nhanh chóng và tự động.
Để thực hiện điều này, Squirrel sử dụng Pastry, một nền tảng định tuyến ngang hàng và tự tổ chức như dịch vụ cung cấp vị trí đối tượng. Do đó, Pastry sẽ chịu trách nhiệm nhận dạng và định tuyến tới các nút lưu trữ bản sao của một đối tượng được yêu cầu. Không giống như các máy chủ bộ nhớ đệm chuyên dụng hiện nay, Squirrel không yêu cầu bất kỳ hỗ trợ về quản trị và cũng có khả năng phục hồi nhanh hơn đối với các lỗi của nút.
Phạm vi lý tưởng của Squirrel là từ 100 đến 100,000 nút. Về mặt lý thuyết, Squirrel có thể hoạt động ngoài phạm vi. Tuy nhiên, nhóm nghiên cứu chưa có 1 định hướng cụ thể để kiểm tra lý thuyết này. Họ tin rằng Squirrel sẽ là một giải pháp rẻ hơn, ít bị quản lý và có khả năng phục hồi lỗi cho bộ nhớ đệm trong một mạng nội bộ lớn. Ngoài ra, nhóm này cũng tự tin cho rằng với một nền tảng định tuyến ngang hàng, nó tương đối đơn giản và dễ triển khai Squirrel trong một mạng công ty.
Theo btcmanager