Perplexity Computer: Sức Mạnh AI Agent Đỉnh Cao và Những Hạn Chế Cần Biết
Perplexity Computer đang nổi lên như một AI agent mạnh mẽ, hứa hẹn thay đổi cách chúng ta tương tác với máy tính và internet. Được phát triển bởi Perplexity – công ty nổi tiếng về công cụ tìm kiếm web – Perplexity Computer không chỉ là một công cụ tìm kiếm thông thường mà là một tác nhân AI hoàn chỉnh, có khả năng thực hiện nhiều tác vụ phức tạp như con người.
Perplexity Computer Là Gì?
Perplexity Computer là một AI agent được lưu trữ trên đám mây (cloud-hosted), hoạt động như một trợ lý ảo siêu mạnh mẽ. Nó có khả năng:
- Vận hành trình duyệt như con người.
- Tạo ra các loại tệp tin.
- Tạo hình ảnh và video.
- Tích hợp với hơn 400 phần mềm khác nhau.
- Khởi chạy các tác nhân phụ (sub-agents).
- Thực hiện nghiên cứu chuyên sâu (super research).
- Sử dụng terminal.
Nó được so sánh với Manus – một AI agent từng gây sốt năm ngoái, nhưng Perplexity Computer đã nâng cấp khái niệm này lên một tầm cao mới với giao diện người dùng thân thiện hơn và không yêu cầu cài đặt phức tạp.
Khả Năng Vượt Trội trong Tương Tác Web
Một trong những vấn đề lớn nhất mà các AI agent khác gặp phải là bị chặn truy cập bởi các trang web. Hầu hết các AI agent kết nối từ địa chỉ IP của trung tâm dữ liệu, vốn thường bị các trang web nhận diện và chặn.
Cách Perplexity Computer Giải Quyết Vấn Đề Chặn Truy Cập:
Perplexity Computer là một giải pháp được lưu trữ trên đám mây nhưng vẫn có thể tránh bị chặn. Mặc dù kiến trúc chi tiết là độc quyền, nhưng theo thông tin được biết, nó hoạt động trong một máy ảo (VM) và có thể sử dụng hàng ngàn proxy khác nhau để che giấu danh tính, giúp nó truy cập và tương tác với các trang web như một người dùng thông thường.
Điều này cho phép Perplexity Computer không chỉ truy cập mà còn nhấp vào các nút, điền biểu mẫu và điều hướng trang web một cách linh hoạt mà không bị hạn chế.
Kiến Trúc Linh Hoạt và Mạnh Mẽ
Perplexity Computer được xây dựng trên một kiến trúc phức tạp, cho phép nó xử lý các tác vụ đa dạng một cách hiệu quả:
1. Điều Phối Viên (Orchestrator) và Máy Ảo (VM)
- Thiết bị người dùng: Bạn gửi yêu cầu (prompt) từ laptop, máy tính hoặc điện thoại.
- Điều phối viên trên đám mây: Yêu cầu được gửi đến điều phối viên (thường là Opus 4.6), có quyền truy cập vào 19 mô hình AI khác nhau.
- Phân luồng công việc: Điều phối viên định tuyến yêu cầu dựa trên loại tác vụ.
- Máy ảo độc lập: Perplexity Computer sử dụng hai loại máy ảo khác nhau:
- Firecracker microVM: Khởi động siêu nhanh (dưới 125ms), có 2 vCPU, 8GB RAM và tự hủy sau phiên làm việc. Nó không chia sẻ chi tiết với máy ảo trình duyệt đám mây, sử dụng IP khác, đảm bảo bảo mật và tránh bị chặn.
- Cloud Browser VM: Máy ảo chuyên dụng để duyệt web.
2. Sức Mạnh Tổng Hợp từ Các Mô Hình AI Tốt Nhất
Không giống các agent bị khóa vào một nhà cung cấp mô hình AI cụ thể (ví dụ: Claude chỉ dùng mô hình của Anthropic), Perplexity Computer có thể sử dụng các mô hình AI tốt nhất hiện có từ nhiều nhà cung cấp khác nhau như Gemini, Grok, Claude, DeepSeek, GPT, v.v. Điều phối viên sẽ chọn mô hình tối ưu cho từng tác vụ:
- Điều phối: Opus 4.6
- Nghiên cứu: Sonnet 4.6
- Tạo tài sản (Asset creation): Opus
- Tạo mã: GPT (hiện tại là 5.4)
3. Kiến Trúc Tác Nhân Phụ (Sub-Agent)
Điều phối viên có thể sinh ra các tác nhân phụ chuyên biệt để thực hiện các tác vụ khác nhau, giúp nó tự do quản lý tổng thể.
- Mỗi tác nhân phụ có cửa sổ ngữ cảnh (context window) riêng nhưng chia sẻ cùng hệ thống tệp tin trong không gian làm việc.
- Điều này cho phép chúng thực thi song song trên cùng một tác vụ và chia sẻ dữ liệu với các tác nhân phụ khác, tăng tốc độ xử lý.
4. Hệ Thống Bộ Nhớ
Perplexity Computer có một hệ thống bộ nhớ được hỗ trợ bởi cơ sở dữ liệu vector, cho phép nghiên cứu ngữ nghĩa. Bộ nhớ này tồn tại qua các phiên làm việc, giúp agent tự động ghi nhớ các sự kiện quan trọng mà không cần hướng dẫn cụ thể từ người dùng.
5. Luồng Dữ Liệu cho Tác Vụ Phức Tạp (Ví dụ: Nghiên cứu 50 công ty và tạo báo cáo)
- Người dùng gửi yêu cầu: Với prompt mô tả tác vụ.
- Điều phối viên lập kế hoạch: Phân tích yêu cầu, xác định các tác vụ cần thực hiện song song.
- Tạo tệp chính: Một tệp JSON được tạo để tổng hợp kết quả.
- Khởi chạy tác nhân phụ: Điều phối viên sinh ra nhiều tác nhân phụ song song để thu thập dữ liệu về các công ty.
- Thu thập kết quả: Kết quả được tổng hợp vào một tệp CSV để phân tích.
- Phân tích với mô hình tối ưu: Sử dụng Opus 4.6 để phân tích dữ liệu.
- Tạo báo cáo PDF: Một tác nhân phụ tạo tài sản (cũng là Opus) được khởi chạy để tạo báo cáo PDF được định dạng.
- Báo cáo được gửi đến người dùng: PDF được tạo và gửi lại.
Đa Dạng Tích Hợp và Khả Năng Lập Lịch
Perplexity Computer hỗ trợ hơn 400 kết nối OAuth khác nhau, bao gồm Slack, Gmail, Calendar, Notion, GitHub, Linear, v.v. Bạn chỉ cần xác thực một lần, hệ thống sẽ lưu trữ thông tin đăng nhập cho các lần sử dụng sau.
Nó cũng có hệ thống lập lịch (powered by Cron) để chạy các tác vụ định kỳ. Mỗi lần chạy được gán một máy ảo riêng biệt, cách ly hoàn toàn, không có bộ nhớ từ các lần chạy trước để ngăn chặn lỗi “ảo giác” tích lũy. Perplexity Computer cũng có thể gửi thông báo đẩy khi phát hiện điều gì thú vị (ví dụ: công ty của bạn được nhắc đến trên Hacker News).
Ứng Dụng Thực Tế Ấn Tượng
Perplexity Computer có thể xây dựng và tự động hóa nhiều thứ:
- Công cụ tiếp thị: Tạo các công cụ tiếp thị tự động quét hàng giờ, quản lý ngân sách, phát hiện tình trạng mệt mỏi của chiến dịch và điều phối nhiều chiến dịch từ đầu đến cuối.
- Chuyển đổi danh sách phát: Xây dựng công cụ chuyển đổi danh sách phát Spotify sang YouTube Music.
- Hệ thống truyền tệp ngang hàng: Tạo hệ thống truyền tệp web ngang hàng mà không cần tài khoản.
- Phân tích dữ liệu: Tạo các ứng dụng web tương tác với biểu đồ và hình ảnh trực quan để phân tích dữ liệu phức tạp (ví dụ: tác động kinh tế khi eo biển Hormuz bị đóng cửa, tăng trưởng kênh YouTube).
Tích Hợp Thanh Toán Với Cream (Đối Tác)
Một điểm thú vị là Perplexity Computer có thể tích hợp với các hệ thống thanh toán như Cream. Cream là một “merchant of record” (đơn vị xử lý thanh toán) giúp xử lý thuế, tuân thủ, hoàn tiền và các vấn đề liên quan đến thanh toán trên hơn 100 quốc gia.
Cách AI Agent Sử Dụng Cream:
- Truy cập
skill.md: Cream cung cấp một tệpskill.md(tạicream.io/skill.mmd) chứa hướng dẫn chi tiết về cách sử dụng Cream. - Sao chép prompt: Bạn chỉ cần sao chép prompt này vào AI agent của mình (như Perplexity Computer, Claude Code, Agent Zero, OpenClaw).
- Tích hợp tự động: Agent sẽ đọc tệp
skill.mdvà tự động tích hợp toàn bộ hệ thống thanh toán vào dự án của bạn, bao gồm CLI, webhooks, đăng ký, khóa cấp phép. - Giám sát và thông báo: Sau khi dự án hoạt động, agent có thể giám sát cửa hàng của bạn thông qua “heartbeat” do Cream cung cấp, gửi thông báo khi có hủy đơn, mua hàng mới hoặc cảnh báo.
- Chương trình liên kết và chia sẻ doanh thu: Cream cũng có chương trình liên kết và chia sẻ doanh thu tích hợp, giúp tự động hóa các khoản chi trả và phân phối doanh thu.
So Sánh Với ChatGPT (Thử Nghiệm Thực Tế)
Trong một thử nghiệm thực tế để tìm hiểu “cách dễ nhất để có giấy phép súng ở Ba Lan” và tạo báo cáo PDF có hình ảnh, Perplexity Computer đã cho thấy nhiều ưu điểm hơn ChatGPT:
- Lập kế hoạch và kỹ năng: Perplexity Computer bắt đầu bằng việc đọc các “kỹ năng” (skills) liên quan (ví dụ: tạo PDF, trợ lý nghiên cứu), sau đó chia mục tiêu lớn thành các tác vụ nhỏ và thực hiện song song. ChatGPT cũng bắt đầu có dấu hiệu tải kỹ năng nhưng ít rõ ràng hơn.
- Tìm kiếm web: Perplexity Computer vượt trội nhờ công nghệ tìm kiếm và lập chỉ mục web hàng đầu của Perplexity, cho phép nó thực hiện nghiên cứu chuyên sâu, nhấp vào các liên kết, điền biểu mẫu và đọc các tệp PDF trên các trang web.
- Chất lượng báo cáo: Perplexity Computer tạo ra một báo cáo PDF 8 trang được thiết kế đẹp mắt, rõ ràng, với bố cục nhất quán, cỡ chữ dễ đọc, danh sách gạch đầu dòng và bảng biểu. Báo cáo của ChatGPT kém hơn về mặt thiết kế, chữ nhỏ và khó đọc hơn.
- Thời gian thực hiện: Mặc dù ChatGPT chạy lâu hơn, kết quả của Perplexity Computer vẫn tốt hơn và được trình bày một cách chuyên nghiệp.
Hạn Chế và Thách Thức
Mặc dù có nhiều điểm mạnh, Perplexity Computer vẫn còn non trẻ và gặp phải một số hạn chế:
- Vấn đề hệ thống tệp tin: Trong thử nghiệm, Perplexity Computer gặp khó khăn trong việc tìm kiếm các tệp đã tạo trong các phiên chat khác hoặc đẩy dự án Next.js lên GitHub, điều này cho thấy khả năng quản lý tệp tin giữa các phiên làm việc và tích hợp với bên ngoài còn hạn chế.
- Giá thành cao: Với mức giá 200 USD/tháng cho gói Perplexity Max (yêu cầu để sử dụng Perplexity Computer) và chỉ cung cấp 10.000 tín dụng (thường là tín dụng khuyến mãi), Perplexity Computer bị đánh giá là không kinh tế so với các công cụ khác như ChatGPT Pro (20 USD/tháng) hoặc Claude Max (100 USD/tháng).
- Không phải nguồn mở và ưu tiên quyền riêng tư: Perplexity không phải là công ty nguồn mở và không ưu tiên quyền riêng tư và bảo mật như các dự án như Agent Zero. Người dùng cần cẩn trọng khi cấp quyền truy cập rộng rãi (ví dụ: GitHub) cho Perplexity Computer.
Đánh Giá Tổng Quan và Lời Khuyên
Perplexity Computer là một AI agent đầy hứa hẹn, đặc biệt mạnh mẽ trong các tác vụ liên quan đến duyệt web sâu, nghiên cứu thông tin phức tạp, tương tác với các trang web và tạo báo cáo chuyên nghiệp. Nó đã giải quyết hiệu quả vấn đề bị chặn truy cập, một rào cản lớn cho các AI agent khác.
Tuy nhiên, với mức giá cao, một số hạn chế về quản lý tệp tin và tích hợp mã nguồn (GitHub), cùng với sự xuất hiện của các giải pháp nguồn mở chất lượng cao (như Agent Zero, OpenClaw), Perplexity Computer vẫn còn “sớm” và cần thời gian để hoàn thiện.
Lời khuyên: Nếu bạn có nguồn tài chính dồi dào và cần một công cụ chuyên biệt cho các tác vụ nghiên cứu web sâu, Perplexity Computer có thể hữu ích. Tuy nhiên, đối với việc lập trình, các tác vụ trợ lý tổng quát hoặc nếu bạn quan tâm đến chi phí và quyền riêng tư, các công cụ như Claude Code (để lập trình) và Agent Zero/OpenClaw (cho trợ lý tổng quát) có thể là lựa chọn tốt hơn ở thời điểm hiện tại. Hãy cân nhắc chờ đợi thêm một vài tháng để Perplexity Computer chứng minh được giá trị và cải thiện các hạn chế của mình.




