
Tuần này, OpenAI đã giới thiệu ChatGPT Agent, một bản nâng cấp lớn chưa từng có, đưa chatbot chủ lực của công ty tiến vào lãnh địa hoàn toàn mới, dù điều này ít nhiều gây lo ngại. Khác với các phiên bản trước đây của ChatGPT vốn chỉ đơn thuần trả lời theo yêu cầu, Agent được thiết kế để thực hiện các tác vụ nhiều bước—từ nghiên cứu lịch trình du lịch cho đến xây dựng bài thuyết trình—tất cả đều thông qua việc tự điều khiển một máy tính ảo riêng của nó.
Theo OpenAI, công cụ này có thể “linh hoạt chuyển đổi giữa suy luận và hành động để xử lý các quy trình công việc phức tạp từ đầu đến cuối”. Được trang bị trình duyệt web tích hợp sẵn, terminal và khả năng truy cập vào các API bên thứ ba, Agent có thể lập kế hoạch, suy luận và hành động trên nhiều ứng dụng và dịch vụ khác nhau, đồng thời cung cấp cập nhật tiến độ và cho phép người dùng phản hồi theo thời gian thực.
Hiện tại Agent đã sẵn sàng cho người dùng phiên bản Pro, và công ty đang dự kiến sẽ mở rộng phạm vi sử dụng rộng rãi hơn. Đây được coi là nỗ lực tham vọng nhất từ trước tới nay của OpenAI nhằm chuyển đổi ChatGPT từ một chatbot thông thường trở thành một nhân viên kỹ thuật số thực thụ. Dưới đây là những gì bạn cần biết về khả năng, các rủi ro cũng như tác động tiềm năng mà nó mang lại cho công việc và cuộc sống của chúng ta.
Trong khi các phiên bản ChatGPT trước đó chỉ đơn thuần phản hồi câu hỏi và tạo ra nội dung, Agent hiện nay đã có thể thực hiện các tác vụ kỹ thuật số đa bước phức tạp như duyệt web, điền biểu mẫu trực tuyến, chạy mã lệnh, viết và chỉnh sửa tài liệu hay tạo ra bài thuyết trình PowerPoint.
Thay vì chỉ xuất văn bản, hệ thống này có khả năng tự động điều hướng quy trình làm việc, chọn đúng ứng dụng phù hợp cho từng nhiệm vụ, và điều chỉnh giữa chừng nếu nhận được chỉ dẫn cập nhật từ người dùng. Một bản trình diễn của OpenAI cho thấy Agent quét lịch Google của người dùng, lựa chọn một buổi tối trống, sau đó tìm kiếm các nhà hàng gần đó có đánh giá cao và cung cấp luôn các lựa chọn có thể đặt bàn. Theo thử nghiệm do The Guardian thực hiện, toàn bộ quá trình này mất khoảng từ 10 đến 15 phút.
Dù vẫn đang trong giai đoạn thử nghiệm beta, các tác vụ như xây dựng slide thuyết trình và phân tích bảng tính đều đã được hỗ trợ. Các thử nghiệm nội bộ cho thấy Agent có thể thực hiện cạnh tranh, thậm chí tốt hơn cả con người, trong các bài kiểm tra về khoa học dữ liệu và lý luận phê phán.
Khi ChatGPT Agent giờ đây đã được trao quyền hành động trực tuyến, các lo ngại về an ninh mạng đang trở thành vấn đề trọng tâm. Một trong những rủi ro lớn nhất là vấn đề “prompt injection”—các hướng dẫn độc hại được giấu trong trang web nhằm chiếm quyền điều khiển hành vi của AI. Về lý thuyết, những hướng dẫn này có thể đánh lừa Agent tiết lộ thông tin nhạy cảm hoặc thực hiện những hành động trái phép, đặc biệt khi tương tác với các website không quen thuộc.
Để đối phó với tình trạng này, OpenAI cho biết họ đã đào tạo Agent nhận biết và chống lại các yêu cầu đáng ngờ. Trong một cuộc họp báo được Ars Technica đưa tin, một kỹ sư của OpenAI giải thích rằng nhiều mô hình khác nhau sẽ giám sát lẫn nhau trong suốt quá trình xử lý các tác vụ phức tạp. Nếu phát hiện hành động bất thường—ví dụ như Agent cố gắng thực hiện một giao dịch ngân hàng—các bộ phận khác của hệ thống có thể can thiệp hoặc lập tức dừng nó lại.
Một điều quan trọng nữa là Agent hoạt động trong một môi trường sandbox, nghĩa là nó không thể truy cập vào thiết bị hay dữ liệu cá nhân của người dùng trừ khi được phép rõ ràng. Trong “chế độ tiếp quản” (takeover mode), người dùng có thể tự mình kiểm soát trình duyệt, và OpenAI tuyên bố rằng công ty không ghi lại bất kỳ dữ liệu nào trong các phiên hoạt động này, kể cả mật khẩu. Hệ thống còn cung cấp các công cụ để xóa lịch sử duyệt web và kết thúc các phiên làm việc chỉ bằng một cú nhấp chuột.
Tuy vậy, các chuyên gia vẫn thận trọng. Khi Agent ngày càng trở nên mạnh mẽ hơn, hậu quả của những hành động vô ý—nhất là khi thực hiện các tác vụ như mua sắm, lên lịch hay tương tác với các hệ thống khác—cũng sẽ gia tăng. OpenAI thừa nhận rằng “với mô hình này, sẽ có nhiều rủi ro hơn so với các mô hình trước đây,” và công ty đang chủ động dự đoán các mối đe dọa tiềm ẩn.
Bên cạnh đó, cùng với những tiện ích mới này là các câu hỏi về việc thương mại hóa sản phẩm. CEO của OpenAI, Sam Altman, từng đưa ra ý tưởng về việc thu phí 2% trên các giao dịch được thực hiện thông qua ChatGPT. Ý tưởng đó làm dấy lên lo ngại về việc thiên vị hay gợi ý sản phẩm trả phí, mặc dù OpenAI khẳng định hiện tại hệ thống của họ chưa phục vụ các nội dung được tài trợ.
“Ngày càng có nhiều áp lực buộc các công ty AI phải thương mại hóa sản phẩm,” Niamh Burns, nhà phân tích cấp cao tại Enders Analysis chia sẻ với The Guardian. “Một phiên bản nào đó của quảng cáo hay đề xuất có tài trợ gần như là điều không thể tránh khỏi.”
Hiện tại, OpenAI khẳng định Agent là trung lập và được thiết kế hoàn toàn nhằm phục vụ lợi ích người dùng. Nhưng khi các công ty tích hợp các trợ lý này vào quy trình công việc thực tế, ranh giới giữa hỗ trợ và tác động có lẽ sẽ ngày càng trở nên nhạt nhòa hơn. Liệu ChatGPT Agent sẽ thay đổi cuộc chơi hay mất kiểm soát có lẽ sẽ phụ thuộc ít vào việc bản thân nó thông minh thế nào, mà phụ thuộc nhiều hơn vào sự thông minh và thận trọng của chính chúng ta.