OpenAI vừa tung ra bản cập nhật quan trọng cho ChatGPT, cho phép người dùng tương tác thông qua giọng nói và xử lý hình ảnh. AI này cung cấp các phản hồi tự nhiên hơn so với các trợ lý ảo phổ biến khác như Google Assistant, Alexa và Siri. Tính năng xử lý hình ảnh giúp ChatGPT phân tích và giải quyết các vấn đề dựa trên ảnh người dùng chụp. Bản cập nhật dự kiến sẽ được phát hành trong hai tuần tới dành cho người dùng Plus và Enterprise của ChatGPT.
ChatGPT Với Tính Năng Trò Chuyện và Xử Lý Hình Ảnh
OpenAI vừa giới thiệu bản cập nhật đáng chú ý nhất từ khi ra mắt: ChatGPT đã được nâng cấp để người dùng có thể tương tác với trí tuệ nhân tạo (AI) theo cách tự nhiên qua giọng nói và xử lý hình ảnh.
Theo thông tin từ OpenAI, ChatGPT hiện đã có khả năng trò chuyện bằng giọng nói với phong cách của năm nhân vật mặc định. Ngoài ra, AI này cũng có khả năng xử lý hình ảnh mà người dùng cung cấp. Tính năng trò chuyện được xem là một phần quan trọng để thu hút sự quan tâm và sử dụng rộng rãi hơn từ phía người dùng.
Peter Deng, Phó Chủ tịch phụ trách Sản phẩm Tiêu dùng của OpenAI, đã bàn về thách thức lớn trong quá trình phát triển này và nói rằng: “Một trong những nhiệm vụ khó khăn nhất là tận dụng công nghệ của chúng tôi để giúp việc tiếp cận đến 300-400 triệu người dùng tiếp theo trở nên dễ dàng hơn.”
Tính Năng Trò Chuyện và Xử Lý Hình Ảnh
Trong bản cập nhật mới này, ChatGPT đã được nâng cấp để có thể trò chuyện bằng giọng nói, kể chuyện hoặc đọc nội dung mà người dùng cung cấp dưới dạng văn bản. Theo đánh giá của Washington Post trong cuộc thử nghiệm, các phản hồi từ ChatGPT “có tính trò chuyện hơn so với các trợ lý ảo phổ biến như Google Assistant, Alexa hay Siri.”
OpenAI cũng nhấn mạnh trong blog của mình ngày 25/9 rằng tính năng trò chuyện mới này “mở ra cánh cửa cho nhiều ứng dụng sáng tạo và tập trung vào khả năng tiếp cận.”
Tính năng xử lý hình ảnh cho phép người dùng chụp ảnh mọi thứ xung quanh và yêu cầu ChatGPT phân tích ảnh để giúp họ giải quyết các vấn đề, như sửa lò nướng khi không hoạt động, kiểm tra thực phẩm trong tủ lạnh để lập kế hoạch ăn uống hoặc phân tích biểu đồ phức tạp liên quan đến công việc. Tính năng này tương tự với Google Lens của Alphabet.
Dự kiến bản cập nhật mới của ChatGPT sẽ được phát hành trong hai tuần tới, nhưng chỉ dành cho những người đăng ký gói Plus và Enterprise.
ChatGPT Trở Thành Đối Thủ Cạnh Tranh
OpenAI thành lập vào năm 2016 và ChatGPT ra mắt vào cuối năm ngoái, nhanh chóng thu hút sự chú ý với khả năng trả lời câu hỏi một cách tự nhiên. Bản cập nhật mới này được hy vọng sẽ nâng cao sức mạnh của ChatGPT, biến nó thành một đối thủ đáng gờm cho các trợ lý ảo truyền thống.
Washington Post nhận xét rằng “việc bổ sung khả năng trò chuyện và xử lý hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự: một chatbot có thể ‘nhìn’ và ‘nghe’ thế giới, cũng như phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản.”
Các nhà nghiên cứu trong lĩnh vực Trí tuệ Nhân tạo cho rằng mô hình đa phương thức sẽ là giai đoạn cạnh tranh tiếp theo và có thể ứng dụng trong nhiều lĩnh vực cuộc sống, như điện thoại thông minh, TV, xe hơi và loa thông minh.
Trong tin tức liên quan, vào ngày 25/9, Amazon thông báo rằng họ đã đầu tư 4 tỷ USD vào công ty khởi nghiệp AI Anthropic. Đây được coi là thỏa thuận đầu tư lớn nhất trong lĩnh vực Trí tuệ Nhân tạo kể từ khi Microsoft đầu tư hơn 10 tỷ USD vào OpenAI. Trước đó, Amazon cũng đã mở rộng tính năng “trò chuyện” của loa thông minh Alexa thông qua chatbot, tuy nhiên tính năng này vẫn còn hạn chế.