ChatGPT – Bỗ sung tính năng trò chuyện và xử lý hình ảnh
ChatGPT, một trí tuệ nhân tạo (AI) do OpenAI phát triển, đã có một bản cập nhật quan trọng nhất kể từ khi ra mắt, mang đến cho người dùng khả năng tương tác tự nhiên thông qua giọng nói và xử lý hình ảnh.
Tương tác bằng giọng nói và xử lý hình ảnh
Theo OpenAI, ChatGPT hiện có khả năng tương tác bằng giọng nói theo phong cách của năm nhân vật mặc định. Đồng thời, AI này cũng có khả năng xử lý hình ảnh được người dùng nhập vào. Tính năng trò chuyện này là một bổ sung quan trọng, nhằm thu hút sự quan tâm và sử dụng rộng rãi hơn từ phía người dùng.
Peter Deng, Phó Chủ tịch phụ trách Sản phẩm Tiêu dùng của OpenAI, đã nói về thách thức lớn trong việc tận dụng công nghệ của họ để tiếp cận 300-400 triệu người dùng tiếp theo.

Khả năng trò chuyện và xử lý hình ảnh
Trong bản cập nhật mới, ChatGPT có khả năng tham gia vào cuộc trò chuyện bằng giọng nói, kể chuyện hoặc đọc nội dung mà người dùng nhập dưới dạng văn bản. So với các trợ lý ảo phổ biến như Google Assistant, Alexa và Siri, các phản hồi từ ChatGPT được cho là có sự trò chuyện tự nhiên hơn.
OpenAI cho biết, tính năng trò chuyện mới này mở ra nhiều ứng dụng sáng tạo và tập trung vào khả năng tiếp cận.
Tính năng xử lý hình ảnh cho phép người dùng chụp ảnh và yêu cầu ChatGPT phân tích ảnh để giải quyết các vấn đề. Ví dụ, khi lò nướng không khởi động, người dùng có thể yêu cầu ChatGPT khắc phục sự cố. Hoặc khi muốn biết những loại thực phẩm nào có trong tủ lạnh để lập kế hoạch bữa ăn, ChatGPT cũng có thể cung cấp thông tin. Không chỉ giải quyết các vấn đề hằng ngày, ChatGPT còn có khả năng phân tích các biểu đồ phức tạp liên quan đến công việc. Tính năng này tương tự với Google Lens của Alphabet.
Bản cập nhật mới trên ChatGPT dự kiến sẽ được phát hành trong hai tuần tới, dành riêng cho người đăng ký gói Plus và Enterprise.
ChatGPT – Đối thủ đáng gờm cho các trợ lý ảo truyền thống
OpenAI được thành lập vào năm 2016 và ChatGPT ra mắt vào cuối năm ngoái. Bản cập nhật mới này được kỳ vọng sẽ nâng cao sức mạnh của ChatGPT, biến nó thành một đối thủ đáng gờm cho các trợ lý ảo truyền thống.
Báo Washington Post đánh giá rằng việc bổ sung khả năng thoại và xử lý hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự. ChatGPT không chỉ có khả năng “nhìn” và “nghe” thế giới mà còn có thể phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản.
Các nhà nghiên cứu trong lĩnh vực Trí tuệ Nhân tạo đánh giá rằng mô hình đa phương thức đang là giai đoạn cạnh tranh tiếp theo và có thể được áp dụng vào nhiều lĩnh vực trong cuộc sống, chẳng hạn như trên smartphone, TV, xe hơi và loa thông minh.
Hơn nữa, vào ngày 25/9, Amazon đã thông báo về việc đầu tư lớn, trị giá 4 tỷ USD vào công ty khởi nghiệp AI có tên Anthropic. Đây được xem là thỏa thuận lớn nhất trong lĩnh vực Trí tuệ Nhân tạo kể từ khi Microsoft đầu tư hơn 10 tỷ USD vào OpenAI. Tuần trước, Amazon cũng đã mở rộng tính năng “trò chuyện” của loa thông minh Alexa thông qua chatbot, tuy nhiên, tính năng này bị đánh giá là còn hạn chế.