Theo tin tức từ BitouchNews, Theo Cointelegraph, OpenAI đã thực hiện bốn bản cập nhật cho mô hình của mình vào tháng 10 để giúp mô hình AI tiến hành các cuộc trò chuyện tốt hơn và cải thiện khả năng nhận dạng hình ảnh. Bản cập nhật lớn đầu tiên là Live API, cho phép các nhà phát triển tạo các ứng dụng giọng nói do AI tạo ra bằng một lời nhắc duy nhất, cho phép các cuộc trò chuyện tự nhiên tương tự như chế độ giọng nói nâng cao của ChatGPT. Trước đây các nhà phát triển phải “ghép” nhiều mô hình lại với nhau để tạo ra những trải nghiệm này. Đầu vào âm thanh thường cần phải được tải lên và xử lý đầy đủ trước khi nhận được phản hồi, điều này có nghĩa là độ trễ cao hơn đối với các ứng dụng thời gian thực như cuộc trò chuyện bằng giọng nói. Với khả năng phát trực tuyến của API thời gian thực, giờ đây các nhà phát triển có thể đạt được các tương tác tức thì, tự nhiên, giống như trợ lý giọng nói. API chạy trên GPT-4, được phát hành vào tháng 5 năm 2024 và có thể thực hiện lý luận qua âm thanh, hình ảnh và văn bản trong thời gian thực.
Một bản cập nhật khác bao gồm các công cụ tinh chỉnh dành cho nhà phát triển, cho phép họ cải thiện phản hồi AI được tạo ra từ quá trình nhập hình ảnh và văn bản. Công cụ quay vòng dựa trên hình ảnh cho phép trí tuệ nhân tạo hiểu hình ảnh tốt hơn, từ đó nâng cao khả năng tìm kiếm trực quan và phát hiện đối tượng. Quá trình này bao gồm phản hồi từ con người, những người cung cấp các ví dụ về phản hồi tốt và xấu trong quá trình đào tạo.
Ngoài các bản cập nhật bằng giọng nói và hình ảnh, OpenAI còn giới thiệu "Chưng cất mô hình" và "Bộ nhớ đệm gợi ý", cho phép các mô hình nhỏ hơn học hỏi từ các mô hình lớn hơn và giảm bớt văn bản bằng cách sử dụng lại thời gian và chi phí phát triển đã xử lý. Theo Reuters, OpenAI dự kiến doanh thu sẽ tăng lên 11,6 tỷ USD vào năm tới, tăng từ mức 3,7 tỷ USD dự kiến vào năm 2024.
Bitcoin vượt qua 100.000 USD! Cột mốc mới, điểm khởi đầu mới
Trò chuyện với CocoCat Lianchuang: Giảm chi phí hơn 90%, tăng cường bảo vệ quyền riêng tư và tạo mạng lưới cơ sở hạ tầng cho các ứng dụng quy mô lớn của Web3
XRP tăng vọt, điểm nhanh 9 dự án tiền tệ phát hành liên quan đến hệ sinh thái
Airdrop lớn nhất trong năm? Airdrop trung bình trên đầu người của Hyperliquid là 28.500 USD và sự phổ biến của HYPE mang đến cơn sốt Nuggets mới