OpenAI, công ty dẫn đầu về trí tuệ nhân tạo tiên tiến, công bố giới thiệu phiên bản nâng cấp DALL-E 3. Phiên bản nâng cao này của công cụ chuyển văn bản thành hình ảnh của công ty tích hợp ChatGPT, chatbot AI phổ biến của OpenAI, để hợp lý hóa và sửa đổi quy trình nhắc nhở hình ảnh.
Các công cụ tạo hình ảnh dựa trên AI chính đang hoạt động hiện nay biến lời nhắc hoặc mô tả hình ảnh thành một loạt các tác phẩm nghệ thuật với nhiều phong cách, từ quang học đến giả tưởng. Tuy nhiên, thách thức nằm ở việc phát triển một lời nhắc phù hợp, điều này đã thúc đẩy sự xuất hiện của 'kỹ thuật nhanh chóng' như một nghề đáng khen ngợi.
DALL-E 3 cách mạng hóa quy trình này bằng cách triển khai ChatGPT để hỗ trợ cải thiện lời nhắc. Người đăng ký ChatGPT Plus và ChatGPT Enterprise có thể tận dụng công cụ này bằng cách gửi yêu cầu hình ảnh của họ và tinh chỉnh chúng thông qua các cuộc thảo luận với chatbot. Khi làm như vậy, họ sẽ nhận được kết quả tinh chỉnh trực tiếp trong ứng dụng trò chuyện.
ChatGPT có khả năng mở rộng các lời nhắc chỉ bằng vài từ, làm cho chúng mang tính mô tả hơn và cung cấp các hướng dẫn cải tiến cho mô hình DALL-E 3. Đây không phải là lợi ích duy nhất đi kèm với DALL-E 3; nó cũng tạo ra hình ảnh chất lượng cao thể hiện lời nhắc tốt hơn. Điều này đặc biệt được chú ý khi xử lý các lời nhắc dài hơn và xử lý các nội dung trước đây gây khó khăn cho các mô hình tạo hình ảnh như nội dung văn bản và bàn tay con người.
Theo OpenAI, phiên bản nâng cấp cũng giới thiệu các cơ chế mới để giảm sai lệch thuật toán và tăng cường tính an toàn. Ví dụ: nó sẽ từ chối các yêu cầu yêu cầu hình ảnh theo phong cách của các nghệ sĩ hiện tại hoặc hình ảnh đại diện của các cá nhân nổi tiếng. Hơn nữa, các nghệ sĩ hiện có quyền lựa chọn không sử dụng tất cả hoặc các phần cụ thể trong tác phẩm nghệ thuật của họ để đào tạo các phiên bản tương lai của mô hình chuyển văn bản thành hình ảnh của OpenAI. Quyết định này đặc biệt đáng chú ý trong bối cảnh các vụ kiện đang chờ xử lý mà OpenAI và một số đối thủ cạnh tranh của nó đang phải đối mặt với cáo buộc sử dụng tác phẩm nghệ thuật có bản quyền của các nghệ sĩ để đào tạo mô hình hình ảnh AI của họ.
Việc ra mắt DALL-E 3 không đồng bộ với sự cạnh tranh ngày càng gay gắt trong lĩnh vực sáng tạo AI, đặc biệt là trong lĩnh vực tổng hợp hình ảnh. Các đối thủ như Midjourney và Stability AI đang liên tục cải tiến các mô hình tạo hình ảnh của họ, giữ cho OpenAI luôn hoạt động tốt.
DALL-E 3 dự kiến sẽ được triển khai cho người dùng ChatGPT cao cấp vào tháng 10, sau đó là các phòng thí nghiệm nghiên cứu và khách hàng API. OpenAI vẫn giữ im lặng về kế hoạch tung ra một công cụ web miễn phí tương tự như các mẫu DALL-E trước đây.
Những tiến bộ như vậy trong việc tạo hình ảnh AI có thể mang lại lợi ích cho các nền tảng no-code như AppMaster. Với công cụ no-code mạnh mẽ, người dùng AppMaster có thể tích hợp các khả năng AI cấp độ tiếp theo này, tạo điều kiện thuận lợi cho quá trình tạo ứng dụng và phát triển phụ trợ. Nếu được tích hợp chính xác, điều này có thể mở ra những khả năng mới cho thiết kế ứng dụng trực quan, tất cả đều có sẵn thông qua các giải pháp no-code.