ChatGPT Image2 ra mắt - Hướng dẫn đầy đủ các tính năng

ChatGPT Image 2 đã ra mắt.

Ngày 21 tháng 4, OpenAI đã âm thầm đưa GPT Image 2 vào ChatGPT và Codex mà không có họp báo, không có xem trước, chỉ cần ra mắt trực tiếp. Trong vòng 12 giờ, nó đã đứng đầu bảng xếp hạng Image Arena với 1512 điểm, hơn người thứ hai 242 điểm - đây là khoảng cách điểm số lớn nhất trong lịch sử xếp hạng.

Là người đã theo dõi các công cụ hình ảnh AI trong thời gian dài, lần này tôi không thất vọng. Sau một tuần thử nghiệm thực tế, tôi đã tổng hợp một bộ phương pháp sử dụng hiệu quả để chia sẻ với bạn hôm nay.

ChatGPT Image 2 Hướng dẫn sử dụng

Điều đầu tiên: Điểm vào ở đâu

Nếu bạn muốn sử dụng trực tiếp, cách đơn giản nhất là thông qua ChatGPT. Nhấp vào nút ”+” trong hộp nhập liệu và chọn “Tạo hình ảnh”. Hiện tại người dùng miễn phí được cấp 2-3 hình ảnh mỗi ngày, người dùng Plus có thể sử dụng “Chế độ suy nghĩ” mạnh mẽ hơn.

Chế độ suy nghĩ tốn nhiều thời gian hơn nhưng đổi lại là độ chính xác văn bản cao hơn và khả năng bố cục phức tạp hơn. Nếu bạn có yêu cầu cao về kết quả được tạo, tôi khuyên bạn nên đăng ký Plus để sử dụng Chế độ suy nghĩ.

Công thức Prompt: Viết theo này sẽ không thất bại

Sau một tuần “đau đầu”, tôi đã tổng hợp một công thức prompt dành riêng cho GPT Image 2:

【Phong cách hình ảnh】+【Nền cảnh】+【Chủ thể chính】+【Chi tiết chính xác và văn bản】+【Bố cục và ràng buộc】

Để tôi đưa ra một ví dụ. Một prompt hình ảnh sản phẩm thành công:

Nhiếp ảnh sản phẩm chất lượng điện ảnh. Cảnh được đặt trên bề mặt đá granite xám đậm, nền tối với một ít khói. Chủ thể là một chai nước hoa nam hình vuông bằng kính đen, đặt hơi nghiêng. Chi tiết: Mặt trước chai nước hoa có chữ tiếng Anh màu vàng “SERIAL” bằng font sans-serif, bề mặt chai có những giọt nước nhỏ thực tế. Ràng buộc: Ánh sáng cứng từ nguồn sáng đơn bên phải, tạo bóng viền rõ ràng, độ tương phản cao và tông màu lạnh, không có đối tượng nào khác ngoài nước hoa.

Lõi của công thức này: Đầu tiên đặt tông phong cách, sau đó mô tả cảnh và chủ thể, rồi dùng chi tiết cụ thể để giới hạn kết quả, cuối cùng dùng điều kiện loại trừ để khóa những gì không nên xuất hiện.

Render văn bản: Cuối cùng không còn thất bại

Trước đây khi sử dụng vẽ AI, điều tôi lo ngại nhất là bắt nó viết tiếng Trung. Hoặc là lỗi chính tả, hoặc văn bản bị biến dạng thành rác.

GPT Image 2 đã cơ bản giải quyết vấn đề này ở thế hệ này. Thử nghiệm thực tế cho thấy tỷ lệ lỗi với câu ngắn ngang và văn bản kiểu tiêu đề gần như bằng không, các đoạn tiếng Trung dài chỉ đôi khi có vấn đề nhỏ về mật độ dấu câu.

Kỹ thuật chính: Dùng dấu ngoặc kép bao quanh văn bản bạn muốn render.

Cho dù là tiếng Trung hay tiếng Anh, bất kỳ văn bản cụ thể nào bạn muốn xuất hiện trong hình ảnh phải được đặt trong dấu ngoặc kép trong prompt. Ví dụ:

“Biển hiệu ghi ‘Mở cửa kinh doanh’” “Áo thun ngực có ghi ‘Cuối tuần vui vẻ’”

Kết hợp với mô tả vị trí cụ thể như “ở giữa”, “góc trên bên trái”, độ chính xác render văn bản sẽ được nâng cao thêm.

Bố cục phức tạp: Sử dụng Chế độ suy nghĩ

Với những hình ảnh chứa nhiều yếu tố và yêu cầu mối quan hệ không gian chính xác, chế độ thường dễ bỏ sót một số yếu tố. Đây là lúc bạn cần bật “Chế độ suy nghĩ”.

Ví dụ, nếu bạn muốn tạo một hình ảnh với các yếu tố sau: bên trái là một cô gái mặc váy đỏ, ở giữa là một con mèo cam, phía dưới là một dòng văn bản. Khi nhiều yếu tố được giới hạn đồng thời, Chế độ suy nghĩ có thể điều phối bố cục tổng thể tốt hơn.

Lưu ý rằng Chế độ suy nghĩ mất 15-30 giây hoặc hơn cho mỗi lần tạo, các cảnh phức tạp có thể cần đợi hơn một phút. Đây là đánh đổi tốc độ lấy chất lượng.

Tính năng chỉnh sửa: Thay đổi nhỏ mà không cần tạo lại toàn bộ

Nhiều người không biết rằng ChatGPT Image 2 hỗ trợ chỉnh sửa một phần, và logic chỉnh sửa rất trực quan.

Phương pháp chỉnh sửa: Tải lên một hình ảnh có sẵn, sau đó nói cho nó biết “giữ gì” và “thay đổi gì”.

Ví dụ, nếu bạn đã tạo một hình ảnh và muốn đổi nền từ trong nhà ra biển, chỉ cần nói “Giữ nguyên nhân vật và Bekleidung, đổi nền thành hoàng hôn bãi biển” là được. AI sẽ hiểu ý định của bạn và chỉ thay đổi nền mà không ảnh hưởng đến chủ thể.

Tính nhất quán phong cách: Làm sao để một loạt hình ảnh trông như một bộ

Khi bạn cần tạo một loạt hình ảnh giữ nguyên phong cách, có một kỹ thuật hữu ích.

Sau khi tạo hình ảnh đầu tiên, bạn có thể yêu cầu AI cung cấp số “Seed” tương ứng cho bộ hình này, sau đó thêm vào đầu các prompt sau:

“Giữ phong cách hình ảnh nhất quán với các hình trước đó, tham khảo Seed số: [số], dựa trên đó sửa đổi [yếu tố cụ thể]“

Câu hỏi thường gặp

Hỏi: Chênh lệch giữa phiên bản miễn phí và trả phí lớn không?

Phiên bản miễn phí: 2-3 hình mỗi ngày, chỉ chế độ tức thì, phù hợp để dùng thử. Phiên bản trả phí (Plus, 20$/tháng): Có thể sử dụng Chế độ suy nghĩ, hạn mức hàng ngày cao hơn, phù hợp với người dùng có nhu cầu sản xuất hàng loạt.

Tóm tắt

GPT Image 2 hiện là công cụ hình ảnh AI gần nhất với việc “có thể sử dụng trong sản xuất thực tế”. Đột phá trong render văn bản khiến các cảnh tiếng Trung cuối cùng cũng đáng tin cậy.

Tôi khuyên bạn nên bắt đầu từ những cảnh đơn giản để làm quen với giới hạn khả năng của mô hình, sau đó mới thử bố cục phức tạp.

Bắt đầu sử dụng GPT-image2