Giữ Nhân Vật Nhất Quán Khi Tạo Ảnh ChatGPT: 8 Câu Lệnh Cho 50 Hình

Cách giữ nhân vật nhất quán khi tạo ảnh ChatGPT qua 50 hình chỉ với 8 câu lệnh: từ hồ sơ gốc, cố định nhận diện đến kịch bản 50 ý tưởng.

Anh Tran

Kiến trúc backend · Full-stack · 10+ năm hệ thống thực tế

18 tháng 6, 2026·cập nhật 18 tháng 6, 2026

9 phút đọc

8 lượt xem

Bạn tạo một nhân vật đẹp ở ảnh đầu tiên, nhưng đến ảnh thứ hai khuôn mặt đã khác, tóc đổi màu, vóc dáng lệch hẳn. Đây là vấn đề kinh điển khi giữ nhân vật nhất quán khi tạo ảnh ChatGPT. Tin tốt: bạn không cần fine-tune model hay công cụ phức tạp — chỉ cần một quy trình 8 câu lệnh đúng thứ tự để tạo liên tiếp 50 hình mà nhân vật vẫn là một người duy nhất.

Bài viết này đưa cho bạn 8 prompt sẵn dùng, kèm thời điểm áp dụng và lý do từng bước hoạt động. Áp dụng được cho ChatGPT (GPT Image), và phần lớn nguyên tắc cũng đúng với các model tạo ảnh khác.

Vì sao ChatGPT hay làm "lệch" nhân vật

Model tạo ảnh không có bộ nhớ hình ảnh tuyệt đối. Mỗi lần render, nó diễn giải lại mô tả bằng từ ngữ — nếu mô tả mơ hồ, mỗi lần ra một phiên bản khác. Hai nguyên nhân chính:

Mô tả thiếu chi tiết nhận diện: chỉ nói "cô gái tóc nâu" thì model có hàng triệu cách vẽ.
Không "neo" lại nhân vật giữa các lượt: mỗi prompt mới bị coi như bắt đầu từ con số 0.

Giải pháp là khóa nhân vật bằng một hồ sơ gốc chi tiết, rồi tham chiếu lại hồ sơ đó ở mọi ảnh sau. Đó chính là logic xuyên suốt 8 câu lệnh dưới đây.

8 câu lệnh giữ nhân vật nhất quán khi tạo ảnh ChatGPT

1. Xây dựng hồ sơ nhân vật gốc

Đây là bước nền tảng, định hình nhân vật ngay từ đầu. Mô tả càng chi tiết, độ nhất quán giữa các ảnh càng cao.

Hãy tạo hồ sơ chi tiết cho một nhân vật duy nhất. Mô tả rõ giới tính, độ tuổi,
chiều cao, khuôn mặt, kiểu tóc, màu tóc, màu mắt, vóc dáng, phong cách ăn mặc và
các đặc điểm dễ nhận biết. Giữ nguyên toàn bộ đặc điểm này trong tất cả hình ảnh
được tạo sau này. Trình bày thành một bản mô tả đầy đủ và nhất quán.

Dùng khi: bắt đầu tạo bất kỳ nhân vật nào. Hãy lưu lại bản mô tả ChatGPT trả về — đây là "chứng minh thư" của nhân vật, bạn sẽ tái sử dụng nó liên tục.

Prompt mẫu:

Hãy tạo hồ sơ chi tiết cho MỘT nhân vật nữ duy nhất:
- Giới tính & tuổi: nữ, khoảng 24–26 tuổi.
- Sắc tộc: người châu Á (Đông Á / Đông Nam Á), làn da sáng mịn tự nhiên.
- Chiều cao & vóc dáng: cao khoảng 1m68, dáng thanh mảnh, cân đối, nữ tính.
- Khuôn mặt: trái xoan, gò má thanh, đường nét hài hòa, nụ cười dịu dàng cuốn hút.
- Mắt: to, màu nâu đậm, ánh nhìn biểu cảm.
- Tóc: dài ngang lưng, đen hơi nâu, uốn sóng nhẹ, bồng bềnh.
- Phong cách: nữ tính, thanh lịch, quyến rũ tinh tế (elegant & glamorous), gu thời trang hiện đại.
- Đặc điểm dễ nhận biết: một nốt ruồi nhỏ gần khóe môi, lông mày mảnh tự nhiên.
Giữ nguyên TOÀN BỘ đặc điểm này trong mọi hình ảnh tạo sau. Trình bày thành một bản mô tả đầy đủ, nhất quán, phù hợp nội dung an toàn (SFW).

2. Cố định đặc điểm nhận diện

Sau khi có hồ sơ, yêu cầu AI giữ nguyên toàn bộ thông tin đó trước mỗi bộ ảnh mới.

Sử dụng chính xác nhân vật đã tạo trước đó. Giữ nguyên khuôn mặt, vóc dáng, màu
tóc, kiểu tóc, biểu cảm và phong cách nhận diện. Không thay đổi bất kỳ đặc điểm
cá nhân nào. Chỉ thay đổi bối cảnh và hành động theo yêu cầu tôi cung cấp trong
các hình ảnh tiếp theo.

Dùng khi: trước mỗi bộ ảnh mới, để AI tiếp tục bám sát nhân vật ban đầu thay vì "sáng tạo lại".

Prompt mẫu:

Sử dụng chính xác nhân vật nữ đã tạo ở trên. Giữ nguyên khuôn mặt, mắt nâu, tóc dài đen nâu uốn sóng, vóc dáng thanh mảnh, nốt ruồi gần khóe môi và phong cách nữ tính – thanh lịch. Không thay đổi bất kỳ đặc điểm cá nhân nào. Chỉ thay đổi bối cảnh, trang phục và hành động theo yêu cầu trong các hình ảnh tiếp theo. Giữ nội dung lịch sự, an toàn (SFW).

3. Tạo chuỗi ảnh theo cốt truyện

Tạo chuỗi 10 hình ảnh liên tiếp kể về một câu chuyện. Nhân vật chính phải giữ
nguyên mọi đặc điểm nhận diện. Mỗi hình ảnh là một cảnh khác nhau. Các cảnh phải
có sự liên kết logic, giúp người xem hiểu được diễn biến câu chuyện từ đầu đến cuối.

Dùng khi: thiết kế truyện tranh, nội dung kể chuyện hoặc kịch bản minh họa cho mạng xã hội.

Prompt mẫu:

Tạo chuỗi 10 hình ảnh liên tiếp kể một câu chuyện về nhân vật nữ đã tạo: một ngày của cô ở thành phố (sáng dậy, đi cà phê, làm việc, dạo phố hoàng hôn, buổi tối).
Giữ nguyên mọi đặc điểm nhận diện. Mỗi ảnh một cảnh khác nhau, liên kết logic để người xem hiểu được diễn biến từ đầu đến cuối. Phong cách điện ảnh, ánh sáng đẹp.

4. Thay đổi trang phục, giữ nguyên danh tính

Sử dụng nhân vật đã xác định. Tạo 10 phiên bản với các bộ trang phục khác nhau.
Giữ nguyên khuôn mặt, kiểu tóc, vóc dáng và phong cách nhận diện. Chỉ thay đổi
quần áo và phụ kiện. Đảm bảo người xem dễ dàng nhận ra đó là cùng một nhân vật.

Dùng khi: xây dựng bộ ảnh thời trang, giới thiệu sản phẩm hoặc tạo nhiều phong cách hình ảnh.

Prompt mẫu:

Sử dụng nhân vật nữ đã xác định. Tạo 10 phiên bản với các bộ trang phục khác nhau: áo dài, váy dạ hội thanh lịch, set công sở, streetwear, đầm maxi đi biển, áo len mùa đông... Giữ nguyên khuôn mặt, kiểu tóc, vóc dáng và phong cách nhận diện. Chỉ thay đổi quần áo và phụ kiện. Trang phục lịch sự, tôn dáng. Đảm bảo người xem dễ nhận ra đó là cùng một nhân vật.

5. Đưa nhân vật vào nhiều không gian khác nhau

Sử dụng cùng một nhân vật. Tạo lần lượt các cảnh tại văn phòng, quán cà phê, sân
bay, công viên, trung tâm thương mại và thư viện. Giữ nguyên toàn bộ đặc điểm
nhận diện. Chỉ thay đổi địa điểm và hoạt động phù hợp với từng bối cảnh.

Dùng khi: xây dựng hình ảnh cá nhân hoặc thương hiệu với nhiều bối cảnh đa dạng.

Prompt mẫu:

Sử dụng cùng nhân vật nữ. Tạo lần lượt các cảnh tại: văn phòng, quán cà phê, sân bay, công viên, trung tâm thương mại và thư viện. Giữ nguyên toàn bộ đặc điểm nhận diện (khuôn mặt, tóc dài, vóc dáng, nốt ruồi). Chỉ thay đổi địa điểm, trang phục và hoạt động phù hợp với từng bối cảnh. Ánh sáng tự nhiên, bố cục đẹp.

6. Tạo kho ảnh dành cho mạng xã hội

Tạo 20 hình ảnh khác nhau cho cùng một nhân vật. Mỗi hình ảnh thể hiện một cảm
xúc hoặc hoạt động riêng. Giữ nguyên đặc điểm nhận diện trong toàn bộ bộ ảnh.
Hình ảnh phù hợp để sử dụng trên các nền tảng mạng xã hội và nội dung cá nhân.

Dùng khi: cần nguồn ảnh phong phú để đăng nội dung đều đặn trong thời gian dài.

Prompt mẫu:

Tạo 20 hình ảnh khác nhau của cùng nhân vật nữ. Mỗi ảnh thể hiện một cảm xúc hoặc hoạt động riêng (cười tươi, trầm tư, selfie, uống cà phê, đọc sách, dạo phố, tập yoga, nấu ăn...). Giữ nguyên đặc điểm nhận diện trong toàn bộ bộ ảnh. Phong cách nữ tính, cuốn hút, phù hợp đăng Instagram/Facebook (SFW). Khung dọc 4:5 cho mạng xã hội.

7. Mô phỏng nhân vật qua nhiều giai đoạn tuổi tác

Sử dụng cùng một nhân vật. Tạo các phiên bản ở nhiều giai đoạn khác nhau của
cuộc đời. Giữ nguyên các nét nhận diện chính. Thể hiện sự thay đổi hợp lý theo
độ tuổi nhưng vẫn giúp người xem nhận ra đây là cùng một người.

Dùng khi: kể lại hành trình phát triển của một con người hoặc xây dựng nội dung theo từng giai đoạn cuộc sống.

Prompt mẫu:

Sử dụng cùng nhân vật nữ. Tạo các phiên bản ở nhiều giai đoạn cuộc đời: thiếu nữ 18 tuổi, 25 tuổi, 35 tuổi, 50 tuổi. Giữ nguyên các nét nhận diện chính (cấu trúc khuôn mặt, mắt nâu, nốt ruồi gần khóe môi). Thể hiện thay đổi hợp lý theo tuổi (tóc, phong thái) nhưng vẫn giúp người xem nhận ra đây là cùng một người.

8. Lập kế hoạch cho 50 ý tưởng hình ảnh

Dựa trên nhân vật đã xây dựng, hãy đề xuất 50 ý tưởng hình ảnh liên tiếp. Mỗi ý
tưởng gồm bối cảnh, hành động và cảm xúc cụ thể. Đảm bảo mọi hình ảnh đều sử dụng
cùng một nhân vật. Sắp xếp theo trình tự hợp lý để có thể tạo thành một bộ ảnh
hoàn chỉnh và nhất quán.

Dùng khi: muốn AI chuẩn bị sẵn toàn bộ kịch bản hình ảnh để tạo lần lượt từng ảnh theo kế hoạch.

Prompt mẫu:

Dựa trên nhân vật nữ đã xây dựng, đề xuất 50 ý tưởng hình ảnh liên tiếp. Mỗi ý tưởng gồm: bối cảnh cụ thể, trang phục, hành động và cảm xúc. Đảm bảo mọi hình ảnh đều dùng cùng một nhân vật với đặc điểm nhận diện nhất quán. Sắp xếp theo trình tự hợp lý (theo mùa / theo chủ đề) để tạo thành một bộ ảnh hoàn chỉnh. Trình bày dạng bảng: STT | Bối cảnh | Trang phục | Hành động | Cảm xúc.

Kết quả: https://chatgpt.com/share/6a3454e8-2dfc-83ec-b745-952f6e72bb16

Quy trình gợi ý: từ 8 câu lệnh đến 50 ảnh

Thứ tự dùng quan trọng không kém nội dung prompt. Khung làm việc thực tế:

Chạy câu lệnh 1 → lưu lại hồ sơ nhân vật ra một file ghi chú riêng.
Chạy câu lệnh 8 để có sẵn 50 ý tưởng được sắp xếp logic.
Trước mỗi nhóm ảnh, chạy câu lệnh 2 để neo lại nhận diện.
Tùy mục đích, chọn câu lệnh 3–7 cho từng loại bộ ảnh (cốt truyện, trang phục, bối cảnh, cảm xúc, tuổi tác).
Tạo ảnh theo từng cụm nhỏ 5–10 hình, kiểm tra rồi mới đi tiếp.

Mẹo: sau mỗi 8–10 ảnh, dán lại đoạn hồ sơ gốc kèm một ảnh "chuẩn" nhất để model "nhớ" lại. Đây là cách chống trôi (drift) hiệu quả nhất.

Giới hạn thực tế cần biết

Prompt tốt giúp ích rất nhiều, nhưng đừng kỳ vọng độ chính xác tuyệt đối 100%:

Khuôn mặt vẫn có thể lệch nhẹ ở góc nghiêng hoặc biểu cảm mạnh — đây là giới hạn của model, không phải lỗi prompt.
Chi tiết nhỏ dễ trôi: nốt ruồi, hình xăm, hoa văn áo. Hãy ưu tiên mô tả các đặc điểm lớn, dễ nhận thay vì nhồi quá nhiều chi tiết vụn.
Càng nhiều ảnh trong một mạch, drift càng tăng. Vì vậy nên neo lại hồ sơ định kỳ như mẹo ở trên.
Đừng tạo người thật (người nổi tiếng, người quen) nếu chưa có sự đồng ý — vừa rủi ro pháp lý vừa vi phạm chính sách nền tảng.

Kết luận & bước tiếp theo

Bí quyết giữ nhân vật nhất quán khi tạo ảnh ChatGPT không nằm ở một câu lệnh thần kỳ, mà ở quy trình: mô tả gốc chi tiết → cố định nhận diện → tham chiếu lại liên tục. Tám câu lệnh trên chính là quy trình đó, đóng gói sẵn để bạn copy và chạy ngay.

Bước tiếp theo: copy câu lệnh 1, xây dựng nhân vật của riêng bạn, rồi dùng câu lệnh 8 để lên kịch bản 50 ảnh. Nếu bạn đang xây dựng prompt phức tạp hơn, hãy ghé atdev.blog để lưu bộ prompt mới nhất.

Câu hỏi thường gặp

Làm sao giữ khuôn mặt nhân vật giống nhau qua nhiều ảnh ChatGPT?▾

Tạo một hồ sơ nhân vật gốc thật chi tiết (câu lệnh 1), rồi trước mỗi bộ ảnh hãy dán lại đoạn cố định nhận diện (câu lệnh 2). Sau mỗi 8–10 ảnh, dán lại hồ sơ kèm một ảnh chuẩn để chống trôi nét.

ChatGPT có giữ nhân vật chính xác 100% không?▾

Không tuyệt đối. Các đặc điểm lớn (kiểu tóc, vóc dáng, phong cách) giữ tốt, nhưng chi tiết nhỏ như nốt ruồi hay hoa văn dễ lệch. Mô tả gọn các đặc điểm dễ nhận sẽ cho kết quả ổn định hơn nhồi quá nhiều chi tiết.

8 câu lệnh này có dùng được cho model tạo ảnh khác không?▾

Có. Nguyên tắc "hồ sơ gốc + neo lại nhận diện" đúng với hầu hết model tạo ảnh. Bạn chỉ cần điều chỉnh cách tham chiếu ảnh trước cho phù hợp từng công cụ.

Có cần kỹ năng kỹ thuật để dùng quy trình này không?▾

Không. Bạn chỉ cần copy 8 câu lệnh, điền mô tả nhân vật và chạy lần lượt. Phần khó nhất là viết hồ sơ gốc đủ chi tiết ở câu lệnh đầu tiên.

Bài viết hữu ích?