Thử dùng AI Grok để chỉnh sửa ảnh, so sánh nhanh với Gemini 2.0

24/03/2025 10:15
Thử dùng AI Grok để chỉnh sửa ảnh, so sánh nhanh với Gemini 2.0

Hiện tại người dùng X mua gói Premium+ đã được dùng thử tính năng chỉnh sửa hình ảnh tải lên. Mình có dùng thử một loạt các tình huống và so sánh nhanh luôn với Gemini Flash 2.0 qua Google AI Studio, xin chia sẻ với các bạn.


Nhận xét chung:

  • AI sẽ gen cùng lúc ra 2 bức ảnh thay vì 1 như Gemini
  • Grok trả về ảnh có độ phân giải cao
  • Khả năng thêm các chi tiết vào vật thể khá tốt
  • Xử lý chữ trên ảnh khá tốt, thêm được cả chữ tiếng Việt
  • Ảnh do AI gen ra có xu hướng thêm các chi tiết khác, không giữ hoàn toàn những chi tiết trong ảnh
  • Grok hiện chỉ cho tải lên 1 ảnh nên chưa làm được trò ghép nội dung 2 ảnh lại với nhau.

Phục hồi ảnh cũ


Mình thử tải bức ảnh bị xước lên và đây là kết quả của Grok. Grok sẽ tạo ra cùng lúc luôn 2 ảnh cho người dùng chọn, ảnh độ phân giải cao và mịn màng.


Đây là cùng một prOmpt tải lên Gemini Flash 2.0. Có thể thấy Gemini giữ lại đặc tính của bức ảnh tốt hơn.


Sửa ảnh nhắm mắt


Trong tình huống ảnh chụp bị nhắm mắt. Mình kêu Grok sửa thành cô gái trong ảnh đang nhìn vào ống kính là nó hiểu ngay và trả về kết quả như thế này. 2 ảnh đều rất hài lòng.


Với Gemini thì nhập prOmpt tương tự như Grok thì Gemini chưa nhận diện được. Phải sửa prOmpt lại một chút là kêu nó mở mắt ra trước, rồi mới nhìn vào máy thì mới dược.


Nhiều góc chụp từ ảnh chân dung


Trong tình huống này mình kêu Grok cho bức ảnh chụp nghiêng của cô gái. 2 ảnh AI tạo ra đều rất ưng, giữ nguyên được đường nét của gương mặt cô gái cũng như trang phục.


Đây là kết quả của Gemini, cũng tốt.


Thử thêm tình huống kêu Grok chuyển sang ảnh chụp từ trên xuống thì Grok không nhận diện được.


Đây là kết quả từ Gemini.


Thêm vật thể vào ảnh nội thất


Đây là kết quả của Grok thêm vào. Cơ bản cấu trúc của toàn bộ nội thất được giữ lại. Thể hiện đúng ý đồ là thêm vảo bàn ăn cho 6 người. Tuy nhiên phong cách của bức ảnh có thay đổi đôi chút.


Đây là kết quả của Gemini Flash 2.0. Yếu tố bàn ăn dành cho 6 người chưa được tuân thủ, chỉ tạo thêm một bàn ăn với 4 ghê. Tuy nhiên cấu trúc và phong cách của toàn bộ ảnh gốc được giữ nguyên.


Thay trang phục


Thử kêu Grok thay trang phục của anh trong ảnh. Đây là kết quả của Grok. Nhìn chung bức ảnh tạo ra vẫn hợp lý, chữ trên banner phía sau được giữ ổn định. Tuy nhiên gương mặt chủ thể thay đổi mạnh.


Đây là kết quả của Gemini. Mặt người được giữ nguyên và áo thay đúng ý.


Thử kêu Grok đeo kính vào


Và tương tự với Gemini


Thêm chi tiết vào ảnh







Tình huống này mình muốn anh trong ảnh cầm que kem thay vì micro. Và đây là kết quả của Grok.




Còn đây là kết quả của Gemini.




Tình huống này, mình kêu Grok thêm con gấu bông vào tay cô gái trong ảnh.




Và đây là kết quả của Gemini.


Thay đổi góc máy





Tình huống này, mình kêu Grok zoom out bức ảnh ra để thấy được toàn bộ người của cô gái trong ảnh. Đây là kết quả của Grok.




Và đây là Gemini. Gương mặt có thay đổi mạnh nhưng đổi lại bối cảnh vẫn được giữ lại.




Thử yêu cầu Grok thay đổi góc chụp sang trực diện cô gái




Và đây là kết quả của Gemini. Cả 2 đều thay đổi gương mặt cô gái luôn.


Thay đổi background





Tình huống này, mình thử kêu Grok thay background thành khung cảnh đêm Giáng Sinh mùa đông, có thêm người phía sau và thêm cả dòng chữ chúc mừng năm mới bằng tiếng Việt vào. Đây là kết quả. Cơ bản thì đường nét của chủ thể vẫn được giữ lại nhưng dòng chữ Chúc mừng năm mới chưa đã lắm.




Đây là kết quả của Gemini, gương mặt cô gái hoàn toàn khác luôn, tuy nhiên background và cả dòng chữ phía sau nhìn tự nhiên hơn khá nhiều.




Thử một bức ảnh gốc khác với Grok.




Và kết quả với Gemini


Viết chữ lên áo







Trong tình huống này, mình kêu Grok thêu thêm dòng chữ lên áo của người này. Có thể thấy dòng chữ tiếng Việt được thể hiện tốt với đầy đủ dấu, để ý kỹ thì textture của dòng chữ thể hiện đúng yếu tố "thêu" lên đó, gương mặt của chủ thể gần như được đảm bảo hoàn toàn. Đánh giá cao bức ảnh này.




Đây là kết quả từ Gemini. Dòng chữ nếu so với Grok tạo thì chưa đã lắm.


Thêm người vào ảnh





Tình huống này mình kêu thêm một cô gái vào ảnh và Grok trả về như thế này. Gương mặt người trong ảnh gốc có biến đổi.




Đây là kết quả của Gemini


Tin xem thêm

Terminal trên macOS 26 đã phát triển sau một thời gian bị Apple bỏ bê

CÔNG NGHỆ
15/12/2025 08:26

Terminal trên macOS 26 được tích hợp khả năng hiển thị đa dạng sinh động hơn sau một thời gian bị Apple bỏ bê.

Công cụ tính thuế TNCN từ lương của tác giả Việt Vũ

VĂN HOÁ XÃ HỘI
14/12/2025 21:11

Công cụ tính thuế TNCN từ lương của tác giả Việt Vũ

Trải nghiệm Leica M EV1: dễ dàng hơn

CÔNG NGHỆ
14/12/2025 21:10

Trải nghiệm Leica M EV1: dễ dàng hơn

Hỏi AI: Vì sao ốc gác bếp vẫn sống được sau 3-4 tháng không có nước

CÔNG NGHỆ
14/12/2025 21:09

Hỏi AI: Vì sao ốc gác bếp vẫn sống được sau 3-4 tháng không có nước

Một vài cảm nhận về BYD Seal sau một thời gian sử dụng.

CÔNG NGHỆ
14/12/2025 21:08

Một vài cảm nhận về BYD Seal sau một thời gian sử dụng.

PWA hay Progressive Web App là gì, dùng khác gì app native, vì sao PWA trên iOS chưa ngon?

CÔNG NGHỆ
13/12/2025 09:04

PWA hay Progressive Web App là gì, dùng khác gì app native, vì sao PWA trên iOS chưa ngon?

Mời anh em mở Epic Games Store nhận miễn phí Hogwarts Legacy

CÔNG NGHỆ
13/12/2025 09:03

Mời anh em mở Epic Games Store nhận miễn phí Hogwarts Legacy

Trên tay One UI 8.5: Sao mà nó giống iOS thế?

CÔNG NGHỆ
13/12/2025 09:03

Trên tay One UI 8.5: Sao mà nó giống iOS thế?

Global 8000: máy bay tư nhân nhanh nhất thế giới của Canada, giá hơn 2 ngàn tỷ đồng

CÔNG NGHỆ
12/12/2025 09:40

Global 8000: máy bay tư nhân nhanh nhất thế giới của Canada, giá hơn 2 ngàn tỷ đồng