Đây là cách DragGan đang thay đổi cách bạn chỉnh sửa hình ảnh

Mục nhập tại draggan.com

Bạn có muốn chỉnh sửa hình ảnh chuyên nghiệp mà không cần sử dụng các chương trình phức tạp như Photoshop không? Bạn có muốn thay đổi diện mạo của một người, một con vật hay một đồ vật chỉ bằng vài cú nhấp chuột không? Nếu câu trả lời là có, thì bạn muốn biết xe kéo, một công cụ AI cách mạng hóa ấn bản hình ảnh.

Công cụ này cho phép bạn sửa đổi hình ảnh và tác phẩm nghệ thuật bằng cách kéo các điểm trên màn hình và AI đảm nhiệm việc tạo ra một hình ảnh mới thích ứng với người dùng yêu cầu thay đổi, duy trì tính mạch lạc và tính hiện thực. Trong bài viết này, chúng tôi sẽ giải thích Draggan là gì, nó hoạt động như thế nào và nó có những lợi ích gì.

draggan là gì

Một hình ảnh được thực hiện bởi ia

Draggan là một công cụ chỉnh sửa hình ảnh AI sử dụng mạng lưới đối thủ chung (GAN). Nó cho phép người dùng sửa đổi hình ảnh và tác phẩm nghệ thuật bằng cách kéo các dấu chấm trên màn hình. Ví dụ: bạn có thể thay đổi nét mặt của một người, kích thước hoặc hình dạng mũi, màu sắc hoặc kết cấu của đối tượng, ánh sáng hoặc phối cảnh của cảnh, v.v. Tất cả điều này theo một cách thực tế và tự nhiên, không để lại dấu vết giả mạo.

Draggan là kết quả của nghiên cứu học thuật của MIT và Đại học Pennsylvania, hợp tác với Google. Dự án được trình bày vào tháng 2023 năm XNUMX tại hội nghị CVPR (Computer Vision and Pattern Recognition), một trong những công ty uy tín nhất trong lĩnh vực thị giác máy tính. Mã nguồn của Draggan là mã nguồn mở và có thể được tải xuống từ GitHub.

Cách thức hoạt động của Draggan

Người có mã số trên mặt

Draggan hoạt động thông qua một hệ thống chỉnh sửa dựa trên kỹ thuật thao tác dựa trên điểm tương tác. Điều này có nghĩa là người dùng chỉ phải đặt các điểm tham chiếu cho các yếu tố họ muốn thao tác và AI sẽ thực hiện phần còn lại. AI chịu trách nhiệm tạo ra một hình ảnh mới thích ứng với những thay đổi mà người dùng yêu cầu, duy trì tính nhất quán và tính hiện thực.

Để thực hiện điều này, Draggan sử dụng mạng thế hệ đối nghịch (GAN), một loại mạng thần kinh được đào tạo trên một lượng lớn dữ liệu để tìm hiểu cách tạo nội dung mới và thực tế. GAN được tạo thành từ hai mạng: một máy phát điện và một bộ phân biệt đối xử. Mạng tạo chịu trách nhiệm tạo hình ảnh mới từ các điểm do người dùng kéo. Mạng phân biệt chịu trách nhiệm đánh giá chất lượng và độ chân thực của hình ảnh được tạo, so sánh nó với hình ảnh gốc. Do đó, hai mạng cạnh tranh với nhau cho đến khi đạt được kết quả tốt nhất có thể.

Draggan có những lợi ích gì

người chạm vào robot

Draggan có nhiều lợi ích cho người dùng muốn chỉnh sửa hình ảnh dễ dàng và nhanh chóng. Một số lợi ích này như sau:

  • Rất dễ sử dụng: Không cần kiến ​​thức kỹ thuật không có kinh nghiệm trước đây trong chỉnh sửa hình ảnh. Chỉ cần kéo các điểm trên màn hình và xem hình ảnh thay đổi.
  • Thật nhanh chóng: Bạn không cần phải đợi lâu để xem kết quả. AI tạo ra hình ảnh mới chỉ trong vài giây.
  • Nó là thực tế: Nó không cho thấy rằng hình ảnh đã được chỉnh sửa. AI tôn trọng tỷ lệ, bóng đổ, màu sắc và chi tiết của ảnh gốc.
  • là sáng tạo: Những thay đổi độc đáo và tuyệt vời có thể được thực hiện chỉ với một vài mũi khâu. Ví dụ, bạn có thể thay đổi phong cách hoặc thể loại của một tác phẩm nghệ thuật.
  • Nó vui: Bạn có thể chơi với các hình ảnh và xem chúng thay đổi như thế nào chỉ bằng cách di chuyển một điểm. Bạn có thể thử nghiệm với các khả năng và kết quả khác nhau.

Các ví dụ về Draggan

Màn hình với phần mềm hình ảnh

Để cung cấp cho bạn ý tưởng về những gì bạn có thể làm với Draggan, đây là một số ví dụ về chỉnh sửa hình ảnh bằng công cụ này:

  • Thay đổi hình dạng và kích thước của một chiếc ô tô đang kéo bánh xe, cửa ra vào, cửa sổ hoặc mui xe của nó.
  • Sửa đổi tư thế và biểu hiện của một người đang kéo lê đầu, tay, chân, mắt hoặc miệng của mình.
  • Điều chỉnh bố cục và phối cảnh của một phong cảnh kéo theo núi, cây, nước hoặc bầu trời.
  • Thay đổi phong cách hoặc thể loại của một tác phẩm nghệ thuật kéo theo các yếu tố tạo nên nó.

Như bạn có thể thấy, Draggan cho phép bạn thực hiện những thay đổi nguyên bản và tuyệt vời chỉ với một vài điểm. Bạn có thể xem thêm các ví dụ trên trang web chính thức của dự án.

Cách sử dụng Draggan

mã lập trình

Sử dụng Draggan rất dễ dàng và thú vị. Bạn chỉ cần làm theo các bước sau:

  • Tải xuống mã nguồn Draggan từ GitHub và cài đặt các phụ thuộc cần thiết để chạy nó, chẳng hạn như Python, PyTorch hoặc CUDA.
  • chạy mã trên máy tính của bạn hoặc trên một nền tảng trực tuyến như google colab. Bạn có thể chạy mã từ thiết bị đầu cuối của mình hoặc từ môi trường phát triển tích hợp (IDE) như Visual Studio Code hoặc PyCharm. Bạn cũng có thể sử dụng một nền tảng trực tuyến như Google Colab, cho phép bạn chạy mã của mình trên đám mây mà không cần cài đặt bất kỳ thứ gì trên máy tính.
  • Đặt điểm chuẩn cho các mục bạn muốn thay đổi và kéo chúng trên màn hình. Bạn có thể đặt bao nhiêu điểm tùy thích và kéo chúng theo bất kỳ hướng nào. AI sẽ chịu trách nhiệm tạo ra một hình ảnh mới thích ứng với những thay đổi mà người dùng yêu cầu, duy trì sự mạch lạc và chân thực.
  • Tùy chỉnh hình ảnh hơn nữa bằng cách thay đổi màu sắc, phông chữ hoặc cách sắp xếp các phần tử. Ngoài việc kéo các điểm, bạn cũng có thể thay đổi các khía cạnh khác của hình ảnh, chẳng hạn như màu sắc, phông chữ hoặc cách sắp xếp các thành phần. Để thực hiện việc này, bạn có thể sử dụng các nút điều khiển ở cuối màn hình. Ví dụ, bạn có thể thay đổi màu nền, cỡ chữ hoặc xoay ảnh.

Tùy chỉnh theo ý thích của bạn

Một hình ảnh tưởng tượng về AI

Như bạn đã thấy, Draggan là một công cụ AI giúp cách mạng hóa việc chỉnh sửa hình ảnh. cho phép người dùng sửa đổi hình ảnh và tác phẩm nghệ thuật kéo các điểm trên màn hình. . Mã nguồn của Draggan là mã nguồn mở và có thể tải xuống từ GitHub. Nếu bạn muốn chỉnh sửa hình ảnh như một chuyên gia không cần sử dụng các chương trình phức tạp như Photoshop, chúng tôi khuyến khích bạn dùng thử Draggan và xem hình ảnh của bạn thay đổi như thế nào chỉ với một vài cú nhấp chuột. Chúng tôi hy vọng bạn thấy bài viết này hữu ích và bạn thấy vui vẻ khi sử dụng Draggan! 😊


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.