Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?

    Phạm Thái Học,  

    Tìm hiểu về Google Imagen AI, mô hình AI chuyển văn bản thành hình ảnh của riêng Google.

    Cuối năm 2021 đánh dấu sự thay đổi lớn của thế giới công nghệ với sự phát triển vũ bão của các công cụ AI như ChatGPT, Bing hay Google Bard. Và khoảng thời gian trước đó, chúng ta từng biết tới DALL-E hay Midjourney với khả năng tạo ra hình ảnh dựa vào văn bản được người dùng nhập vào, sự ra đời của chúng lập tức làm điên đảo cộng đồng các nhà thiết kế. Và Google cũng không đứng ngoài "cuộc chơi" này.

    1.png

    Imagen AI là một mô hình chuyển đổi văn bản thành hình ảnh do Google phát triển. Imagen AI tiếp tục làm dài thêm danh sách các trình tạo hình ảnh từ văn bản bằng AI (trí tuệ nhân tạo), danh sách trước đó có các cái tên mà bạn có thể đã biết như DALL-E 2, Dream by Wombo và Midjourney. Tất cả chúng đều có thể khả năng tạo ra những hình ảnh tuyệt vời từ mô tả văn bản.

    Google's Imagen 2 là gì?

    Đến thời điểm hiện tại, Google đã cập nhật Imagen AI lên phiên bản 2.0 (Imagen 2) với rất nhiều cải tiến. Ngay cả khi bạn không phải là nhà phát triển hay doanh nghiệp, Imagen 2 rất đáng để thử - nó miễn phí bằng cách sử dụng Google Cloud.

    Imagen 2 đã có một bước tiến vượt bậc so với phiên bản tiền nhiệm (Imagen) và cung cấp một trình tạo hình ảnh AI đầy đủ chức năng, có thể tạo ra các kết quả đầu ra mang tính nghệ thuật và chân thực. Nó được lưu trữ trong bộ công cụ Vertex AI của Google mà bạn có thể truy cập bằng tài khoản Google Cloud.

    Để so sánh, phiên bản đầu tiên của Imagen, ra mắt từ tháng 5 năm 2022, có bản phát hành beta giới hạn thông qua ứng dụng có tên AI Test Kitchen. Người dùng chỉ có thể thử tạo ra cảnh quan thành phố hoặc các nhân vật trông giống như bước ra từ một bộ phim hoạt hình Pixar.

    2.png

    Imagen 2 tự hào có các tính năng như Inpainting và Outpainting, cho phép bạn thêm nội dung vào hình ảnh được tạo hoặc mở rộng hình ảnh ra ngoài đường viền. Đây là một tính năng mà DALL-E 2 cũng có, nhưng điều làm nên sự khác biệt của Imagen là tùy chọn sử dụng hình ảnh tham chiếu khi tạo hình ảnh.

    Nếu bạn đang tìm kiếm một công cụ biến văn bản thành hình ảnh có thể giải quyết vấn đề về bàn tay do AI tạo ra thì bạn nên khám phá các khả năng của Imagen 2. Kết quả vẫn chưa hoàn hảo nhưng đó là khía cạnh mà Google đặc biệt chú ý khi phát triển công cụ.

    Cách để truy cập và trải nghiệm Google's Imagen 2

    Imagen 2 hướng đến các nhà phát triển và doanh nghiệp, nhưng nếu là cá nhân, bạn vẫn có thể dùng thử bằng cách đăng ký cho mình một tài khoản Google Cloud miễn phí như sau:

    Bước 1: Truy cập vào trang web Google Cloud qua địa chỉ "cloud.google.com" và nhấn vào Start free.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 3.

    Bước 2: Nhập các thông tin cơ bản về tài khoản Google hiện tại của bạn theo yêu cầu.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 4.

    Bạn sẽ cần thêm thẻ tín dụng để thanh toán nhưng bạn không cần phải lo lắng về các khoản phí trong tương lai. Google tuyên bố rõ ràng rằng bạn sẽ không tự động bị tính phí sau khi thời gian dùng thử miễn phí kết thúc.

    Bước 3: Sau khi đã tạo xong tài khoản Google Cloud miễn phí, bạn hãy nhấn vào menu mở rộng ở trang chủ Google Cloud và nhấn vào Vertex AI Vision.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 5.

    Bước 4: Trang Vertex AI Vision mở ra, bạn nhấn tiếp vào "Studio".

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 6.

    Bước 5: Tiếp tục nhấn vào Enable ở Vision AI API.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 7.

    Bước 6: Tiến hành tạo một ứng dụng trống mới.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 8.

    Bước 7: Sau khi đã hoàn tất, bạn hãy nhấn vào Vision Powered by Image.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 9.

    Bước 8: Việc sử dụng Imagen 2 cần được Google phê duyệt, quá trình này có thể mất ít ngày.

    Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 10.

    Kết

    Phía sau hậu trường, Imagen được đào tạo bằng cách sử dụng bộ dữ liệu có sẵn công khai có tên LAION-400M, kết hợp với các bộ dữ liệu nội bộ. Không phải tất cả các công ty AI đều chọn công khai thông tin này; một ví dụ là DALL-E 2.

    Việc sử dụng các bộ dữ liệu cũng đã trở thành một chủ đề gây tranh cãi, một phần do hoạt động thu thập hàng triệu hình ảnh từ Internet. Đặc biệt, các nghệ sĩ đã chỉ trích những công ty AI vì không nhận được sự đồng ý của chủ sở hữu hình ảnh hoặc tác phẩm nghệ thuật trước khi sử dụng nó để đào tạo các mô hình AI của mình.

    Nếu lo ngại về hình ảnh của mình, bạn có thể tìm hiểu xem hình ảnh của mình có được sử dụng để đào tạo mô hình AI hay không và chọn không tham gia.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ