Công ty mẹ của TikTok gây sốt khi ra AI có thể tạo video chỉ từ một bức ảnh: Einstein ‘sống lại’ và giảng bài như thật!

    Anh Việt,  

    Trên trang giới thiệu của OmniHuman-1, các nhà nghiên cứu đã đăng tải hàng loạt video demo về khả năng của công nghệ này, bao gồm hình ảnh Albert Einstein xuất hiện trong một video đen trắng sắc nét, đứng trước bảng đen nói chuyện.

    ByteDance, công ty mẹ của TikTok, vừa khiến thế giới công nghệ dậy sóng với OmniHuman-1 – hệ thống AI có khả năng biến một bức ảnh tĩnh thành video sống động của một người đang nói, cử động, thậm chí ca hát hay chơi nhạc cụ. Chỉ cần một bức ảnh, AI này có thể tái tạo các chuyển động cơ thể, cử chỉ tay và biểu cảm khuôn mặt một cách chân thực đến đáng kinh ngạc.

    Theo nghiên cứu được công bố trên nền tảng arXiv, OmniHuman-1 vượt trội hơn so với các công nghệ hiện có nhờ khả năng tạo video cực kỳ chân thực từ những tín hiệu đầu vào yếu như âm thanh. AI này có thể hoạt động với hình ảnh ở bất kỳ tỷ lệ nào, từ chân dung, bán thân đến toàn thân, mang lại kết quả mượt mà và sống động trong nhiều bối cảnh khác nhau.

    Công ty mẹ của TikTok gây sốt khi ra AI có thể tạo video chỉ từ một bức ảnh: Einstein ‘sống lại’ và giảng bài như thật!- Ảnh 1.

    Bức ảnh gốc của nhà bác học Albert Einstein....

    Trên trang giới thiệu của OmniHuman-1, các nhà nghiên cứu đã đăng tải hàng loạt video demo về khả năng của công nghệ này. Một trong những ví dụ ấn tượng nhất là hình ảnh Albert Einstein xuất hiện trong một video đen trắng sắc nét, đứng trước bảng đen, nói chuyện và nhấn mạnh lời nói bằng những cử chỉ tay chân thực. “Nghệ thuật sẽ thế nào nếu không có cảm xúc? Nó sẽ trở nên trống rỗng,” Einstein "nói" với nét mặt đầy biểu cảm, như thể chúng ta đang quay ngược thời gian để theo dõi ông giảng bài trong một giảng đường đại học hiện đại.

    và video thành quả được tạo ra nhờ AI mang tên OmniHuman-1 ByteDance

    Freddy Tran Nager, giáo sư truyền thông tại Đại học Nam California, cho biết những gì OmniHuman-1 thể hiện là rất ấn tượng. Ông thậm chí còn đặt ra viễn cảnh Hollywood hồi sinh các huyền thoại điện ảnh quá cố như Humphrey Bogart để đóng phim bằng AI, và dù chưa biết hiệu ứng sẽ ra sao trên màn ảnh rộng, nhưng trên điện thoại hay các nền tảng nhỏ hơn, công nghệ này chắc chắn sẽ gây sốt.

    Không chỉ là một bước đột phá về công nghệ, OmniHuman còn đưa ByteDance, và theo đó là TikTok, vào cuộc đua tạo ra con người ảo chân thực nhất. Ngày càng có nhiều nhân vật số xuất hiện trên mạng xã hội, từ influencer ảo quảng cáo sản phẩm, quan chức ảo hướng dẫn dịch vụ công, đến các phiên bản nhân tạo của người nổi tiếng để tương tác với fan. Nhưng mối lo ngại cũng đi kèm với tiềm năng này, khi AI có thể bị lợi dụng để tạo ra video giả mạo chính trị hoặc thao túng thông tin.

    Giáo sư Samantha G. Wolfe từ Đại học NYU nhận định rằng khả năng tái tạo giọng nói và cử động từ một bức ảnh là một thành tựu ấn tượng, nhưng đồng thời cũng tiềm ẩn nhiều rủi ro. Một đoạn video AI giả mạo một doanh nhân hoặc lãnh đạo chính trị nói những điều không có thật có thể gây ảnh hưởng nghiêm trọng đến cả một công ty hay một quốc gia. Khi công nghệ AI càng hoàn thiện, khả năng phân biệt thật - giả sẽ càng trở nên khó khăn hơn.

    OmniHuman được ByteDance huấn luyện trên hơn 18.700 giờ video về con người, sử dụng dữ liệu từ nhiều nguồn khác nhau, bao gồm văn bản, âm thanh và tư thế cơ thể. Dù ByteDance chưa tiết lộ chính xác dữ liệu này đến từ đâu, nhưng theo Nager, với lượng video khổng lồ mà TikTok thu thập được, rất có thể chính những video do người dùng tạo ra đang được dùng để huấn luyện AI này.

    Dù OmniHuman không phải là công nghệ AI đầu tiên có thể biến ảnh tĩnh thành video, nhưng điều khiến nó trở nên vượt trội chính là khối lượng dữ liệu khổng lồ mà ByteDance có thể tiếp cận. Với sự phát triển như vũ bão của AI, câu hỏi đặt ra là: Liệu tương lai của video có còn cần đến con người thật hay không, hay AI sẽ thay thế tất cả?

    Tin cùng chuyên mục
    Xem theo ngày