Chỉ với một lệnh, AI sẽ tạo ra những video chân thực như thế này

Ngày thất nghiệp hàng loạt diễn viên, đạo diễn đang đến gần: OpenAI ra mắt phim bom tấn chỉ bằng một lệnh

Từ lệnh và mô hình Sora vừa được OpenAI giới thiệu, người dùng sẽ có một đoạn video ngắn dưới một phút, có độ chân thực cao.

Sau “ cơn sốt ” mang tên ChatGPT, OpenAI tiếp tục khuấy động cộng đồng công nghệ toàn cầu khi giới thiệu mô hình Sora có khả năng tạo video ngắn dưới một phút, có độ trung thực cao chỉ bằng vài dòng lệnh.

Trên mạng xã hội X, nhiều người dùng bày tỏ sự bất ngờ với chất lượng video từ mẫu AI mới. Không chỉ hình ảnh chân thực, nhiều đoạn video ngắn còn thể hiện mô phỏng vật lý gần giống với thực tế.

Tom Warren, biên tập viên của The Verge cho biết : “Đây có thể là thời điểm khiến mọi người phải há hốc mồm với AI” .

Tất nhiên, nếu để ý kỹ, người dùng vẫn có thể thấy lỗi trong video. Các video mà OpenAI hiện xuất bản đều rất ngắn, dưới 30 giây, video dài sẽ mắc nhiều lỗi hơn. Tuy nhiên, chỉ với một vài video ngắn, nhiều người dùng đã hình dung được bối cảnh có thể áp dụng Sora như minh họa trong video.

Bên cạnh việc tạo video từ mô tả của người dùng, Sora còn có thể tạo video lấy cảm hứng từ bất kỳ bức ảnh nào hoặc mở rộng các video hiện có hoặc tự điền vào các khung hình còn thiếu.

Sora là một từ tiếng Nhật có nghĩa là bầu trời. Nhóm phát triển công nghệ này, bao gồm các nhà nghiên cứu Tim Brooks và Bill Peebles, đã chọn cái tên này vì nó “ gợi lên ý tưởng về tiềm năng sáng tạo vô hạn”.

Mục Lục Bài Viết

Chất lượng rất chân thực

Trên trang chủ, OpenAI cho biết Sora có thể tạo video dài tới 60 giây với những cảnh quay có độ chi tiết cao, chuyển động camera phức tạp và nhiều nhân vật có cảm xúc sống động.

Mô hình Sora vừa được OpenAI giới thiệu có khả năng tạo các video ngắn dưới một phút, có độ chân thực cao chỉ với vài dòng mã. (Ảnh: OpenAI).

Dưới đây, startup công nghệ minh họa bằng câu lệnh có nội dung: “Thành phố Tokyo đầy tuyết nhộn nhịp. Máy ảnh di chuyển qua con phố nhộn nhịp của thành phố, theo chân một số người đang tận hưởng thời tiết tuyết rơi tuyệt đẹp và mua sắm tại các quầy hàng gần đó. Những cánh hoa anh đào xinh đẹp đang bay trong gió cùng với những bông tuyết.”

Sau khi xử lý, mô hình AI trả về một video đáng kinh ngạc, với hình ảnh không thể nhầm lẫn về thành phố Tokyo và khoảnh khắc tuyệt đẹp khi bông tuyết và hoa anh đào xuất hiện trong cùng một khung hình.

Nếu không nhìn kỹ, người dùng rất khó phân biệt đây là video do AI tạo ra. Camera ảo, như thể được gắn vào một chiếc máy bay không người lái, theo dõi một cặp đôi đang chậm rãi dạo qua khung cảnh đường phố.

Một trong những người qua đường đang đeo mặt nạ. Ô tô chạy ầm ầm trên con đường ven sông ở bên trái và những người mua sắm ở bên phải ra vào một dãy cửa hàng nhỏ.

Sam Altman, CEO của OpenAI đã tạo một video dành cho những người theo dõi với yêu cầu “bài học nấu ăn của bà trong căn bếp kiểu Tuscan”. (Ảnh: Sam Altman).

Đoạn video từ những dòng lệnh cơ bản nhanh chóng thu hút hơn 30 triệu lượt xem trên nền tảng X. Ở phần bình luận, nhiều người dùng tỏ ra bất ngờ trước độ chân thực mà video mang lại.

Khám Phá Thêm: Mặt trời "lỗ" to gấp 4 lần Trái đất, nhìn bằng mắt thường

CNBC tin rằng video có thể là thách thức tiếp theo đối với AI tổng hợp, sau khi chatbot hoặc trình tạo hình ảnh đã thâm nhập thành công vào thế giới người tiêu dùng và doanh nghiệp.

Bên cạnh những người đam mê AI thú vị, công nghệ mới này còn làm dấy lên mối lo ngại nghiêm trọng về sự lan truyền của tin giả, trong bối cảnh các cuộc bầu cử chính trị lớn đang đến gần trên toàn cầu.

Theo dữ liệu từ công ty máy học Clarity, số lượng deepfake do AI tạo ra đã tăng 900% so với năm 2023.

Một giai đoạn đáng báo động cho ngành điện ảnh

OpenAI, công ty đứng sau chatbot ChatGPT và phần mềm hình ảnh Dall-E, chỉ là một trong nhiều tên tuổi lớn trong thế giới công nghệ đang chạy đua để hoàn thiện mô hình tạo video tức thời này.

Vào tháng 2 năm 2023, một công ty có tên Runway đã giới thiệu một công nghệ chuyển văn bản thành video hoàn toàn mới bằng AI.

Nghệ sĩ hiệu ứng hình ảnh Evan Halleck của bộ phim đoạt giải Oscar Everything Everywhere All At Once thậm chí còn thừa nhận rằng các công cụ AI của Runway đã tối ưu hóa tác phẩm của ông.

Đoạn video được AI tạo ra từ mô tả “một người phụ nữ sành điệu đang đi dạo trên phố ở Tokyo”. (Ảnh: OpenAI).

Chuyên gia chia sẻ : “Tôi có thể cắt các ký tự và đặt chúng ngay ngắn trên ảnh chỉ trong vài phút thay vì nửa ngày” .

Các chuyên gia cho rằng ứng dụng AI trong ngành giải trí ngày càng phát triển. Từ sự phát triển của công nghệ deepfake đến AI dùng để tạo kịch bản, trí tuệ nhân tạo đang dần len lỏi vào sản xuất phim.

“Nó nhanh hơn và rẻ hơn lao động. Theo tôi, VFX là một quá trình rất tốn thời gian và công sức. Vì vậy, thật tuyệt khi mọi thứ đều được tự động hóa,” anh tiếp tục.

Khám Phá Thêm: Trong lúc ăn, cô bị đau bụng và chuyển dạ. Bà bầu nói điều gì đó khiến chủ nhà hàng phải tròn mắt, tạo nên câu chuyện cực kỳ lan truyền trên mạng xã hội.

Tờ New York Times gợi ý rằng AI có thể tăng tốc công việc của các nhà làm phim dày dạn kinh nghiệm, đồng thời thay thế hoàn toàn các nghệ sĩ kỹ thuật số ít kinh nghiệm hơn.

Những cảnh quay của Sora chắc chắn rất ấn tượng nhưng đó không phải là tất cả. Wired nhận xét rằng điều đáng ngạc nhiên nhất về mô hình Sora là những khả năng mà ban đầu nó không được đào tạo.

Cụ thể, Sora không chỉ tạo ra những video đáp ứng nhu cầu mô tả của người dùng mà dường như nó còn nắm bắt rõ ràng ngôn ngữ điện ảnh.

Các công cụ AI của Runway đã tối ưu hóa công việc của nhóm hiệu ứng phim Everything Everywhere All At Once. (Ảnh: A24).

Ngoài ra, một tính năng trong Sora mà nhóm phát triển OpenAI không tiết lộ là khả năng tạo video từ một hình ảnh hoặc một chuỗi khung hình.

“Đây sẽ là một cách thực sự thú vị để cải thiện cách kể chuyện. Bạn có thể vẽ chính xác những gì bạn nghĩ trong đầu và sau đó biến nó thành hiện thực”, Tim Brooks, một nhà khoa học nghiên cứu trong dự án cho biết.

Theo Bill Peebles, một nhà nghiên cứu khác của dự án, OpenAI nhận thức được rằng tính năng này cũng có khả năng tạo ra thông tin giả mạo và có thể bị lạm dụng.