Những ví dụ cho thấy VideoPoet của Google sẽ trở thành đối thủ cạnh tranh đáng gờm của Sora của OpenAI

Người dùng sẽ sớm chứng kiến VideoPoet và những hậu bối của nó sản sinh ra những video chân thực đến kinh ngạc.

Hoạt hóa bức tranh Mona Lisa từ hai hướng dẫn: “Một người phụ nữ quay ra nhìn về ống kính” và “Một người phụ nữ đang ngáp”.

Khi làn sóng trí tuệ nhân tạo sinh chữ đang trên đà ổn định với những sản phẩm đang ngày một hoàn thiện, một làn sóng mới mang tên “mô hình AI sinh video” bắt đầu nở rộ. Tuy nhiên, những mô hình dạng này gặp vấn đề lớn trong việc sản sinh ra một loạt những chuyển động hợp lý trong mắt người xem.

Theo thời gian, những mô hình dạng này sẽ học hỏi được nhiều hơn, qua đó cho ra những sản phẩm chất lượng và chân thật hơn. Cái hay của chúng nằm tại quy trình ra sản phẩm khá đơn giản, chỉ cần khéo léo ra lệnh để AI sinh ra video hay các sản phẩm tương tự. Bên cạnh mô hình AI đương đối đa năng, có thể làm video từ câu lệnh, tạo video từ ảnh hay phong cách hóa video, v.v…

Hiện tại phần mềm Sora của OpenAI thu hút sự chú ý của dư luận khi công bố loạt loạt video sản sinh từ AI chân thực đến ngỡ ngàng, thế nhưng họ không đơn độc trên hành trình nghiên cứu trí tuệ nhân tạo. Google cũng sở hữu dự án tương tự của riêng mình có tên VideoPoet, đã đang phát triển được một thời gian và cũng có những sản phẩm rất ấn tượng.

Theo khẳng định từ các nhà nghiên cứu của Google, hình ảnh đầu vào có thể được hoạt hóa để tạo ra chuyển động, VideoPoet cũng có thể tự điền nội dung thiếu (ví dụ như phục hồi video gốc) hay sản sinh thêm nội dung cho video. 

Còn trong tác vụ phong cách hóa, mô hình AI sử dụng video mô tả độ sâu và hiệu ứng quang học, vốn có thể phô diễn chuyển động, rồi vẽ thêm nội dung lên trên để tạo ra phong cách theo hướng dẫn của người dùng. Dưới đây là sản phẩm sau khi phong cách hóa một video cũng sinh ra từ mô hình AI của Google.

Dựa trên 1 giây cuối cùng trong video, mô hình AI có thể tạo ra video dài hơn thông qua dự đoán nội dung có thể diễn ra trong giây tiếp theo. Lặp lại quá trình này, VideoPoet không chỉ có thể mở rộng video dễ dàng mà còn giữ nguyên dạng các đối tượng xuất hiện trong đoạn clip ngắn.

VideoPoet cũng có khả năng tạo ra âm thanh. Với các đoạn clip dài 2 giây, AI cố gắng dự đoán âm thanh mà không cần hướng dẫn bằng văn bản. Điều này cho phép tạo ra video và âm thanh từ một mẫu duy nhất.

Thông qua VideoPoet, Google chứng minh chất lượng cực kỳ cạnh tranh của các mô hình ngôn ngữ lớn, không chỉ sản sinh nội dung văn bản mà còn tạo video bắt mắt, chân thực.

Kết quả cho thấy tiềm năng hứa hẹn của các mô hình ngôn ngữ lớn trong lĩnh vực tạo video. Trong tương lai, những mô hình AI dạng này có thể sản sinh nội dung dựa trên nhiều hướng dẫn đầu vào, như dùng văn bản tạo ra âm thanh, tạo video từ câu nói, tự động mô tả video, và nhiều ứng dụng khác.

XEM NHIỀU

Adsense và Hướng dẫn chi tiết cho các nhà xuất bản

Adsense là chương trình quảng cáo trực tuyến do Google cung cấp, miễn phí và dễ sử dụng, giúp nhà xuất bản kiếm tiền từ nội dung website, blog, ứng dụng di động hoặc kênh YouTube của họ. Khi người dùng truy cập trang của bạn và nhấp vào quảng cáo được hiển thị, bạn sẽ nhận được hoa hồng.

Nhà hàng lẩu có bia hơi Hà Nội cực ngon tại phố Mẹt, Hữu Lũng, Lạng Sơn

Quán nằm ở ngay trung tâm thị trấn gần bờ hồ huyện Hữu Lũng, bên cạnh không gian xanh, bài trí mộc mạc, quán còn phục vụ bia hơi, có đồ ăn nhanh, lẩu nướng, lẩu truyền thống… giá cả cũng rất phải chăng, nếu có dịp đi du lịch Đồng Lâm, đây sẽ là địa điểm nghỉ chân ăn uống khá lý tưởng.

Công nghệ mới trên điện thoại 6G có thể giúp phát hiện sớm ung thư da

Công nghệ này sử dụng sóng terahertz (THz) để quét da và phân tích cấu trúc của các tế bào da. Sóng THz có thể xuyên qua da và phản xạ lại theo những cách khác nhau tùy thuộc vào cấu trúc của tế bào.

Giải mã ý nghĩa chữ “i” trong tên gọi của điện thoại iPhone

Chữ "i" trong tên gọi iPhone mang nhiều ý nghĩa, được Steve Jobs - đồng sáng lập Apple - chia sẻ khi giới thiệu iMac vào năm 1998. Sau này, iPhone được đặt tên theo cấu trúc của iMac, nên những ý nghĩa đó cũng được áp dụng cho iPhone.

CẬP NHẬT

Cherry – Vị ngon ngọt và những lưu ý khi thưởng thức

Cherry, hay còn gọi là quả anh đào, là loại trái cây được nhiều người yêu thích bởi hương vị thơm ngon và giá trị dinh dưỡng cao. Tuy nhiên, để đảm bảo sức khỏe, bạn cần lưu ý một số điều khi thưởng thức loại quả này.

Ngày Hạ chí – dấu ấn đặc biệt trong vòng tuần hoàn của Trái đất

Ngày Hạ chí là một trong 24 tiết khí quan trọng trong nông lịch, đánh dấu sự khởi đầu chính thức của mùa hè rực rỡ tại bán cầu Bắc. Đây là thời điểm mà Mặt Trời lên đến vị trí cao nhất trên bầu trời, ban ngày dài nhất và đêm ngắn nhất trong năm.

Giải mã những bí ẩn về bộ não con người: Sự thật và lầm tưởng

Bộ não con người là cơ quan phức tạp và bí ẩn nhất trong cơ thể, ẩn chứa vô số điều kỳ diệu mà khoa học vẫn chưa khám phá hết. Tuy nhiên, bên cạnh những kiến thức khoa học chính xác, vẫn còn tồn tại nhiều thông tin sai lệch về bộ não, dẫn đến những hiểu lầm không đáng có. Bài viết này sẽ giúp bạn…

Theo dõi sức khỏe và an toàn bằng Wifi: Phát hiện đột phá từ Delta

Đài Bắc, Đài Loan - 20/06/2024 - Một công nghệ mới đầy hứa hẹn từ Delta, công ty quản lý năng lượng hàng đầu Đài Loan, có thể biến mạng wifi thành công cụ theo dõi sức khỏe và an toàn hiệu quả.

Chia sẻ bộ 214 bộ Font tiếng Việt đầy đủ ký tự cho bảng mã Unicode dựng sẵn

Trên mạng font unicode thì nhiều, nhưng hỗ trợ hết các ký tự tiếng việt thì ít. Trong file .rar bạn chuẩn bị tải về này bao gồm 214 font Unicode có bảng mã tiếng việt đầy đủ, mỗi font một vẻ đẹp riêng, chắc chắn là đủ cho các công trình thiết kế của bạn.

Cảnh giác với dịch vụ “lấy lại tiền bị lừa đảo qua mạng”

Sau khi bị lừa tiền, nhiều nạn nhân tìm đến các “chuyên gia” với mong muốn lấy lại số tiền đã mất. Song một lần nữa, họ lại rơi vào bẫy lừa. Bộ Công an vừa đưa ra cảnh báo với dịch vụ "lấy lại tiền bị lừa đảo qua mạng" của các luật sư "rởm".

Top 5 phần mềm giả lập Android nhẹ nhất cho PC hiện nay (2024)

Giả lập Android là một phần mềm cho phép bạn mô phỏng môi trường hệ điều hành Android trên máy tính hoặc thiết bị khác. Nó hoạt động bằng cách tạo ra một môi trường ảo bắt chước phần cứng và phần mềm của thiết bị Android, cho phép bạn chạy các ứng dụng và trò chơi Android như thể bạn đang sử dụng…

Công nghệ điện toán đám mây là gì ?

Điện toán đám mây (tiếng Anh: cloud computing), còn gọi là điện toán máy chủ ảo, là mô hình cung cấp các dịch vụ điện toán thông qua mạng Internet, thay vì sử dụng hạ tầng máy chủ và phần mềm truyền thống.

Thủ thuật SEO hiệu quả nhất hiện nay cho các trang kiến thức

SEO (Search Engine Optimization) là quá trình tối ưu hóa trang web để xếp hạng cao hơn trong kết quả tìm kiếm của công cụ tìm kiếm như Google. Việc này giúp thu hút nhiều lưu lượng truy cập hơn đến trang web của bạn, từ đó mang lại nhiều lợi ích như tăng tỷ lệ chuyển đổi, nâng cao nhận thức thương…

Hiệu ứng Mpemba: Nước nóng có thể đóng băng nhanh hơn nước lạnh?

Hiệu ứng Mpemba, còn được gọi là nghịch lý Mpemba, là hiện tượng nước nóng đôi khi có thể đóng băng nhanh hơn nước lạnh trong điều kiện nhất định. Hiện tượng này được đặt theo tên của Erasto Mpemba, một học sinh người Tanzania, người đã quan sát thấy hiện tượng này vào những năm 1960.