真情服務  厚德載物
      聯(lián)系我們

      市場部:0564-3227239
      技術部:0564-3227237
      財務部: 0564-3227034
      公司郵箱:lachs@126.com
      技術郵箱:cc1982@163.com
      地址:六安市淠望路103號

      新聞分類
      推薦新聞
      當前位置:首 頁 > 新聞中心 > 業(yè)界動態(tài) > 查看新聞
      字節(jié)跳動展示 OmniHuman 多模態(tài)框架:圖片 + 音頻 = 逼真動畫,半身全身均可生成
      作者:永辰科技  來源:IT之家  發(fā)表時間:2025-2-7 8:07:42  點擊:160

      字節(jié)跳動的研究人員近日展示了一款 AI 模型,可以通過一張圖片和一段音頻生成半身、全身視頻。

      字節(jié)跳動表示,和一些只能生成面部或上半身動畫的深度偽造技術不同,OmniHuman-1 能夠生成逼真的全身動畫,且能將手勢和面部表情與語音或音樂精準同步。

      字節(jié)跳動在其 OmniHuman-lab 項目頁面發(fā)布了多個測試視頻,包括 AI 生成的 TED 演講和一個會說話的阿爾伯特 愛因斯坦。

      在周一發(fā)布的一篇論文中,字節(jié)跳動指出,OmniHuman-1 模型支持不同的體型和畫面比例,從而使視頻效果更自然。

      據(jù)了解,字節(jié)跳動表示,OmniHuman-1 模型基于約 19000 小時的人類運動數(shù)據(jù)訓練而成,能夠在內(nèi)存限制內(nèi)生成任意長度的視頻,并適應不同的輸入信號。

      研究人員還表示,OmniHuman-1 在真實性和準確性方面,超越了其他同類動畫工具。目前,該工具暫不提供下載或有關服務。

       
       
       
      合作伙伴
      華為 | 微軟中國 | 聯(lián)想集團 | IBM | 蘋果電腦 | 浪潮集團 | 惠普中國 | 深信服 | 愛數(shù)軟件
      六安市永辰科技有限公司 版權所有 © Copyright 2010-2021 All Rights 六安市淠望路103號 最佳瀏覽效果 IE8或以上瀏覽器
      皖公網(wǎng)安備34150102000370號

      訪問量:3196310    皖ICP備11014188號-1
      国产日韩欧美亚洲,免费AV一区二区三区播放,国产亚洲日韩欧美日本,欧美精品二三区