-
1張照片即可生成高清視頻,中國公司又把好用的數(shù)字人開源了
最后更新: 2025-03-12 17:22:17(文/張睿佳 編輯/張廣凱)
AI開源的風,又刮到了數(shù)字人領(lǐng)域。
3月9日,硅基智能旗下數(shù)字人模型HeyGem.ai宣布開源,截至目前,該模型在GitHub上已獲得超過1.3k Stars。
作為當下AI行業(yè)為數(shù)不多能夠找到PMF(產(chǎn)品市場匹配)的領(lǐng)域,數(shù)字人已經(jīng)讓很多企業(yè)賺到大錢。例如專注海外市場的中國數(shù)字人企業(yè)HeyGen,在去年年中就宣布實現(xiàn)ARR(年度經(jīng)常性收入)3500萬美元。
因此,市面上好用的數(shù)字人產(chǎn)品基本都是付費,開源產(chǎn)品效果相對不佳。
但是HeyGem作為一個非常輕量化的開源免費產(chǎn)品,從演示視頻來看效果非常不錯,其官方簡介也將自己稱為HeyGen平替。
此次開源的HeyGem.ai模型,通過“1秒視頻或1張照片"的輸入,可以實現(xiàn)30秒克隆形象與聲音、60秒生成4K超清視頻,并在復雜場景下仍能保持100%口型匹配及多表情動作輸出,性能達全球TOP級水平。
技術(shù)層面,該模型的推理速度達1:0.5,32幀/秒超高清4K輸出,超越電影級標準。
同時,模型支持Docker一鍵部署,最低NVIDIA 1080Ti顯卡即可運行??梢绘I安裝于Windows和Linux系統(tǒng),在本地實現(xiàn)完整的數(shù)字人克隆和視頻合成,無需額外的算力投入。
值得注意的是,此次硅基智能在GitHub開源硅基數(shù)字人克隆模型的同時,特別提供了硅基數(shù)字人克隆同名軟件安裝包,使得即便是缺乏編程經(jīng)驗的用戶,也能在本地環(huán)境中一鍵安裝并直接使用,實現(xiàn)了零代碼門檻。
正是由于這種高質(zhì)量、低門檻的表現(xiàn),HeyGem.ai被視為首個開源免費的商用級別克隆數(shù)字人模型。對于規(guī)模巨大的電商行業(yè)來說,這無疑是一個新的營銷利器。
那么HeyGem.ai開源且好用的原因何在?
值得注意的是,硅基智能在底層技術(shù)路線上與其它產(chǎn)品有所區(qū)別。
硅基智能成立于2017年8月,總部位于中國南京,早在生成式AI技術(shù)火爆之前就已經(jīng)布局數(shù)字人技術(shù),其底層模型專為數(shù)字人打造,并非Sora這類通用視頻生成模型,在成本端擁有天然優(yōu)勢。
而硅基智能方面也向觀察者網(wǎng)透露,既然選擇開源,就代表了技術(shù)上的自信,意味著公司將來還能夠不斷拿出更好的產(chǎn)品。
硅基智能創(chuàng)始人司馬華鵬表示,硅基智能成立之初就確立了為世界造出1億硅基生命的使命,這次開源就是為了加速這個使命的達成。
事實上,HeyGem.ai并非憑空出現(xiàn),早在2024年5月硅基智能就已率先開源了全球首個2D真人級別、支持AIGC實時渲染的數(shù)字人模型代碼——duix.ai。在GitHub上線以來,已獲得超過4.5k Stars。同年8月,硅基智能推出高保真、實時Face swap算法ReHiFace-S,只需一張照片,無需任何數(shù)據(jù)訓練,一鍵即可將視頻中的臉部替換為你選擇的人物形象。
在實際應(yīng)用中,硅基數(shù)字人克隆能夠通過語音或文字輸入驅(qū)動,克隆后的數(shù)字人音色支持英、日、韓、中、法、德、阿拉伯和西班牙語這8種語言輸出,為跨國企業(yè)、在線教育、影視制作、直播營銷等多場景提供了高效、低成本的解決方案。
但在技術(shù)之外,面對由字節(jié)跳動等大公司推出的即夢、剪映等產(chǎn)品的競爭,對于硅基智能這類垂直企業(yè),以開源方式盡快搶占市場并搭建開發(fā)者生態(tài),或許也是商業(yè)層面必須要做出的選擇。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責任編輯: 張睿佳 
-
字畫古玩造假泛濫,抖音電商去年至今嚴打清退假大師商家超500個
2025-03-12 17:21 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
原字節(jié)跳動AI大將駱怡航履新,出任生數(shù)科技CEO
2025-03-12 17:21 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
蘋果要大改iPhone等OS界面,但不打通
2025-03-12 16:42 觀網(wǎng)財經(jīng)-科創(chuàng) -
被曝剩菜回收再賣,楊銘宇黃燜雞道歉:即刻停業(yè),永久關(guān)店
2025-03-12 16:24 觀網(wǎng)財經(jīng)-消費 -
國產(chǎn)GPU獨角獸再融資,上海國資領(lǐng)投
2025-03-12 16:23 觀網(wǎng)財經(jīng)-科創(chuàng) -
回應(yīng)Manus? OpenAI發(fā)布Agent工具包
2025-03-12 15:56 -
“TikTok難民”撐得起小紅書電商的“美國夢”嗎?
2025-03-12 15:32 -
萬豐奧威子公司擬收購德國eVTOL企業(yè)Volocopter
2025-03-12 15:30 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
原生鴻蒙正式版將上線,神秘新機還是折疊屏?
2025-03-12 10:16 觀網(wǎng)財經(jīng)-科創(chuàng) -
Manus與阿里通義千問達成合作
2025-03-12 09:35 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
印度賺錢印度花,這回輪到特斯拉?
2025-03-12 08:39 -
“新茶飲第一股”四年虧超14億,定位高端蹭“洋品牌”錯了嗎?
2025-03-11 22:46 觀網(wǎng)財經(jīng)-消費 -
證監(jiān)會重磅發(fā)聲:全面啟動實施新一輪資本市場改革
2025-03-11 20:07 金融觀察 -
華為整頓“違規(guī)招聘”, 多名產(chǎn)品線負責人被開除
2025-03-11 18:10 觀網(wǎng)財經(jīng)-科創(chuàng) -
聯(lián)想計劃印度PC全本土制造
2025-03-11 17:35 觀網(wǎng)財經(jīng)-科創(chuàng) -
DeepSeek官方:“R2 將在 3 月 17 日發(fā)布”為假消息
2025-03-11 17:27 觀網(wǎng)財經(jīng)-科創(chuàng) -
騎車抖腿撓屁股,還會縫葡萄,像人類幼崽一樣的機器人來了
2025-03-11 16:57 科技前沿 -
科大訊飛攜手華為,實現(xiàn)基于國產(chǎn)算力的MoE模型推理方案
2025-03-11 16:12 科技前沿 -
《哪吒2》將在歐洲37個國家上映
2025-03-11 16:02 -
兩個月吸金20億,中國機器人創(chuàng)企為何成資本新寵?
2025-03-11 15:17 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
“美國已解除這項對華出口禁令” 評論 271家樂福CEO放話:對中國小包裹,要學特朗普征稅100% 評論 216最新聞 Hot
-
“沒客戶!”獲47億補貼后,三星在美芯片廠推遲投產(chǎn)
-
約翰遜急著表決,民主黨領(lǐng)袖連續(xù)講了6小時,還沒?!?/a>
-
“六代機機密會議,扎克伯格突然闖入”,白宮回應(yīng)
-
8年后,默克爾吐槽特朗普:真裝!
-
美軍評估又變了,“不是幾個月是兩年”
-
“即使特朗普下臺,美國政策也不會變,中日韓要合作”
-
“船到橋頭自然直”,印外長回應(yīng)美議員
-
俄海軍副總司令陣亡
-
“在越南的中國制造商松了一口氣”
-
他倒戈后就躲起來了,電話都不接,同僚評價:聰明
-
“美國已解除這項對華出口禁令”
-
“印軍將全面排查中國產(chǎn)零部件”
-
美國和盟友鬧掰?“本質(zhì)沒變,中國需高度警惕”
-
斯塔默不吱聲,英財相當場落淚,“哭崩”市場
-
家樂福CEO放話:對中國小包裹,要學特朗普征稅100%
-
莫迪表態(tài):金磚是重要平臺
-