很多科技界的老饕都还记得,2021年4月举办的NVIDIA的GTC线上峰会,英伟达(NVIDIA)创始人兼CEO黄仁勋变身主厨 ,将发布场地挪到了自家厨房 。超过一个多小时的发布会中,其中有14秒的画面中,老黄的厨房、标志性的皮衣,甚至他的表情、动作、头发……全都是合成出来的数字人和背景。当时业界一片哗然,大呼被老黄“骗了三个月居然没发现!”
但随着AIGC技术的快速发展,到今天,无论多么真实的数字人表演,14秒的时长都已经不够满足观众们的胃口了。那么各位观众和老司机,一小时三十分钟的长度,恰似一部电影的长度的真人数字人表演够不够?老黄的厨房注定要被囿于昼夜与爱,那么星际科幻大片和防暑降温小贴士一起出现够不够?
7月27日14点,中国北京,天气温度适中,没有炎日,适合出门。东三环边上的康莱德酒店,“新视界·新壹视频大模型发布会”的蓝色系主视觉,科技感十足。在接下来不到两个小时的时间里,这里,将会发生改变视频创作的里程碑事件。
(相关资料图)
观众还没进到会议内场,就被场外两块屏幕吸引难以移步。数字人的对话、互动并不鲜见,但与3D数字人对话的流畅程度、语音语义的理解程度,能否解决复杂多变的实际应用场景的问题能力,甚至数字人的形象设计,都是给观众留下深刻印象的关键因素之一。
以往科技圈开发布会,都是以“自嗨”的形式来推进的。但这次却一反常态,还在暖场时段,李冰冰、黄晓明、贾乃亮、王祖蓝、龚俊、杨超越等20多位当红演艺圈明星都发来祝福和关注的视频,祝福的话各有不同,但他们都共同提到了“新壹视频大模型”,到底是何方神圣?
会议开始,更出人意料的场面出现了。没有美女帅哥主持人身着华丽的礼服出场,也没有幽默风趣的主持人给现场助兴,但每个观众的脸上从发布会开始的第一秒钟开始就都充满着不可思议的表情——全世界第一场由真人数字人作为全程主持人的发布会就此诞生了。
新壹科技创始人、董事长韩坤和他上百位从四面八方赶来的朋友们,以及几百位慕名而来的媒体和用户齐坐在台下,“大家好,我是你们的老朋友韩坤,我正以数字人的身份出席这场发布会,并担任主持人。虽然我是个冰冷的数字人,但我还是能够体会到比这个夏天北京天气更热烈的现场气氛。”全场掌声雷动。
从主持人的专业性要求来说,这个开场白有些平淡,但了解韩坤和他的团队在过去几年经历的人都明白,这一刻的平淡下面,是何等的激潮澎湃。据内部员工透露,看到韩坤数字人主持人开口说话的一刻,“以为就是给他本人真人录的视频而已。”
为了稳妥,担心受到网络、硬件、以及其他不可控因素的影响,技术团队曾建议在发布会现场和其他公司一样,展示一些demo和视频文件即可,“很多大厂都这样”,大家如是说。但韩坤大手一挥,当场拒绝,“要做就来真的!”。
台下的韩坤真人本人面色平静,神态自如,但目光如炬,此刻他仿佛站在视频+AI的时间坐标轴上,回顾从前是成就和辉煌,抬头远眺是光荣和梦想。
在由韩坤的数字人主持人介绍引导之后,终于轮到他本人登台演讲了。他和他的团队,在过去将近20年的时间里深耕视频行业引领视频行业趋势,20年的团队技术积累终于把创造力赋予了机器,20年来亲眼见证从PGC、UGC到AIGC视频生产力变革,韩坤用他特有的平稳的语调娓娓道来,并没有太多情绪上的波动,仿佛一切就是顺其自然而已。
截至7月底,2023年中国已经发布过100多个大模型,仿佛不发大模型,就没资格上牌桌一样。这种情况下,韩坤直接把目光落在了面向垂直场景、解决垂直需求的垂直大模型上面。
韩坤邀请了好几位好朋友一起登台发布新壹视频大模型,这是中国第一个聚焦在视频领域的大模型,是以视频生成为核心的多模态AIGC模型。“新壹视频大模型它不仅仅是一个工具,更是一个理解你、理解视频、理解美学的艺术家。”韩坤表情平静,淡淡地微笑,平静地介绍。
随后能让韩坤真正激动的时刻终于到了。从事了将近20年视频行业的工作,韩坤还没有过当导演的行动,但这次,出于对《流浪地球》的喜爱以及对新壹视频大模型的信心,韩坤当场宣布要拍一部《流浪星球3》。不用撸袖子,他直接就对着全场观众演示起如何通过新壹视频大模型来创作一部科幻大片的。
韩坤对着新壹秒创平台对话框输入了几个关于人类驾驶地球、驶离太阳系并遇到危险的关键词,新壹视频大模型的AI帮写功能立刻就生成了一段脚本,速度和内容都让连台下坐着的一位编剧叹为观止。
韩坤介绍,脚本会在新壹视频大模型里面进行一个图片的训练,然后大模型会完成脚本生成成分镜头的图片。随后韩坤表示想要一段有交响乐感觉的配乐,很快AI也替他完成了,韩坤很满意。随后就是见证奇迹的时刻了。
短短不到5分钟,一部将近一分钟时长的宇宙科幻大片《流浪星球3》的预告片就完整地呈现了在现场观众面前。
全场观众掌声雷动,全新创作的短片,人物表情自然,动作流畅,场景变化也非常壮观,完全是为真正的《流浪地球3》做了一次预演。要知道,放在传统的电影工业来说,编剧、导演、演员、特效制作、灯光、美术、拍摄、剪辑、配音、配乐……普通人的科幻梦是遥不可及的。
韩坤表示,新壹视频大模型实现了从脚本生成,到AI作图、AI视频、AI音乐,再到智能剪辑配音的AI全流程视频创作。让每个人都能实现高质量、高效率、低成本、无门槛的视频创作。
除了创作《流浪星球3》这样的科幻大片,通过新壹视频大模型的秒创平台,也可以创作像夏日防暑这样的适合在朋友圈去分享的这种视频小贴士。随后新壹科技CEO雷涛在现场直接演示起了如何在短短不到5分钟的时间里,从一段简单的文字描述生成一段夏日防暑避暑小秒钟的视频制作。
其AI帮写功能可以快速地把作者想法变成文章(脚本),随后秒创就开始用把这些文案分成若干个片段,每个片段则匹配一个视频,随后就到了一个视频的草稿。随后,可以根据创作者个人喜好,分别可以加入数字人播报,对片段素材进行AI作画的优化、或者对片段素材进行AI制作视频,以及还可以调背景音乐、配音等等,如此之后,就可以生成一段完整的视频了。
类似这样的视频如果去剪辑可能要花上几个小时的时间,但是现在通过秒创几分钟就可以完成,为了达到这个效果,秒创除了提供图片、视频、声音、数字人生成等AIGC的功能以外,还提供了一个千万级结构化视频库为用户提供匹配服务。
对于头部大厂还在发布会现场放录制视频或者Demo,新壹科技的发布会则凸显一个真实实时演示。使用基于新壹视频大模型的秒创平台可以极大地提高视频创作者的工作效率,降低创作的门槛,这也使创作者从繁琐的体力劳动中解放出来,从事真正有创造力的工作。
而在前文提到的英伟达黄仁勋的厨房发布会上仅仅展示的14秒特效,则是由几十个工程师经历3个多月才完成的。要造“假的老黄”,得到摄影棚里拍上几千张各种角度的照片,通过一套3D扫描把他脸上的每道褶子都采集成数据。
而韩坤介绍,通过多模态的合成,新壹科技可以将真人录制的视频和音频素材,快速生成2D写实数字人,基于新壹视频大模型可以在24小时之内完成一个数字人的训练。
此外,新壹数字人平台也可以选择各种风格的3D形象,3D数字人更适合去制作直播、实时交互场景。3D数字人设计自由度更高,同时它支持丰富的表情动作,而且通过算法可以去驱动它的根据上下文语境去调整表情和动作,让交流更加生动有趣。雷涛现场演示了推荐最近上映的电影,以及北京秋天的穿衣建议,让在场观众近距离、生动地体会到数字人带来的全新互动体验。
而从14秒到一分钟,再到数字人主持人主持一场长达一个半小时的发布会,体现了AIGC技术的大爆发,也体现了韩坤和他的新壹科技团队深厚的AI技术积累和对视频业务的精深掌握。
数字人并不是仅仅是一个娱乐工具,或者一个简单的对话体验,未来几年所有活跃在互联网上的人都会拥有自己的数字分身,每个人都可以打造一个自己的虚拟IP。随着元宇宙在产品技术端的突破和需求端的释放,数字人将正式迎来爆发式增长。
正是基于对数字人产业的极大信心,新壹科技还在发布会现场推出了一款明星数字人产品——秒祝。秒祝通过对于明星视频进行训练,将明星的形象和声音完美还原出来,生成对应的明星数字人形象,最终呈现给用户的是以明星数字人为主角的个性化定制的祝福视频。
海外市场,2017年创办的Cameo在2020年已吸引了超过4万“名人”入驻,平台年交易额超过1亿美元,年增长率超过450%。基于近20年视频行业资源的积累,新壹科技和国内大部分明星都有合作和信任基础,在发布会开场之前的暖场视频中,就有李冰冰、黄晓明等20多位明星发来了祝福视频。有了这样的资源基础,新壹科技在秒祝产品上取得进展和突破,只是时间问题。
秒祝通过帮助明星和粉丝建立联系,从而构建了新型的明星与粉丝的关系,通过秒祝平台粉丝只要支付少量的费用就可以购买明星个性化的祝福视频。
而对于企业用户来讲,数字人祝福或者是数字人代言这样的成本比请明星真人便宜的多,它的交付也要便捷和稳定得多。明星数字人产品的应用场景也将延伸到会议、活动、广告销售等等,能够为明星和企业创造更大的价值。
看起来极为简单的操作,其背后却是韩坤和他的新壹科技团队多年苦练内功厚积薄发的小片段。事实上,他们在人工智能领域的探索最早可追溯到2018年以前,彼时他们通过一下科技的自有内容平台,积累了海量的音视频数据和视频业务经验。
2020年底,韩坤和他的团队就将研发重心转向AIGC视频生成领域,定位也从专注移动视频应用的公司,转向以视频为核心应用场景的人工智能公司。
了解韩坤和他的团队的人都知道,新壹是在一下科技的基础上新建的,这样决定了新壹科技绝非是一匹黑马突然出现在世人面前,而是以一家在视频领域有深厚积累的头部企业的身份重新回到公众视野中来。
从韩坤创办的酷六网成为第一家在纳斯达克上市的视频网站,到一下科技时期秒拍开创互联网产品一周连续三次登陆《新闻联播》的纪录,再到秒拍和一直播同时拿下短视频和直播全网用户渗透率第一名,以及曾经成为国内最大的视频生产平台、牢牢占据免费应用下载排行榜的榜首10多天的小咖秀,韩坤和他的团队本身就是一段将近20年来不断创造视频行业奇迹、一直引领视频行业趋势的传奇。
尽管一下科技曾遭遇挫折,但韩坤和他的团队没有消沉,反而义无反顾投入到AIGC视频的业务中来。四年来的卧薪尝胆,沉默砺剑,如今光寒十四州。韩坤对此如是说:
“这是我们新的开始,我们把释放AIGC视频生产力作为公司新的定位,这也是公司要达成的首要目标。我们的团队起了新壹这个名字,是因为我们决定是从零到一去新建,之所以这样决定不是因为它容易,而是这样做最难。我们的决心和信心源自这次新建不是在零的基础上新建,而是在过去无数次一下一下敲击键盘积累代码、一点一点积累技术、一帧一帧完善视频产品、一秒一秒与时间赛跑的基础上新建。零是我们对于过去取得辉煌的态度,壹是我们对于未来不胜不归的决心。”
随着对于释放AIGC视频生产力目标的确立,韩坤认为,新壹团队已经成为一支有新的思想、更加有战斗力的团队。他明确指出:“AIGC会彻底改变我们的未来,未来,谁用AI多谁厉害,这次我相信我们将再次引领时代趋势,继续引领产业进步和发展,我们的新征程、新团队、新开始,一定会成功。”
如前文所述,这次新壹科技的新发布,乃是厚积薄发。根据当场披露的研发规划路线图,新壹科技清晰构建了一个生态,即基于新壹视频大模型的推出以秒祝和数字人为代表的AIGC平台,在多个不同的垂直场景里面提供产品和服务,覆盖B端和C端用户。接下来公司还将发布一个面向政务的垂直模型平台。
今天的视频产业将通过AIGC实现飞跃,目前互联网80%的流量都是视频流量,但只有20%的内容实现了视频化,剩下80%的内容的视频化将由AIGC完成,新壹视频大模型出现是正当其时。
中央电视台导演、国家一级编剧夏蒙在现场感慨地表示,“之前拍摄一部纪录片,从拍摄到制作,周期要超过半年。在AI科技面前,我觉得我们的努力有时候不堪一击。我唯一相信的是美是不会改变的,无论我们科技怎么发达,它都需要记录者。但AI的兴起一定会颠覆现有的影视的格局,无论如何我们阻挡不了AI前进的脚步。”
AI前进的脚步就是由新壹科技这样的企业一步一步走出来的,让我们拭目以待,新壹科技,新的开始,壹定成功。
责任编辑: