自(zì)聊天机(jī)器人ChatGPT火爆以来,微软公司创(chuàng)始人比尔·盖茨已多次公开谈论人(rén)工智能(néng)话(huà)题。在最近的一次采访中(zhōng),他再次表示:“AI可能会让科技(jì)行业迎(yíng)来一次(cì)剧(jù)烈的(de)洗牌”。
这个结论是他在当(dāng)地(dì)时间2月20日接受《In Good Company》节(jié)目专访(fǎng)时提(tí)出的。
他预期,AI的(de)发(fā)展可能会(huì)威胁(xié)到(dào)谷歌的市占率(lǜ),因(yīn)为微软在AI方面的行(xíng)动相当迅速。而最(zuì)终科技(jì)巨头将把AI整合(hé)成用户(hù)的(de)“全能助手(shǒu)”,包揽一(yī)切应(yīng)用,与人们进行沟通并提供建议,可(kě)以取代亚马逊(xùn)、Siri或Outlook等应用(yòng)。
大佬口中全能助手的到来(lái)可能尚(shàng)需时日(rì),但由ControlNet引(yǐn)发的又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话题(tí)热点(diǎn)包(bāo)围中杀出重围。
01
ControlNet颠覆AI绘(huì)画新玩法
AIGC向可控靠近
以AI绘画为代表(biǎo)的(de)AIGC上一次爆火的时候,还(hái)是2022年8月(yuè),在美国(guó)科罗拉多州举办的(de)新兴(xīng)数字艺术(shù)家竞赛中,一幅名(míng)为《太(tài)空歌剧院》的作品获(huò)奖。
随后各大(dà)厂商的AI绘画软件被广大(dà)网友熟(shú)知(zhī)并体验(yàn),Stable Diffusion便是其中代表(biǎo)。
用户们(men)可(kě)以在应用(yòng)中输(shū)入(rù)一(yī)组关键词或者一张照(zhào)片(piàn),就能获得一幅(fú)AI创作的画作。
作画的关(guān)键就是所(suǒ)输入的文本(běn)。同(tóng)一(yī)组关(guān)键词也可以创作出很多张风格不(bù)一(yī)样的画作,这让创作的过程(chéng)就(jiù)像开盲(máng)盒。
很多用户很喜欢(huān)这种不确定的惊喜,他们会将生成的美(měi)图(tú)当做头像。而(ér)另一部分喜欢翻看AI绘(huì)画的“翻车”作品。在(zài)社交(jiāo)媒体上,许多用户分享AI“翻车现场”,例如,一位(wèi)网友(yǒu)的小狗照片被AI画成了“肌(jī)肉男”,还有(yǒu)网友(yǒu)的个人照(zhào)片被AI识别(bié)成了建筑(zhù)。
而如今随着ControlNet的出(chū)现与加持,以(yǐ)往AI绘画的填写关(guān)键词游戏可能(néng)要被颠覆了。
ControlNet是一位正在(zài)斯坦福读博的中(zhōng)国人张吕(lǚ)敏(mǐn)创作的一种基于控制(zhì)点的图像变形算法(fǎ),主要(yào)用于数(shù)字图像(xiàng)处理、计算机视觉和计算机图形学等领域(yù)。
其(qí)SD插件一(yī)经发(fā)布,在(zài)短短的(de)两天(tiān)内便成(chéng)为了AI绘画领(lǐng)域最(zuì)新的热点(diǎn)。
在(zài)此之(zhī)前,大(dà)家用(yòng)了很多方(fāng)法想让AI生成的结果(guǒ)尽可(kě)能的符合(hé)要求,但是都不尽(jǐn)如人意,它的出现代(dài)表(biǎo)着AI生成开始进(jìn)入真正的可控(kòng)时期。
因为ControlNet可(kě)以(yǐ)直接(jiē)提取画面的构图(tú),人(rén)物的姿势(shì)和画(huà)面的深度信息等。有了它的帮助(zhù),就不用频繁(fán)的用提示词来碰运气,抽盲盒式的创作了。
通俗(sú)的说ControlNet相当于给AI绘(huì)画(huà)加了(le)“魔法”,不少博主的作品已经获得了大(dà)量的浏览量,“viggo”就是其中之一,他用(yòng)朋(péng)友的照片(piàn)直接带她(tā)们(men)走进(jìn)动漫世界。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插(chā)件拓展找(zhǎo)到(dào)对应的关键词;最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试效果。
通过图片就可以看出来,效(xiào)果十分(fēn)惊艳。
更厉害的是,除了真实的照片(piàn),草图也可以加上“魔法”,知乎(hū)大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线稿转(zhuǎn)全彩图。大神(shén)张吕(lǚ)敏(mǐn)其本尊(zūn)也亲自回(huí)应(yīng)。
不得不说(shuō)当下AIGC已经变(biàn)得越来越强大,甚(shèn)至输出的作(zuò)品都已(yǐ)经能以假乱(luàn)真了。
02
难辨虚实(shí),AIGC技术力爆发
警(jǐng)惕(tì)安全问题
近日(rì),“苏州金(jīn)鸡湖(hú)有游艇(tǐng)party”的消息火遍网络,而经(jīng)过警(jǐng)方辟谣这所谓(wèi)的“party”可能(néng)是全国第(dì)一起AI绘图(tú)诈骗(piàn)。
由于这个活(huó)动里面给出的美女(nǚ)照片都是(shì)AI制作的真(zhēn)人照片绘图,因为太逼真,被大(dà)家当(dāng)成真事传播(bō)了。
不(bù)过仔细观察可(kě)以发现,活动发起者提供的照片中(zhōng)有个很大的漏洞可以发现并非(fēi)真人(rén),而是AI绘图,那便是(shì)图(tú)片(piàn)中(zhōng)女性的手指部分(fēn)有的存在异常。
有行(xíng)业人事表示:“现在(zài)因(yīn)为手(shǒu)指(zhǐ)部分的绘画算法比较复杂(zá),AI还不太会画(huà)人的手,但(dàn)最新看(kàn)到的图片已经(jīng)有越来越(yuè)完(wán)美的AI模(mó)型出现(xiàn),以后可(kě)能就完全没有漏(lòu)洞了。”
类似的(de)AI作图诈骗(piàn)在国外也已有发生。据(jù)英国广(guǎng)播(bō)公司报道,土耳其地震期间,有(yǒu)Tiktok用(yòng)户使用AI合成了儿童受灾的假照片(piàn)发布到(dào)网络(luò),以(yǐ)此(cǐ)诱骗善(shàn)良的人打赏“捐助”从而实施诈(zhà)骗(piàn)。
目前随(suí)着技术发(fā)展,AIGC已经能做(zuò)出真人照片般(bān)的(de)绘图效果,如果这样(yàng)的图片(piàn)被(bèi)用来诈骗,将(jiāng)非常可(kě)怕。
此外AIGC还引发了很多担(dān)忧,一(yī)方面,批判者认为(wèi)AI在(zài)“学(xué)习”了大量(liàng)前人的作品之后,其创作没(méi)有任何情绪和灵魂,难以和人类(lèi)的艺术(shù)创作相提并论。
另一方面(miàn),AIGC背后(hòu)的版权、目(mù)前都并没(méi)有得(dé)到有效的解决,还(hái)有AIGC会不会代替人类(lèi)“至(zhì)高无上”的创意(yì)。
马(mǎ)斯克(kè)也(yě)强调,人工智(zhì)能(néng)的安全问(wèn)题(tí)需要得到(dào)重视(shì),太晚就来不(bù)及了。
03
AIGC下(xià)一(yī)站除了视(shì)频,还有(yǒu)远(yuǎn)方
技(jì)术都是有(yǒu)两面性(xìng)的,潜在的(de)危害并不能(néng)掩盖其光辉的(de)贡献。现在看来,人工智能(néng)技(jì)术将是第四次工业革命的核心驱动力量(liàng),将创造新的(de)增长奇迹。
过去一年(nián),人工智能在技术和商业层面都有了巨大进(jìn)展,AI绘画(huà)就(jiù)是人工智能技术发生方(fāng)向(xiàng)性改变的一个代表。其下(xià)一站或许就是视频。
此前(qián),Meta和(hé)谷歌先后发(fā)布(bù)了(le)几条引爆(bào)科技(jì)圈(quān)的短视频。这些视频引发(fā)关注并(bìng)非(fēi)内容(róng)做得多优秀(xiù),反而都非常(cháng)简(jiǎn)单,比如一匹正在(zài)喝水的(de)马,一只画画的玩具熊,或者一段骑摩(mó)托(tuō)车(chē)的(de)第一视角(jiǎo)录像,随便一个有(yǒu)手机的人都可以随(suí)手录下(xià)一段(duàn)。
但(dàn)这些(xiē)短视频的创作方式非常简单,创作者(zhě)仅仅(jǐn)需(xū)要向AI输入一(yī)段话,甚(shèn)至只是说一下要求(qiú),AI就可以(yǐ)根据需要生成一段视(shì)频(pín)。
谷(gǔ)歌发布的两个AI生成视频分别来自于(yú)Imagen Video和Phenaki,前者(zhě)主(zhǔ)要突出的(de)是(shì)高清,与Meta的Make-A-Video没有太多的(de)差(chà)别。
在Make-A-Video公布了AI生成(chéng)的视频后,AI圈就已(yǐ)经玩了一波(bō)梗,一个能够做(zuò)出更高清(qīng)视频的AI还不足以在短时间内戳(chuō)中(zhōng)兴(xīng)奋点。
Phenaki更(gèng)加令(lìng)人震(zhèn)惊的地方在于,它可以制作出超过2分钟的连(lián)贯(guàn)的也有确切内容的视频,这才是(shì)真正(zhèng)让人们感到(dào)惊(jīng)喜的地方。因为无论AI生(shēng)成的(de)视频多(duō)么高(gāo)清,也(yě)只能(néng)是为内容生产(chǎn)者提(tí)供一个(gè)灵感,一(yī)个素(sù)材(cái),一个过场(chǎng)动画。
不(bù)过能够制作出有具体剧情内容(róng)的视频(pín)就意味(wèi)着,一些视频创作(zuò)由AI代替人工完成已经初步有了可能。
当(dāng)下(xià)AI的发展(zhǎn)速度已经超(chāo)过大部分人的想象(xiàng)。内容产业的本质是供(gōng)给创造(zào)需求,AIGC作(zuò)为(wèi)全新的内容(róng)生产方式,可以为内容产业(yè)带来(lái)更(gèng)新(xīn)的内容(róng)风格、更(gèng)快(kuài)的生(shēng)产速度,更(gèng)低的(de)生产成本,这无疑会驱动内容产业的(de)大爆发。
除(chú)了AI绘图、视频,AIGC技术还(hái)能应用于音乐、代码(mǎ)、机器人动作等多(duō)种内容形式的生成。不难发现该项(xiàng)技术(shù)不仅(jǐn)在游戏等行业能得(dé)到有(yǒu)效应用,对(duì)于下一代互联网(wǎng)各种元素的构建亦有关(guān)键意义(yì)。
从商业化(huà)的角(jiǎo)度(dù)来看,文(wén)化娱(yú)乐、教育、传媒等诸多领域,本身就(jiù)对基于AI的可视(shì)化(huà)内(nèi)容有强(qiáng)烈需(xū)求。
因此,AI绘画及视频或不是结果,而只是AI进程中的一块重要拼图,有望在技(jì)术(shù)更新的加持下实现更(gèng)大的应用价值(zhí)。
AI从理解内容,走向了可以生成(chéng)内容,甚至能够创造(zào)出独立价值和独立(lì)视角的内(nèi)容。AIGC的(de)再次出圈(quān),更代表着未(wèi)来(lái)的先(xiān)进生产力即将到来(lái)。
04
紧抓大模型(xíng)与算力,牢固(gù)AIGC底座
从技术(shù)的(de)发展也可以看出,在语言大(dà)模型、图像(xiàng)大模型之后,多模态大模型已经成为了新的趋势。
大模型被誉为(wèi)当前人工智能发(fā)展的智(zhì)能(néng)底座,是(shì)全(quán)球竞争最(zuì)激烈的研究方向之一,包括(kuò)谷(gǔ)歌、亚马(mǎ)逊、百度、阿里(lǐ)、腾讯等众多头部(bù)企业都在(zài)竞相发力(lì)。
不过训练大模型的确(què)价格不菲(fēi),以(yǐ)国盛证券发布的(de)《ChatGPT需要多(duō)少算力》报告估算,GPT-3训练(liàn)一次的成本约为140万美元。而(ér)对于一(yī)些更大(dà)的LLM(大型语言模型),训练成本则介于(yú)200万美元至1200万(wàn)美元高价(jià)之间。
以ChatGPT在2023年1月的独立(lì)访客(kè)平均数1300万计(jì)算,其对应芯片需(xū)求为(wèi)3万多片(piàn)英伟(wěi)达A100 GPU,初(chū)始投(tóu)入成本约为8亿美(měi)元,每日仅电费就在(zài)5万(wàn)美元左右。
此(cǐ)外(wài)不论是ChatGPT还(hái)是AIGC,都离不开庞大(dà)算力(lì)支持。在(zài)关注各类大模型的发(fā)展同时,更应(yīng)该关阿富汗改名现在叫什么注算力网络的建(jiàn)设。
算力网络正驱动AI产(chǎn)业发展进入史诗(shī)级加速进程(chéng),让AIGC及(jí)通(tōng)用AI这(zhè)一人工(gōng)智能发(fā)展的终极目标离得更近。
因为(wèi)算力可以对突(tū)破性(xìng)技术创(chuàng)新提供大力(lì)的支持。这方面,多(duō)模态大模型是典型。作为面(miàn)向未来强人工(gōng)智(zhì)能、通用人工智能的(de)重要技(jì)术(shù)创新,多模态大模型已经在人工(gōng)智能领(lǐng)域提出了很多年,业界(jiè)也有(yǒu)不少技术突破,但是,多模态大模型(xíng)进(jìn)一步(bù)往下走,算(suàn)力需(xū)求呈(chéng)几何(hé)式(shì)上(shàng)升,一般的算力基(jī)础设施很快将难(nán)以胜任。
从图像、文字、语音单独(dú)一(yī)项的训练(liàn),到双模(mó)态、三(sān)模态的(de)跃迁,让人工(gōng)智能(néng)可以灵活应对不同模态的转化、像人与世界交互一样自然,这方面,由算力网(wǎng)络来驱(qū)动(dòng)将有明显优(yōu)势。
此外(wài),还有很多需要(yào)爆发(fā)式增长的算力来支(zhī)撑的技(jì)术创(chuàng)新,将在(zài)人工智能(néng)算力网(wǎng)络支撑(chēng)下快速推(tuī)进。
AIGC已(yǐ)经(jīng)露出(chū)曙光,期待在(zài)大模型(xíng)和大算力的(de)支持下AIGC能持续颠覆内容生产的方式,将创造的边(biān)际成本降低,让万众受益。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了