橘子百科-橘子都知道橘子百科-橘子都知道

夏朝距今多少年,夏朝距今多少年2022

夏朝距今多少年,夏朝距今多少年2022 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人ChatGPT火爆以来,微软公司(sī)创始人比尔·盖茨已多次公开谈论人(rén)工智能话题。在最近的一次夏朝距今多少年,夏朝距今多少年2022采访中,他再次表示:“AI可能会让科技行业(yè)迎来一次剧烈(liè)的洗牌”。

这个(gè)结(jié)论是他在当地时间2月20日接受《In Good Company》节目专访时提出的。

他预期,AI的发展可能(néng)会威胁(xié)到谷歌的市(shì)占(zhàn)率,因为微(wēi)软在AI方面的行动(dòng)相当迅速。而(ér)最终科技巨头将把AI整合成用户(hù)的“全(quán)能助手”,包揽(lǎn)一切应(yīng)用,与人们进行(xíng)沟通并提供建议,可(kě)以取代亚马逊、Siri或Outlook等应用。

大佬口(kǒu)中全能助手的(de)到(dào)来可能尚需(xū)时日,但由ControlNet引发的又一次AI绘画浪潮(cháo),让AIGC在ChatGPT的话题热点包围中杀出重围(wéi)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入(rù)可控期,将洗牌科技(jì)行业?_黑料正能(néng)量

01

ControlNet颠(diān)覆AI绘画新玩法

AIGC向可(kě)控靠近(jìn)

以AI绘画为代表的AIGC上一次爆火(huǒ)的时候,还(hái)是2022年(nián)8月,在美国夏朝距今多少年,夏朝距今多少年2022科(kē)罗(luó)拉多州举办的(de)新兴数(shù)字艺术(shù)家竞(jìng)赛中,一幅名(míng)为(wèi)《太(tài)空歌剧(jù)院》的作品获奖。

随后各(gè)大(dà)厂商的AI绘(huì)画软件(jiàn)被广(guǎng)大网友熟(shú)知并体验(yàn),Stable Diffusion便是其(qí)中代表。

ChatGPT之后又(yòu)一应用杀疯(fēng)了(le),AIGC或(huò)进(jìn)入可控期,将洗牌科技(jì)行业?_黑(hēi)料正能量

用户(hù)们可以(yǐ)在应用中输入(rù)一组关键词或者(zhě)一张(zhāng)照(zhào)片,就能获得(dé)一幅AI创作的画作(zuò)。

作画的关键就(jiù)是所(suǒ)输入的文本。同一组(zǔ)关键(jiàn)词也可以创作(zuò)出很多张(zhāng)风格(gé)不一样的画(huà)作,这(zhè)让(ràng)创作的过程就像开盲盒(hé)。

很多用(yòng)户很(hěn)喜欢这种不(bù)确(què)定的惊喜,他(tā)们会将生成(chéng)的美图当做头像(xiàng)。而(ér)另(lìng)一(yī)部分喜欢翻(fān)看AI绘(huì)画(huà)的“翻车”作品。在社交(jiāo)媒体上,许(xǔ)多用户分享AI“翻车现场”,例(lì)如,一位网友(yǒu)的(de)小(xiǎo)狗照(zhào)片被AI画成了“肌肉男”,还有(yǒu)网友的个人照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出(chū)现与加持,以(yǐ)往AI绘(huì)画的填写关键词游(yóu)戏可能要被(bèi)颠覆了。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

ControlNet是一位正在斯坦福读博(bó)的中(zhōng)国人张吕敏创作的一种基于控制点的(de)图像(xiàng)变形算(suàn)法,主要用于(yú)数(shù)字图像(xiàng)处理、计(jì)算机视觉(jué)和计算机图形学(xué)等领(lǐng)域。

其SD插件一经发(fā)布,在短短的两天内便(biàn)成(chéng)为了AI绘(huì)画领域最新的热点。

在此之前(qián),大家用(yòng)了很(hěn)多方(fāng)法想让AI生成的结(jié)果尽可(kě)能的符合要求,但是都不尽如人意,它的出现代表着AI生成开始进入真正的可(kě)控时期。

因(yīn)为ControlNet可(kě)以直接提(tí)取画面的构图,人物的姿势和(hé)画面(miàn)的深度信息(xī)等。有了它的帮助(zhù),就不用频繁的用(yòng)提示(shì)词来碰运(yùn)气,抽盲(máng)盒式的创作了。

通(tōng)俗的说ControlNet相(xiāng)当于(yú)给AI绘画加了“魔(mó)法”,不少博主的作(zuò)品(pǐn)已经获得了大量的浏览量,“viggo”就是其中(zhōng)之一,他用朋友的(de)照片(piàn)直接(jiē)带她(tā)们走进动漫世界。

ChatGPT之后又(yòu)一(yī)应(yīng)用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技(jì)行(xíng)业?_黑料正(zhèng)能量

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插(chā)件拓展找到对应的关键(jiàn)词;最(zuì)后用(yòng)ControlNet插件(jiàn)绑(bǎng)定骨骼开始(shǐ)换关键(jiàn)词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可(kě)控期(qī),将洗牌科(kē)技行(xíng)业?_黑料正能量

通(tōng)过图片就可以看出来,效果十分惊艳。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或(huò)进入可(kě)控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量(liàng)

ChatGPT之(zhī)后(hòu)又一应用杀疯(fēng)了,AIGC或进入(rù)可控期(qī),将洗牌科技行业(yè)?_黑料正能量

更(gèng)厉害的是,除了真实的照(zhào)片,草图也(yě)可以加上“魔法(fǎ)”,知乎(hū)大(dà)牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线(xiàn)稿转全彩图。大(dà)神张(zhāng)吕敏其(qí)本尊也亲自回应。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行业?_黑料(liào)正能量

不得不说(shuō)当下AIGC已(yǐ)经(jīng)变得越来越强(qiáng)大(dà),甚(shèn)至输(shū)出的作品都已(yǐ)经能(néng)以假乱真了。

02

难辨虚实,AIGC技术力爆(bào)发

警惕安全问题

近日,“苏州(zhōu)金(jīn)鸡湖有游艇party”的消息火遍网络(luò),而经过(guò)警方辟(pì)谣这所谓(wèi)的(de)“party”可能是(shì)全国第一起AI绘(huì)图诈骗。

由于这(zhè)个活动(dòng)里面给出(chū)的美女(nǚ)照片都是AI制(zhì)作的真人照片绘图(tú),因为(wèi)太逼(bī)真(zhēn),被大家当成真(zhēn)事(shì)传(chuán)播(bō)了(le)

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能(néng)量

不过仔(zǎi)细观察可以发现,活(huó)动(dòng)发起者提(tí)供的照片中有个很(hěn)大的(de)漏洞可以(yǐ)发现(xiàn)并非真(zhēn)人(rén),而是AI绘(huì)图,那便是图片中(zhōng)女性(xìng)的手指部分有的存在异(yì)常。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科技行(xíng)业?_黑(hēi)料正能量(liàng)

有(yǒu)行业人事(shì)表示(shì):“现在因(yīn)为手指部分的绘画(huà)算法比较(jiào)复杂,AI还不太会画人的手,但最(zuì)新看到的图片已经有越来越完美的AI模型出(chū)现,以(yǐ)后可(kě)能就完全没(méi)有漏洞了(le)。

类似的AI作图诈骗在国外也已有(yǒu)发生。据英国广播公司报(bào)道(dào),土(tǔ)耳其(qí)地(dì)震期间(jiān),有Tiktok用户使用(yòng)AI合(hé)成了儿(ér)童(tóng)受灾的(de)假照片发(fā)布到网络,以此(cǐ)诱骗善良的人打赏(shǎng)“捐助”从(cóng)而(ér)实施(shī)诈骗。

目前随(suí)着技术发展,AIGC已(yǐ)经能做出(chū)真人(rén)照片般的绘图(tú)效果,如果这样(yàng)的图片被用来诈骗,将(jiāng)非常可怕。

此外(wài)AIGC还(hái)引发了很多担忧,一方面,批判者(zhě)认为AI在“学(xué)习”了大量前人的作品(pǐn)之后,其创(chuàng)作(zuò)没有任何情绪和灵(líng)魂,难以和人(rén)类的艺(yì)术创(chuàng)作相提并论。

另(lìng)一方面,AIGC背后的版权(quán)、目(mù)前都并没有得(dé)到有(yǒu)效的(de)解(jiě)决,还(hái)有AIGC会不会代替人类“至高(gāo)无上”的(de)创意。

马(mǎ)斯克也强(qiáng)调,人工智能的安(ān)全(quán)问(wèn)题(tí)需要得到重视,太(tài)晚就(jiù)来不及(jí)了。

03

AIGC下一(yī)站除了视频,还有远方

技术(shù)都是有两面性的,潜在的危害(hài)并不能掩盖其光辉的贡献。现在看来,人工智能技术将是第(dì)四次工(gōng)业革命的核心驱(qū)动力(lì)量(liàng),将创(chuàng)造新的增长奇迹。

过去一(yī)年,人工智(zhì)能在技术和商业层面都有了巨大进展,AI绘画就是人(rén)工智能技术发(fā)生方(fāng)向性改变的一个(gè)代表。其下一(yī)站或许(xǔ)就是视频。

此(cǐ)前(qián),Meta和(hé)谷歌先后发布了几条(tiáo)引爆科技(jì)圈的短视(shì)频。这些视频引(yǐn)发关注并非(fēi)内容做得多优(yōu)秀,反(fǎn)而都非(fēi)常(cháng)简单,比如一(yī)匹(pǐ)正在喝水(shuǐ)的马,一只画画的玩具(jù)熊,或者一(yī)段(duàn)骑摩托车的(de)第一视角(jiǎo)录像(xiàng),随(suí)便一(yī)个有(yǒu)手机的人都可以随手录下一(yī)段。

ChatGPT之后又(yòu)一应(yīng)用(yòng)杀疯(fēng)了,AIGC或进入可(kě)控(kòng)期,将(jiāng)洗牌科技行业(yè)?_黑料正能(néng)量

但这些短视频(pín)的创作方式(shì)非常简单,创作者仅(jǐn)仅需要向AI输(shū)入一(yī)段话,甚至只是说一下要求(qiú),AI就可以根据(jù)需要生成一段视频。

谷歌发(fā)布的两个(gè)AI生成视频分别来自于Imagen Video和Phenaki,前者主要突出的是高清(qīng),与(yǔ)Meta的Make-A-Video没(méi)有(yǒu)太多(duō)的差别。

在Make-A-Video公布(bù)了AI生成的视频(pín)后,AI圈就已经玩了一波(bō)梗,一个能够做出更高清视频的(de)AI还不足以(yǐ)在短时间(jiān)内戳中兴奋(fèn)点。

Phenaki更加令人(rén)震惊(jīng)的地方在于,它(tā)可以制作出(chū)超过(guò)2分钟的连贯的也有确切内容(róng)的视频,这才是(shì)真正让人们感(gǎn)到(dào)惊喜的(de)地方。因为无论AI生成的视频(pín)多(duō)么高清,也只能是为内容生产者提(tí)供一个(gè)灵感,一个(gè)素材,一个过(guò)场(chǎng)动画。

不过(guò)能够(gòu)制(zhì)作出有(yǒu)具体剧情内(nèi)容的(de)视频就意(yì)味着,一些视(shì)频创作由AI代替人工完成已经初步有了可(kě)能(néng)。

当(dāng)下AI的(de)发展速度已经超过大部分人的(de)想象。内(nèi)容产业的(de)本质是供给创造需求,AIGC作为(wèi)全新的内(nèi)容生产方式,可以为内容产业带来更新的(de)内(nèi)容风格、更(gèng)快的生产速度(dù),更(gèng)低(dī)的生(shēng)产成本,这无疑会驱动内容产业的大爆发。

除了(le)AI绘图、视(shì)频,AIGC技术还(hái)能应(yīng)用(yòng)于音乐、代(dài)码、机器人动(dòng)作等多种(zhǒng)内容形式的生成。不(bù)难(nán)发现该项技术不仅在游戏等行业能得到有(yǒu)效(xiào)应用,对(duì)于下一代互联网各种(zhǒng)元素的构建亦(yì)有关(guān)键意(yì)义。

从商业化的角度来看,文化娱(yú)乐、教育、传媒等诸(zhū)多领域,本身就对基于AI的可视化内容有强(qiáng)烈需(xū)求。

因(yīn)此(cǐ),AI绘画及视频或(huò)不是(shì)结(jié)果,而只是AI进程中的一块重要拼(pīn)图,有望在技术(shù)更新的加(jiā)持下实现更大的应用价值。

AI从理解内(nèi)容,走向了可以(yǐ)生成内容,甚至能够创造(zào)出独(dú)立价值和独(dú)立视角的内容。AIGC的再次(cì)出圈(quān),更代表着未来(lái)的(de)先进生产(chǎn)力即将到来。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技(jì)行业?_黑料正能量

04

紧抓大模型与算力,牢固AIGC底座

从技术的发展也可以看(kàn)出,在语言大模型(xíng)、图像(xiàng)大模型之后(hòu),多模态(tài)大模型已(yǐ)经(jīng)成为了新的趋(qū)势。

大(dà)模型被誉为当前人(rén)工智(zhì)能发展(zhǎn)的(de)智能(néng)底(dǐ)座(zuò),是全(quán)球竞争(zhēng)最激烈的研究方(fāng)向之一,包括谷(gǔ)歌、亚马逊、百度(dù)、阿里、腾讯(xùn)等众多头(tóu)部企业(yè)都在竞相发力。

不过(guò)训练大模型的确价(jià)格不菲,以国盛证券发布的《ChatGPT需要(yào)多少算(suàn)力》报告估(gū)算,GPT-3训练一(yī)次的(de)成本约为140万(wàn)美元。而对于一些更大的LLM(大型语言模(mó)型),训练成本则介于200万美(měi)元至1200万美元高价之间。

以ChatGPT在2023年(nián)1月(yuè)的独立访客(kè)平均数1300万计算(suàn),其对应芯片需求为3万多片(piàn)英(yīng)伟达(dá)A100 GPU,初始投入成本约为8亿美(měi)元,每日仅电费就在(zài)5万(wàn)美元左右。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进入可控期,将洗牌科(kē)技行业?_黑料(liào)正能量

此外不论是ChatGPT还是(shì)AIGC,都离不开(kāi)庞大算(suàn)力支持。在关注各类大模型的发展同时(shí),更应该关注算力网络的建设。

算力网络正驱动AI产业发展(zhǎn)进入史诗级加速进程,让AIGC及通用AI这(zhè)一(yī)人工(gōng)智能发(fā)展(zhǎn)的终极目标离得更近。

因为算力可以对(duì)突破性技术创新提供大力的支(zhī)持。这方(fāng)面,多模态大模型是典型。作为(wèi)面向未(wèi)来强人工(gōng)智能、通(tōng)用人工智能的重要技术创新,多模态大模型已(yǐ)经(jīng)在人工智能(néng)领域提出(chū)了很(hěn)多年,业界也有不少技(jì)术突破,但是,多模态大模(mó)型进(jìn)一步往下(xià)走,算力需求呈几何式上(shàng)升(shēng),一般的(de)算力(lì)基础设施很快将难以胜任(rèn)。

从(cóng)图像、文字、语音单独一(yī)项(xiàng)的(de)训(xùn)练,到双模态、三模态的跃(yuè)迁(qiān),让(ràng)人工智(zhì)能(néng)可(kě)以(yǐ)灵活应对不同模态(tài)的转化、像人(rén)与世界交互一样自然,这方面,由算力网络来驱动(dòng)将有明(míng)显优势。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入可控(kòng)期,将洗牌科技行(xíng)业?_黑(hēi)料正能量

此外,还有很多(duō)需要爆发式增(zēng)长的算力来(lái)支撑的技(jì)术创新,将在人工(gōng)智能算力网络(luò)支(zhī)撑下快速推进(jìn)。

AIGC已经露出曙光,期待在大模型和大算力的支持下AIGC能(néng)持(chí)续颠覆内容生(shēng)产的(de)方(fāng)式(shì),将创造的(de)边际成本降低,让(ràng)万众受益(yì)。

未经允许不得转载:橘子百科-橘子都知道 夏朝距今多少年,夏朝距今多少年2022

评论

5+2=