数字世界的创作和内容,最重要的是程序和视频。程序负责逻辑、互动;视频负责信息的表达、感知。
2024年2月 Sora 概念发布,6月可灵发布,AI 视频开始发展。同年 6月 Claude 3.5 Sonnet 发布,8月 Cursor 接入,AI Coding 开始狂奔。
回想起来只过了一年时间,但已经经历了很多的变化,想探讨一下这两个核心 AI 领域的演化可能性。
现状:作为生产力工具的 AI
AI Coding
AI Coding 短期已经达到生产可用,能显著提升程序员 Coding 效率,长期还是 AGI 本身核心的能力,有现在也有未来,自然是最热门的方向,Cursor / Windsurf / Lovable / Augment 层出不穷。
AI Coding 除了给程序员提效,也开始覆盖到其他互联网从业者,设计师/产品/运营/自媒体 等,让原本不会写程序的人 0 门槛通过 AI Coding 做出 demo 和场景,带来 0-1 的新体验。
但目前这些应用,核心是提效。没有 AI Coding,程序员也能写出一样的程序,产品/设计师等也能跟程序员合作快速做出 demo,从产物的形态/目的角度看,做出来的东西没有本质的变化,只是有了 AI Coding,效率提高了一个级别。
AI 视频
AI 视频过去一年 可灵/即梦/Runway/Veo 等模型持续进化,指令遵循、画面稳定性一直在增强,在一些场景达到了生产可用,提升了 CG 制作、商品广告等视频场景的生产效率。
AI 视频也覆盖到广大自媒体用户,以前需要一个 CG 团队才能做出来的视频,现在一个人可以创作出来,例如橘猫/风格化视频等,给创作者带来 0-1 的新体验,发布到小红书/抖音等平台获利,AI 视频部分代替了基于摄像头实拍的内容,成为新的一种生产力工具。
AI Coding 和 AI 视频作为生产力工具毋庸置疑会带来巨大的价值,也是现在正在发生和快速增长的。
不确定的是,随着能力的持续提升,使用的门槛的持续降低,AI Coding 和 AI 视频的使用人群是否能进一步覆盖更广到亿级大众用户,带来生产力目的以外新的东西,催生新的偏社交/娱乐的内容平台?
大众化和新平台的可能性
类比
从历史上找,有两个可类比的领域:
拍摄
- 拍摄从早期专业人士才能操作,到现在大众化的手机拍摄,创作工具能力极大提升,带来门槛极大降低,普惠到大众,催生新的内容和平台。
- 现在专业摄影仍然继续存在于电影电视/广告/艺术等行业,而大众化的拍摄存在于日常生活,脱离了生产力,催生了 Instagram、抖音、朋友圈等这些新的内容和社交平台。
- 可以想象,AI Coding 和 AI 视频随着门槛降低也可能可以覆盖到大众,催生新的平台。但拍摄的演进过程中伴随了其他巨大的变量:设备和环境的迁移。电脑、互联网、手机设备,与工具的低门槛一起催生了现在的形态,AI 创作只有门槛的降低,缺乏其他大的变量。
3D打印
- 3D 打印技术的发展,让从以前工厂才能生产实体制品,到 3D 打印的技术发展让每个人都能生产实物制品,3D打印的产物有社交价值(分享/炫耀)、实用价值(3D 打印常制作出工具解决问题),但目前没有内容价值,还是只存在于小众圈子内。
- 与 AI 创作类似的是,3D 打印的发展是纯工具低门槛化,没有其他变量;差别是 3D 打印是实体世界,与数字世界的规模化扩展性差异巨大。
从类比上并没有特别适配的案例,但不妨碍 AI Coding 和 AI 视频有自己的大众化和演进路径,我们先看看如果工具要大众化和催生新平台,需要什么条件。
消费价值与内容形态
一个工具要大众化,门槛持续降低是必要的但不充分,创作的核心是消费,大部分人有创作欲,但纯粹的创作欲是小众,创作欲更多是社交认同、利益驱动。如果不能分享,大家不会好好拍照,如果没有利益,短视频创作者不会那么多。所以工具要大众化,核心还是创作的内容有高的消费价值,包括消费频次。
但即使人人都创作和分享,也不一定需要新的平台承接,创作产物的形态没有变化,消费场景(硬件/环境)没有变化,原来的社交/内容平台也足以承接。要诞生新的平台,还是得有不同的消费场景或不同的内容形态,导致原来的平台没法很好地承接。我们不考虑新硬件的情况下,主要就看内容形态。
沿着消费价值和内容形态,看看 AI Coding 和 AI 视频的情况。
AI Coding
AI Coding 的产物归类到源头可能就三种:工具、内容容器、游戏。我们拆开来设想一下:
- 工具:可供大众使用的工具可复用性高,个性化程度低,当前程序员和APP/Web/小程序的量级已经足够大,更多的人群进来用 AI Coding 做小工具,在硬件设备和环境没有变化的情况下不会有太多新的花样,很难出现质变,消费价值和创作频次都不会很高。
- 内容容器:个人网站、简历、报告、方案等是这一类。借助 Coding 让内容呈现形态多样化,这也是初期可能最容易人人参与创作出来的东西。但这类的核心是内容而不是代码,只是在内容呈现上可能有个20%的体验提升,Coding 的作用不会太大。要说这一类有什么一定要 Coding 才能满足,那就是交互,如果重交互的内容场景和需求足够多,是有希望的。
- 游戏:游戏的核心是代码,人们对游戏玩法有无限的需求,用户消费频次够高,范围够广,这可能是最有希望的品类。产物不一定是现在形态下的一个个独立小游戏,可能是更看重创作和生成过程的游戏,同时又有消费价值,具体是什么不知道。只是游戏相对复杂,当前 Coding 能力还不够,还没看到苗头。
有足够的个性化差异的可交互产品/游戏,是 AI Coding 可能的出圈点。比如,以个人形象为主角的、融入了自身经历的小游戏;比如,一个可以在里面不断做个性化扩建的自由世界,像“我的世界”。如果有这些新的形态,就会催生一个新的内容平台去承接这一类产品。
AI 视频
AI 视频的产物应用涵盖太广,难以细拆,但近期也看到一些大众化和新形态的可能性:
- 日常表达:AI 视频是想象力的相机。我们的日常表达,一部分通过摄像头记录和分享,另一部分心情的传达,比较难通过摄像头,在以前更多通过文字,以后可能更多通过 AI 这个想象力的相机。它能把你本来只能用文字描述的心情和感想,转成更容易引起共鸣的画面。近期在抖音上火了一阵的 像素风 AI 视频,就是这种感觉。(印象较深的是,勇士队输掉季后赛的那天,看到了一个像素风视频很好表达了郁闷/不甘的心情,很有共鸣,这种心情用真实的图片视频和文字都很难表达)
- 可交互视频:最近看到 odyssey 发布了可交互视频,40ms 生成一帧,根据用户行动实时生成下一帧,体验上像玩游戏一样。可交互视频可能是 AI 视频生成新形态的关键,它不一定是非常实时的交互,比如看一个剧,可以自己修改剧情走向,看到视频里的一个场景,可以进去这个场景无限扩充看它整个空间,都是可能的场景。
日常心情表达是 AI 视频很能大众化的场景,消费价值和消费频次高,但催生不了新平台,生成的视频都会回到原来的内容/社交平台上。可交互视频这种衍生的形态,才会需要一个新的平台去承接。
新形态的核心:交互
看下来无论是 AI Coding 还是 AI 视频,交互 都是新内容形态的关键点。
因为这波 AI 浪潮是生成式 AI,生成的产物都是业界已有的形态,如果只看生成的产物,在没有新的硬件设备、使用环境等其他变量的情况下,只会有生产效率的提升,很难诞生新的内容形态和平台。
生成式 AI 真正独特的地方,是生成的过程。需要用户频繁通过生成产生交互的场景,才会是新的内容场景,才能产生新的内容形态。
AI Coding 和 AI 视频都有在各自领域里通过交互产生新的内容形态的可能。另一种可能是,这两者做进一步的结合,逻辑+画面都实时生成,不断创造的可玩的虚拟世界,可能又能回到元宇宙的概念。
这些新的形态和玩法,可能会像当时 Snapchat 刚出来时大家看不懂,难以理解,但就是能戳中年轻一代的诉求,值得探索和期待。