行业新闻
更新时间:2024-12-04
点击次数: ,11 月 5 日星期二,大选的收视黄金期,通过 18 个电视网络收看 2024 年美国总统大选报道的观众,也才约 4230 万人。
最近两个月,一款由谷歌开发的 AI 笔记产品 NotebookLM 就增长迅速。SimilarWeb数据监测显示,10 月份的流量增长了 200% 以上,达到 9.2M 次,比一个月前的 3.1M 次高了约两个身位,在社交媒体上被频繁刷屏、风头无两。
之所以火,就在于 NotebookLM 的一个小功能—— 音频概览 :输入长文本,利用 AI 就能生成播客。它能针对任意的文本材料,生成长达十几分钟的逼真双人播客,语音、语调,甚至内容调侃,都充满了 活人味 。
网友都感慨: 谷歌这次终于狠狠创新了。 而火了之后,谷歌的老伙计 Meta 坐不住了,立即基于 Llama 模型,推出了 NotebookLM 的开源平替版 NotebookLlama。
AI 笔记产品的热度也顺势而起。11 月 15 日,腾讯官宣了 AI 笔记新产品ilot,它能检索微信公众号文章,并形成自己的专属知识库。
事实上,NoteBookLM 只是一个具有落地可能性的 demo,一开始,谷歌不是想做一个播客产品,更多的还是想基于源文档,对内容进行概述、梳理和提问,来提高生产力,就和大部分 AI 笔记想实现的一样。
这跟当年的 ChatGPT 如出一辙——它本来也只是一个大模型的预览版,通过一个对话窗口,想让大众直观地感受到产品的提升。
用 NoteBookLM 制作播客非常简单。直接上传单个或多个来源材料,点击右侧的音频加载,等待几分钟后,就会产出一段十几分钟的男女对话音频,同时还支持自定义音频,例如应该针对哪些受众、哪些主题等。
将奥特曼最新的访谈投喂给 NoteBookLM,严肃的访谈内容变得生动活泼了。
对谈的两人一边分析 AI 的潜力,一边用带有幽默感的比喻,让复杂的技术话题变得易懂、接地气。比如,把 AGI 的诞生比作 新生命的到来 ,或调侃 AI 公司需要 一个聪明人和 10,000 个 GPU。
A: 想象一下你正在教计算机识别猫,对吧?小模型,它可能会学习尖耳朵、圆脸、基础知识,但一个巨大的模型是在数百万张猫图片上训练的。
A:远不止如此,它还可以从表情中学习品种、情绪,甚至发现微小的疾病迹象,简直是详细级别。
令人惊喜的逼真效果、简单的一键式体验,让许多网友跃跃欲试。在 X 上随手一搜,就能看到许多 几分钟之内快速制作播客 的经验贴,无一例外都是借助 NoteBookLM 来实现。
如果再加上其他 AI 工具,如生成数字人的 Heygen、可编辑脚本和声音的 Wondercraft 等,甚至还能形成更丰富的音视频内容。
无独有偶,上一个获得社媒高声量的 AI 产品,是低代码开发平台 Wordware 的一个吐槽小功能,上线 万用户,连创始人都措手不及。
这款毒舌 AI 活脱得像原生网友,可以根据 X 上的内容,分析单个账号的性格、两个账号的兼容模式,犀利毒舌,玩梗非常溜,让网友直呼过瘾。
例如,它对马斯克和特朗普的关系评价是, 这是一个高风险的权力二人组,具有创新和争议的爆炸性潜力 他们如同两只阿尔法狼在争夺谁能先对着月亮嚎叫 马斯克提议用核武器轰炸火星,而特朗普要让月球再次伟大。
对比 NoteBookLM 和 Wordware 的传播方式,我们会发现,它们都是在基础产品之外,发布一些能够引起广泛社交传播的小功能。
这些小工具在使用上大大降低了应用门槛——即使是小白也可以迅速上手,产出也是走搞笑有趣路线,这其实与抖音、TikTok 短视频在全球的火爆逻辑不谋而合。
NotebookLM 团队的负责人 Raiza Martin,在访谈中还透露了一种非常规的、类似 公开创业 的运营逻辑。
团队每天在社交媒体上分享项目进展,并在开发者聚集的 Discord 建立频道,以便在一线关注用户的反馈和使用习惯,从而及时调整和更新。目前,已有超过 60000 个用户加入。
视频生成明星初创 Pika 的打法其实也相似。刚亮相时,团队就选择在 Discord 运营,迅速获得 50 万用户。
今年 10 月,新发布的 Pika 1.5 模型就又推出了一个新的 AI 模版——输入一张静态图片,就能实现爆炸、融化、膨胀、变成蛋糕等多种效果,各种脑洞开大、整活玩梗和搞怪,精准对标社交媒体用户的趣味。
OpenAI 联合创始人 Andrej Karpathy 对双人播客形式之所以吸引人的原因,是这么分析的:聊天很难,而听别人聊天更轻松得多;阅读很难,而靠在椅背上听要容易得多。
甚至,不要要求用户输入,因为人们往往不知道他们想要什么,直到直接展示给他们看。
在抖音之前,视频大多是横向的,用户在消费内容时,需要不断点击、退出、选择和再点击。而抖音竖屏视频流的设计,将操作简化为上下滑动,大大降低了使用门槛。
现在的 AI 产品也在经历差不多的进程。在模型从文本走到多模态后,用户如今也不需要再手动敲字和模型交互,直接说话已经十分流畅。
NoteBookLM 带来的启示是,要将大型语言模型的能力(智商、上下文长度、多模态等),转化为更能被用户消费的内容样态,其侧重点并非 AI 本身,而是场景定位和用户体验。
今年 10 月发布的 ChatGPT-canvas,就是 OpenAI 在交互设计的一次尝试。它最独特的地方是,将向 ChatGPT 询问的操作与编辑 / 编码的内容整合在一起,构建了一个更加人机协同的界面。
也就是说,用户可以直接在 canvas 编辑文本或代码。编辑的文档将自动显示在聊天界面右侧,用户用鼠标选中需要调整的部分,在弹框里进一步提问 GPT,或通过快捷方式菜单调整长度、更改阅读级别、修复错误等。
Arc 浏览器创始人 Josh Miller 认为,小公司确实还有机会,尤其是在用户界面上的创新。换句话说,成功定义用户页面的 AI 产品,更能成为杀手级应用,更能最终胜出。
类似于互动式的电子百科全书,Learn About 提供了历史、生物、天文、体育等各类学科的交互式文章和指南,同时可以自动扩展和深入探索,用 AI 加速知识学习。
单单是 Learn About 的交互模式:要点总结、时间线、常见问题等,都能嗅出浓浓的 NotebookLM 味 。
和大多数 AI 聊天机器人不同,NoteBookLM 和 Learn About 虽然保留了空白对话框,但更多的空间留给了一个个装着内容的 框 。
这些框,将建议的主题、指南、重点和注释直接展示出来,而不用用户自己去思考 我应该问什么 。
只需点击几下,知识就会以文字、图片、视频等不同模态的形式,从屏幕上涌过来。不少网友称这是 爱丽丝掉进兔子洞 般的体验。
此外,NotebookLM 团队的负责人 Raiza Martin 认为,在设计产品上,真正要思考的是,如何让新的东西变得直观而易被接受。
她举了一个反例,在使用 NoteBookLM 时,用户做的第一步就是上传源文档。对用惯了 ChatGPT 的用户而言,这个微妙的操作步骤,足以引发困惑和犹豫。
当然,基于源文档的设计有其独特的意义。它使我们重新意识到,日常的创造往往都是基于某些已有的资料或文档。
这也是 AI 笔记产品能提供超级生产力的原因,通过整合、分析和拓展各种信息,减少搜索信息时的回头路,打造第二大脑。
从这个角度上看,我们也能看到互联网发展的影子。以前的第二大脑是 APP,是小程序,而现在发展成了 AI。