摘要:谷歌为其AI助手Gemini新增“故事书”模式,用户仅需提供一个简单的想法,即可自动生成包含精美插图的10页儿童故事。该功能面向全球用户开放,旨在激发儿童想象力,提供全新的互动娱乐体验。...

谷歌正在将其强大的生成式人工智能技术带入一个充满想象力的新领域——儿童故事创作。该公司于近日发布公告,为其旗舰AI应用Gemini增添了一项名为“故事书”(Storybook)的全新模式。这项功能允许用户,特别是家长和孩子们,仅凭一个简单的想法或提示,就能在几分钟内创作出一部图文并茂、长达10页的原创AI故事书。

一键开启想象力:如何使用“故事书”模式?

根据谷歌的官方博文介绍,“故事书”模式的使用流程被设计得极为简洁直观,旨在让任何人都能轻松上手,成为故事的创作者。用户只需在Gemini应用中激活“故事书”模式(该模式作为一种特殊的“Gem”或自定义版本的Gemini存在),然后输入一个故事的创意核心。例如,你可以输入“一个害怕黑暗的勇敢骑士”、“一只想学习飞翔的企鹅”或者“一个和星星交朋友的小女孩”。

在接收到提示后,Gemini会立即开始工作。它会:

  • 构思情节:利用其强大的语言模型能力,将简单的创意扩展成一个有开头、发展和结局的完整叙事结构。

  • 生成文本:为故事书的每一页撰写适合儿童阅读的、富有想象力的文字内容。

  • 绘制插图:同步调用其先进的图像生成模型,为每一页的文本配上风格统一、色彩鲜明的插图,将文字描绘的场景生动地呈现出来。

最终,一个包含10页内容和精美插图的数字故事书便呈现在用户眼前。这不仅为孩子们提供了一种新颖的娱乐方式,也为家长们提供了一个与孩子共同创作、激发孩子想象力和语言能力的绝佳工具,尤其是在需要即兴创作睡前故事的时刻。

全球部署与技术融合的典范

谷歌强调,这项新功能并非小范围测试,而是面向全球用户的正式发布。无论是在桌面端还是移动设备上,只要是Gemini支持的语言和地区,用户都可以体验到“故事书”模式的魅力。这一全球同步部署的策略,彰显了谷歌希望将生成式AI融入全球用户日常生活的雄心。它不仅仅是一个技术展示,更是一个贴近家庭生活、具有实际应用价值的产品。

从技术角度看,“故事书”模式是谷歌多模态AI能力的一次完美融合。它无缝地集成了Gemini的自然语言理解、文本生成以及图像生成(可能基于其Imagen系列模型)三大核心技术。整个过程是自动化的,用户无需在不同的应用或工具之间切换,大大降低了创作门槛。这也标志着生成式AI正从单一功能的工具,演变为能够完成复杂、多步骤创作任务的综合性平台。

对家庭教育和创意产业的潜在影响

“故事书”功能的推出,无疑将对家庭教育和娱乐领域产生积极影响。它为孩子们提供了一个将自己的奇思妙想可视化的渠道,有助于培养他们的创造性思维和叙事能力。同时,它也为家长提供了一个高质量、个性化的亲子互动内容源。然而,这也可能引发关于AI在创意领域角色的进一步讨论。虽然谷歌将其定位为一种辅助和娱乐工具,但它也展示了AI在内容创作上日益增强的能力。对于儿童读物作家和插画师而言,这既可能是一种激发灵感的新工具,也可能在某种程度上构成潜在的竞争。无论如何,谷歌Gemini的这一创新,清晰地表明了AI技术正在加速渗透到我们文化和生活的方方面面,改变着我们学习、娱乐和创造的方式。这本由AI协助创作的数字故事书,或许正翻开了人机协作新篇章的第一页。