如何快速了解Sora文生视频这一强大模型,制作AI短视频,抢占市场先机,赚取第一桶金? 本书包括8章专题内容布局+73个官方视频示例分析+490多张图片全程图解,随书还赠送了8大资源:106分钟同步教学视频+111页PPT教学课件+112组AI视频生成提示词+119个效果文件+57集AI绘画教学视频+56集AI文案写作教学视频+15000多组AI绘画关键词等。具体内容从下面两条线展开。 一条是技能线:从AI短视频的相关技术入手,介绍Sora的概念特点、基本能力、技术原理、模型架构、生成式AI功能、指令编写、提示词库、商业变现等内容,通过学习和实践,读者将能够充分发挥Sora的强大功能,创作出令人惊叹的短视频作品,实现自己的创作和商业目标。 一条是案例线:本书非常注重Sora的实际应用,并通过大量的视频案例分析,包括人像、风光、动物、植物、幻想、旅行等多种题材,同时涉及动画短片、电影预告片、无人机航拍视频、历史镜头视频、电商广告视频、游戏视频等多个领域,全方位展示了Sora在不同场景下的应用效果。 本书是一本不可多得的AI短视频生成技术指南,适合短视频创作者、影视制作人员、摄影师、市场营销人员、AI技术爱好者与开发者、教育工作者及研究人员等广大群体阅读。此外,本书还可以作为相关培训机构和职业院校的参考教材。
明机 ·AI训练师:对人工智能三要素算法、算力、算据(数据)拥有深厚的研究,熟悉AI算法和模型特性,擅长使用TensorFlow、PyTorch等框架技术进行模型训练与产品开发; ·AI工程师:对Sora生成连贯视频序列的循环神经网络,Sora处理复杂视觉内容的空间时间补丁,Sora加快视频生成速度的自回归变压器等技术,Sora成为世界模拟器等技术掌握颇深; ·AI先行者:AI提示词库创作者,首批应用ChatGPT、gemini、Stable Diffusion 、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的从业人员,擅长AI文案编写、AI绘画与AI视频生成训练。
◎ 市场优势 随着科技的飞速发展,人工智能已逐渐渗透到人们生活的方方面面,而AI短视频生成技术作为其中的一颗“新星”,更是受到了广泛关注。根据Mob研究院发布的报告显示,2023年中国短视频市场规模近3000亿,用户规模占整体网民的94.8%。这些数据表明,短视频市场正在迅速增长,用户规模庞大,且持续增长。 据市场研究公司Statista的报告,到2025年,全球AI视频技术的市场规模预计将达到120亿美元。根据艾媒咨询公司的报告显示,2023年中国AIGC产业规模约为143亿元,预计到2030年,产业规模有望达到11441亿元,这显示出AIGC产业在未来几年内具有巨大的增长潜力。 在这样的大背景下,我们策划编写了本书,为广大短视频创作者、影视制作人员、市场营销人员、AI技术爱好者与开发者、教育工作者,以及研究人员提供了一本关于Sora AI短视频生成技术的全面指南。 ◎ 工具介绍 Sora作为一款引领短视频创作新时代的人工智能工具,它集成了先进的算法和模型架构,为创作者提供了前所未有的创作自由度和便捷性。Sora的独特之处在于其强大的生成式AI功能,使得创作者只需通过简单的指令和提示词库,就能让Sora为他们创作出独具匠心的短视频内容。 本书通过深入解读Sora的技术原理、功能特点、提示词优化及商业应用,帮助读者更好地掌握和利用AI技术生成高质量的短视频。通过学习本书内容,读者将能够全面掌握Sora AI短视频生成技术的核心原理、功能特点及实战应用,为自身在短视频创作、影视制作、市场营销等领域的发展提供有力支持。 ◎ 本书特色 本书是一本全面、深入、实用的技术指南,从Sora的基本概念、技术原理到实际应用案例,进行了系统而全面的介绍,无论是初学者还是专业人士,都能从中找到所需的知识和信息。本书特色如下。 (1)73个官方示例,实战应用导向:为了让读者更好地将理论知识转化为实际操作,本书精选了73个官方展示的AI视频示例。这些示例涵盖了不同的题材和用途,旨在帮助读者快速掌握高效、高质量的短视频制作技巧。通过学习和模仿这些示例,读者将能够轻松提升自己的AI短视频制作水平,实现创意与技术的完美结合! (2)80多个小节讲解,解析前沿技术:本书精心策划了8大章共80多个小节,全方位、多角度地深入解析了Sora这一前沿的AI短视频生成模型。通过对本书的专业解读,读者将能够掌握其核心技术原理与优势,不仅站在技术的前沿,更能轻松应对各种挑战,成为AI短视频领域的佼佼者。 (3)7大超值资源赠送,全面且丰富:为了给读者带来前所未有的学习体验,精心准备了7大超值资源赠送给读者,这些资源包括:教学视频+PPT教学课件+AI视频生成提示词+效果文件+AI绘画教学视频+AI文案写作教学视频+AI绘画关键词等,让您全方位了解AI短视频的魅力。 ◎ 温馨提示 (1)版本更新:在编写本书时,是基于当前各种AI工具和网页平台的界面截取的实际操作图片,但本书从编辑到出版需要一段时间,这些工具的功能和界面可能会有变动,请在阅读时,根据书中的思路,举一反三,进行学习。 (2)提示词:也称为提示、文本描述(或描述)、文本指令(或指令)、关键词等。需要注意的是,即使是相同的提示词,Sora等AI模型每次生成的视频、图像效果也会有差别,这是模型基于算法与算力得出的新结果,是正常的,所以大家会看到书里的截图与视频有所区别。用同样的提示词,自己再制作时,出来的效果也会有差异。 (3)效果问题:本书所展示的示例效果,均来源于Sora官方发布的演示视频。鉴于Sora模型目前尚处于初期研发阶段,它不可避免地存在一些问题。例如,生成的人物面部表情可能显得不够自然,肢体动作也可能略显僵硬。此外,还可能出现多手多脚,以及其他不符合现实世界物理规律的现象。然而,我们深信这些问题都将在后续的版本中逐步得到改进和优化,为我们带来更加出色的短视频创作体验。 (4)使用问题:本书内容写于2024年2月底,此时Sora正处于内测阶段,因此,本书关于Sora具体生成视频的实战教程部分内容较少,建议大家关注书封底的QQ群,等Sora正式开源后,作者会赠送具体的制作教程,到时请读者朋友留意查收。 ◎ 资源获取 如果读者需要获取书中案例的素材、视频和课件,请使用微信“扫一扫”功能按需扫描下列对应的二维码。 ◎ 作者售后 本书由明机编著,参与编写的人员还有苏高等人,在此表示感谢。由于编者知识水平有限,书中难免有疏漏之处,恳请广大读者批评、指正,沟通和交流请联系微信:2633228153,添加时请输入关键词:明机。
第1章 认识Sora:强大的人工智能视频生成模型 1 1.1 Sora是什么 2 1.1.1 Sora的基本介绍 2 【示例1】:走在东京街头的时尚女性 3 1.1.2 Sora的功能特点 4 【示例2】:穿过东京郊区的火车窗外的倒影 4 1.1.3 Sora的竞品对比 6 【示例3】:坐在天空中的一片云上看书的年轻人 7 1.1.4 Sora的核心优势 9 1.1.5 Sora的创意用途 10 【示例4】:培养皿里的竹林和奔跑的熊猫 11 1.2 面对Sora,我们该思考的5个问题 12 1.2.1 文生视频模型为什么会火 12 【示例5】:在日落时分惬意地漫步 16 1.2.2 Sora的发布意味着什么 17 【示例6】:手机镜头下的未来城市风貌 18 1.2.3 我们与Sora有何关系 19 【示例7】:“云人闪电”的科幻电影片段 20 1.2.4 我们该如何应对Sora 21 1.2.5 普通人该怎么入局 23 【示例8】:冬日长毛猛犸象的壮丽景色 24 第2章 能力解析:Sora如何高效地生成视频 26 2.1 Sora的技术创新点 27 2.1.1 支持多样化视频格式 27 【示例9】:在大海中游动的海龟 27 2.1.2 改进的画面构图和框架 29 【示例10】:兔子和松鼠的奇妙混合物 30 2.1.3 语言理解与视频生成 31 【示例11】:不同的人物在不同的城市散步 33 2.1.4 多模态输入处理 34 【示例12】:无人机环绕拍摄的海边建筑 35 2.1.5 可变的持续时间、分辨率、宽高比 36 【示例13】:白发男人的特写镜头 37 2.2 Sora强大的视频生成能力 37 2.2.1 3D一致性:以3D的视角呈现物体和人物的运动 37 【示例14】:推镜头展示熙熙攘攘的东京城市街道 38 【示例15】:摇镜头展示令人惊叹的山水风光 39 2.2.2 长期一致性:保持视频中的人物和场景的不变 40 【示例16】:一只达尔马提亚狗从窗户向外看 41 2.2.3 世界交互模拟:模拟人物与环境之间简单的互动 42 【示例17】:模拟画家的创作过程 42 【示例18】:模拟人物吃汉堡的场景 42 2.2.4 模拟数字世界:探索与创造的无界数字世界 43 【示例19】:模拟《我的世界》游戏场景 43 2.2.5 复杂元素生成能力:打造出逼真的虚拟场景 44 【示例20】:一大堆老式电视播放着不同的节目 44 【示例21】:逼真的动画特写场景 46 2.2.6 多镜头生成能力:呈现出丰富的视觉盛宴 46 【示例22】:用不同的镜头展示的机器人 47 2.3 Sora面临的一些局限性和挑战 48 2.3.1 模拟物理世界的局限性 48 【示例23】:破碎的玻璃杯 49 2.3.2 生成长视频的难度 50 【示例24】:在沙漠中发现的塑料椅子 50 【示例25】:篮球通过篮筐后爆炸 51 2.3.3 理解复杂提示词的准确性 52 【示例26】:庆祝生日的温馨家庭场景 53 2.3.4 训练模型的复杂性 54 【示例27】:35毫米电影风格的跑步动作场景 55 2.3.5 提升视频生成的时效性 56 【示例28】:偏僻路上小狼嬉戏的场景 57 第3章 技术原理:解析Sora的技术特性与优势 59 3.1 解析Sora的技术原理 60 3.1.1 Sora如何根据文本生成内容——Diffusion模型 60 3.1.2 Sora如何处理复杂视觉内容——时间空间补丁 62 3.1.3 Sora如何生成连贯的视频序列——循环神经网络 63 【示例29】:中国农历新年庆祝视频 64 3.1.4 Sora如何生成不同风格的视频——生成对抗网络 65 3.1.5 Sora如何加快视频的生成速度——自回归变换器 67 3.2 Sora在视频生成过程中的3个关键步骤 68 3.2.1 步骤1:视频压缩网络 68 【示例30】:一窝金毛寻回犬在雪地里玩耍 68 3.2.2 步骤2:时间空间潜在补丁提取 69 3.2.3 步骤3:视频生成的Transformer模型 70 【示例31】:淘金热期间加利福尼亚州的历史录像 70 3.3 Sora技术的未来展望 71 3.3.1 技术革新与性能升级:速度更快、稳定性更强、体验更流畅 71 3.3.2 跨领域融合与拓展应用:让生活更加多姿多彩、充满无限可能 72 第4章 模型架构:Sora的基础是世界通用模型 73 4.1 认识世界通用模型 74 4.1.1 什么是世界通用模型 74 4.1.2 世界通用模型的作用是什么 75 【示例32】:Santorini的航拍建筑美景 76 4.1.3 多模态模型促进AI更好地理解真实世界 77 【示例33】:一列蒸汽火车行驶在高架桥上 78 4.1.4 世界通用模型打破了虚拟与现实的边界 79 【示例34】:惬意漫步的南非妇女 79 4.1.5 世界通用模型的代表——Runway 80 4.2 Sora将视频生成模型作为世界模拟器 81 4.2.1 用大语言模型的方法理解视频 81 【示例35】:一群纸飞机在茂密的丛林中飞舞 82 【示例36】:愉快漫步的老人 83 【示例37】:白雪皑皑的东京城 84 4.2.2 实现对物理世界的“涌现” 85 【示例38】:可爱的达尔马提亚狗 85 4.2.3 模拟真实物理世界的运动 87 【示例39】:壮观的海岸风光 88 4.3 Sora模型训练的核心技术 90 4.3.1 自然语言理解 90 4.3.2 生成式人工智能模型 92 【示例40】:老年人的悠闲生活与美丽的自然风光 93 4.3.3 场景构建与精细化渲染 96 4.3.4 AI驱动的动画技术 98 【示例41】:眨眼的特写镜头 99 4.3.5 个性化定制与持续优化 100 【示例42】:不同风格的袋鼠漫步场景 101 第5章 功能详解:使用Sora快速生成视频 105 5.1 Sora的文生视频功能 106 5.1.1 Sora的注册方法 106 5.1.2 申请Sora的内测资格 110 5.1.3 使用文生视频功能 113 5.2 Sora的其他AI生成功能 114 5.2.1 图生视频:为DALL·E图像制作动画 114 【示例43】:活泼可爱的柴犬 115 【示例44】:一个多样化的怪物家族 116 【示例45】:由字母组成的云朵图片 117 【示例46】:冲浪者在历史大厅中驾驭巨浪 118 5.2.2 视频生视频:向前或向后扩展视频的时长 119 【示例47】:旧金山的高空城市缆车 119 【示例48】:永无止境的骑行场景 122 5.2.3 视频到视频编辑:转换视频的风格和环境 123 【示例49】:飞驰在丛林中的跑车 123 5.2.4 连接视频功能:创建神奇的无缝过渡效果 125 【示例50】:无人机视频与蝴蝶视频的连接 126 【示例51】:越野车视频与豹子视频的连接 128 5.2.5 图像生成功能:为用户带来卓越的体验 130 第6章 指令编写:优化提示词提升Sora的生成效果 133 6.1 编写Sora提示词的基础思路 134 6.1.1 明确具体的视频元素 134 【示例52】:一只在拍摄视频的柯基犬 134 6.1.2 详细描述场景细节 135 【示例53】:一朵花生长的定格动画 135 6.1.3 创造性地使用提示词 136 【示例54】:一群鱼在纽约的街道上游动 136 6.1.4 构思引人入胜的角色和情节 137 【示例55】:一只猫叫醒正在睡觉的主人 137 6.1.5 用逐步引导的方式构建提示词 139 【示例56】:挤满了工人的建筑工地 139 6.2 Sora提示词的编写技巧 140 6.2.1 如何选择Sora的提示词 140 【示例57】:基纳巴丹干河上的野生动物 141 6.2.2 Sora提示词的编写顺序 142 【示例58】:美术馆内的艺术盛宴 143 6.2.3 编写Sora提示词的注意事项 143 【示例59】:跳迪斯科舞的卡通袋鼠 144 第7章 提示词库:打造专业级视频效果必备的要素 145 7.1 Sora内容型提示词 146 7.1.1 主体特征 146 【示例60】:在南极洲愉快漫步的女人 147 【示例61】:不同主体特征的视频效果 148 7.1.2 场景特征 150 【示例62】:色彩斑斓的鱼类和海洋生物 151 7.1.3 艺术风格 152 【示例63】:太空冒险故事的电影预告片 153 7.2 Sora标准化提示词 155 7.2.1 画面构图 155 【示例64】:变色龙的特写镜头 156 7.2.2 视线角度 157 【示例65】:维多利亚冠鸽的侧面视角 158 7.2.3 画面景别 159 【示例66】:玻璃球体里的小矮人 160 7.2.4 色彩色调 161 【示例67】:在茂密的花园里奔跑的虎斑猫 162 7.2.5 环境光线 163 【示例68】:月光下的狼嚎剪影动画 164 【示例69】:在霓虹灯城市中嬉戏的小狗 165 7.2.6 镜头参数 165 【示例70】:深海中的大章鱼和帝王蟹之战 166 第8章 商业变现:从文本到视频的创收之路 168 8.1 Sora未来可能的商业场景应用 169 8.1.1 电商产品展示 169 8.1.2 视频广告制作 170 8.1.3 游戏开发和动画片制作 170 【示例71】:展示游戏《我的世界》 171 【示例72】:水獭的热带冲浪冒险 172 8.1.4 电影电视节目制作 173 【示例73】:海盗船激战瞬间 173 8.1.5 教育内容制作 174 8.2 如何利用Sora实现多渠道变现 174 8.2.1 广告收入与赞助变现 175 8.2.2 知识付费变现 175 8.2.3 提示词交易变现 176 8.2.4 内容创作变现 177 8.2.5 Sora的其他变现方式 178
ISBN:978-7-122-45340-2
语种:汉文
开本:16
出版时间:2024-06-01
装帧:平
页数:180