当前位置: 首页 > news >正文

输入一个故事主题,使用大语言模型生成故事视频【视频中包含大模型生成的图片、故事内容,以及音频和字幕信息】

本项目可以输入一个故事主题,使用大语言模型生成故事视频,视频中包含大模型生成的图片、故事内容,以及音频和字幕信息。

项目后端技术栈为 python + fastapi 框架,前端为 react + antd + vite。

资源获取

  • github项目地址:https://github.com/qingwen07/story-flicks/blob/main/README-CN.md
  • 【更多资源下载体验】

关注我的CSDN博客

  • 更多资源可以查看我的CSDN博客

视频演示
▶️ 《兔子和小狐狸的故事》

▶️ 《大灰狼和小白兔的故事》

界面截图
在这里插入图片描述

使用说明

  1. 下载本项目
    git clone https://github.com/alecm20/story-flicks.git
  2. 设置模型信息

先切换到项目的 backend 目录下

cd backend

cp .env.example .env

text_provider=“openai” # 文本生成模型的提供商,目前支持 openai和 aliyun、deepseek、ollama、siliconflow,阿里云文档:https://www.aliyun.com/product/bailian

image_provider=“aliyun” # 图片生成模型的提供商,目前支持 openai和 aliyun、siliconflow

openai_base_url=“https://api.openai.com/v1” # openai 的 baseUrl

aliyun_base_url=“https://dashscope.aliyuncs.com/compatible-mode/v1” # 阿里云的 baseUrl

deepseek_base_url=“https://api.deepseek.com/v1” # deepseek 的 baseUrl

ollama_base_url=“http://localhost:11434/v1” # ollama 的 baseUrl

siliconflow_base_url=“https://api.siliconflow.cn/v1” # siliconflow 的 baseUrl

openai_api_key= # openai 的 api key,可以只填一个

aliyun_api_key= # 阿里云百炼的 api key,可以只填一个

deepseek_api_key= # deepseek 的 api key,目前该 api_key 只支持文本生成

ollama_api_key= # 如果需要使用的话,请填写ollama,目前该 api_key 只支持文本生成,并且不能用参数量太小的模型,推荐qwen2.5:14b 或者更大的模型。

siliconflow_api_key= # siliconflow 的文本模型目前只支持兼容 OpenAI 格式的大模型,如:Qwen/Qwen2.5-7B-Instruct。图像模型只测试了:black-forest-labs/FLUX.1-dev

text_llm_model=gpt-4o # 如果 text_provider 设置为 openai,这里只能填 OpenAI 的模型,如:gpt-4o。如果设置了 aliyun,可以填阿里云的大模型,如:qwen-plus 或者 qwen-max。ollama 的模型不能使用体积太小的模型,否则无法输出正确的 json,可以使用如:qwen2.5:14b 或更大的模型。

image_llm_model=flux-dev # 如果 image_provider 设置为 openai,这里只能填 OpenAI 的模型,如:dall-e-3。如果设置了 aliyun,可以填阿里云的大模型,阿里云推荐使用:flux-dev,目前可以免费试用,具体参考:https://help.aliyun.com/zh/model-studio/getting-started/models#a1a9f05a675m4。

  1. 启动项目
    3.1 手动启动
    启动后端项目

先切换到项目根目录

cd backend
conda create -n story-flicks python=3.10 # 这里使用 conda,其他的虚拟环境创建方式也可以
conda activate story-flicks
pip install -r requirements.txt
uvicorn main:app --reload

如果项目成功,会有如下信息输出:

INFO: Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)
INFO: Started reloader process [78259] using StatReload
INFO: Started server process [78261]
INFO: Waiting for application startup.
INFO: Application startup complete.
启动前端项目

先切换到项目根目录

cd frontend
npm install
npm run dev

#启动成功之后打开:http://localhost:5173/
启动成功会输出如下信息:

VITE v6.0.7 ready in 199 ms

➜ Local: http://localhost:5173/
➜ Network: use --host to expose
➜ press h + enter to show help
3.2 通过docker启动
在项目根目录下,执行:

docker-compose up --build
成功之后打开前端项目:http://localhost:5173/

  1. 开始使用
    根据界面中的字段,选择文本生成模型提供商、图片生成模型提供商、文本模型、图片生成模型、视频语言、声音、故事主题、故事段落,然后点击生成,即可生成视频。根据填写的段落数量,生成图片,一个段落生成一张图片,设置的段落越多,生成视频的耗时也会更久。如果成功之后,视频会展示在前端页面中。
http://www.dtcms.com/a/578188.html

相关文章:

  • 英文网站首页优化中信建设有限责任公司招投标
  • 前端浏览器设置input不记住密码、不自动填充密码,举例jquery
  • 二级域名免费申请网站环球资源网站网址
  • 网站建设要学多久网站建设与管理 市场分析
  • 潍坊网站建设排行房地产销售人员网站怎么做
  • 如何为你的项目选择合适的加速度计?
  • 【MySQL】索引 知识总结
  • 拍卖公司资质的办理流程
  • 北京医院网站建设wordpress二次开发视频教程
  • 如何在淘宝网做自己的网站制作网站规划书
  • Rust 练习册 16:Trait 作为返回类型
  • LeetCode热题100--46. 全排列--中等
  • 有域名了怎么做网站冷水滩网站建设
  • 1.7 微调方法比较(LoRA、P-Tuning v2、Adapter):构建高效定制化AI模型
  • DO后缀命名在DDD(领域驱动设计)的错误应用
  • 中国平湖首页规划建设局网站电子商务网站建设课程设计总结
  • 数据结构系列之快速排序
  • 解决PowerShell执行策略导致的npm脚本无法运行问题
  • FPGA教程系列-Vivado IP核之乘法器解析
  • 开源网站 做镜像 如何做邯山网站制作
  • 挖掘百亿“数字热土”!解读印度游戏与媒体娱乐的高速增长
  • 做一套网站多钱做网站 源代码
  • 怎么做网站免织梦网站分享插件
  • 单链表反转:从基础到进阶的完整指南
  • 医疗机器人的智能感知:六维力传感器如何提升手术安全与精度?
  • STM32外设学习--TIM定时器--输入捕获---测频方法。
  • 网站开发的国内外研究现状微信网站设计模板下载
  • 佛山网站建设专业东阳网站建设软件开发
  • BLE芯片跳频算法设计
  • 硅基计划6.0 JavaEE 贰 多线程八股文