当前位置: 首页 > news >正文

付网站建设费用 会计科目codex.wordpress.org

付网站建设费用 会计科目,codex.wordpress.org,如何免费开网店,手机参数网问题背景 Google Gemini模型可纯免费使用,且性能也相当不错,一般个人使用或研究足够。但在在国内访问,需设置代理。在Docker部署Dify时,虽然按官方文档介绍设置代理环境变量,但实测发现并不生效。我们通过研究试验解决…

问题背景

Google Gemini模型可纯免费使用,且性能也相当不错,一般个人使用或研究足够。但在在国内访问,需设置代理。在Docker部署Dify时,虽然按官方文档介绍设置代理环境变量,但实测发现并不生效。我们通过研究试验解决了这个问题,并探索了可配置化的按需走代理的方法。

说明:本文主要内容不是介绍dify本地部署的内容,可参见Dify官方部署指南。如看官有兴趣,小子可以写一个专门文章。

根因分析

先说结论

Dify中访问Gemini模型使用了Google的generativeai Python SDK,底层通过gRPC进行通信,它要求代理相关的环境变量必须使用小写形式,大写形式不生效

详细分析过程

  1. Dify官方文档说明
    Dify的官方文档中提到可以通过设置环境变量(在.env.example和.env文件中)来配置代理,但没有特别说明大小写问题。文档中通常使用的是大写形式的环境变量,如HTTP_PROXYHTTPS_PROXY

     HTTP_PROXYHTTP 代理地址,用于解决国内无法访问 OpenAI、HuggingFace 的问题。注意,若代理部署在宿主机 (例如 http://127.0.0.1:7890),此处代理地址应当和接入本地模型时一样,使用 Docker 容器内部的宿主机地址(例如 http://192.168.1.100:7890 或 http://172.17.0.1:7890)。HTTPS_PROXYHTTPS 代理地址,用于解决国内无法访问 OpenAI、HuggingFace 的问题。同上。
    
  2. Gemini模型插件实现
    Dify的Gemini模型插件使用了Google的generativeai Python SDK。

  3. 底层通信机制
    Google的generativeai SDK底层使用gRPC进行通信。根据gRPC官方文档,它支持以下几个代理相关的环境变量:

    grpc_proxy, https_proxy, http_proxy The URI of the proxy to use for HTTP CONNECT support. These variables are checked in order, and the first one that has a value is used.
    no_grpc_proxy, no_proxy A comma separated list of hostnames to connect to without using a proxy even if a proxy is set. These variables are checked in order, and the first one that has a value is used.
    
  4. 问题确认
    对比Dify文档中说明的变量是大写形式(如HTTP_PROXY),而gRPC文档中是小写形式(如http_proxy)。通过实验确认,只有小写形式的环境变量对Gemini模型生效

  5. 版本差异
    对于Dify 0.15.x版本(尚未引入插件概念的版本),Gemini模型的源代码位于主仓库中,但代理环境变量的要求相同。

解决方案

同时设置大小写环境变量

最直接的解决方法是同时设置大小写两套环境变量,确保各种组件都能正确识别代理设置。

如果在Docker容器中设置了全局代理环境变量,所有HTTP请求都会走代理,这可能会导致不必要的性能开销。

虽然可能通过no_proxy(NO_PROXY)配置,但黑名单域名多起来就比较麻烦。
也可以让http proxy server那边配置,也不是所有的proxy server都能进行配置。

我们看到,dify本身是有一个ssrf_proxy的容器服务,是使用squid支持的。至于为何dify添加了这个组件,一句话:为了安全,参见官方介绍。
我们借用这个服务,更优雅地实现按需代理。因为squid是一个非常经典的代理服务器,它支持代理链(proxy chain)和域名白名单配置。

实现步骤

确保已有可用的HTTP代理服务器(相信看官都会有,如果没有小子也提供不了)

  1. 在dify/docker/.env中配置环境变量
    变量名没有使用官方指定,因为原来处理逻辑比较绕,可以简化,另外域名变量是为了使用白名单,而不是黑名单。为何分开主机和端口配置?这个是为了适配squid(ssrf_proxy),后续说明。

    
    # public http proxy server used in ssrf_proxy service(squid), change for your ip/port
    HTTP_PROXY_SERVER_HOST = 192.168.0.1
    HTTP_PROXY_SERVER_PORT = 3128
    # domains through public http proxy, space separate(if include subdomains, domain wildcard must be begin with comma)
    DOMAINS_BY_PROXY = ".googleapis.com .google.com google.dev .openai.com .anthropic.com .github.com .githubusercontent.com .githubassets.com .youtube.com .duckduckgo.com .huggingface.co .dify.ai"
  2. 修改dify/docker/ssrf_proxy/squid.conf.template
    找到以下行(40多行的位置):

    # cache_dir ufs /var/spool/squid 100 16 256
    # upstream proxy, set to your own upstream proxy IP to avoid SSRF attacks
    # cache_peer 172.1.1.1 parent 3128 0 no-query no-digest no-netdb-exchange default 

    替换为(必须要替换在原来的这个位置,因为squid有一序列的规则,有兴趣可参见官方文档):

    # 使用squid的机制实现对指定域名及其子域名走上游代理,
    cache_peer ${HTTP_PROXY_SERVER_HOST} parent ${HTTP_PROXY_SERVER_PORT} 0 no-query no-digest no-netdb-exchange default
    acl external_domains dstdomain ${DOMAINS_BY_PROXY}
    never_direct allow external_domains
    cache_peer_access ${HTTP_PROXY_SERVER_HOST} allow external_domains
    cache_peer_access ${HTTP_PROXY_SERVER_HOST} deny all
  3. 修改dify/docker/docker-compose-template.yaml
    尽量不直接修改docker-compose.yaml,但也是可行的,看官自己选择。在api、plugin_daemon、sandbox几个服务的"environment:" 节中增加如下配置

    environment:...# setting http proxy using ssrf_proxy serviceHTTP_PROXY: ${SANDBOX_HTTP_PROXY:-http://ssrf_proxy:3128}HTTPS_PROXY: ${SANDBOX_HTTPS_PROXY:-http://ssrf_proxy:3128}# lowercase set again for google grpc and othershttp_proxy: ${SANDBOX_HTTP_PROXY:-http://ssrf_proxy:3128}https_proxy: ${SANDBOX_HTTPS_PROXY:-http://ssrf_proxy:3128}
  4. 使用工具重新生成docker-compose.yaml

    cd dify/docker
    ./generate_docker_compose
    
  5. 重建container并重启

    cd dify/docker
    docker compose down
    docker compose up -d
    
  6. 验证配置
    在Dify控制台中添加Gemini模型,测试连接是否成功。如果配置正确,应该能够成功连接到Google的Gemini API服务。可以docker logs docker-ssrf_proxy-1查看日志,出现以下日志(FIRSTUP_PARENT/)说明已经走了上游代理。

    1741518209.044 260965 172.19.0.8 TCP_TUNNEL/200 13177 CONNECT generativelanguage.googleapis.com:443 - FIRSTUP_PARENT/192.168.0.1 -

Dify的Docker网络架构简要说明

这个图表主要展示了Dify系统中的网络连接情况(可能不完全准确供参考),重点突出了以下几个方面:

  1. 用户访问流程:用户通过nginx访问系统,nginx将请求分发给api和web服务

  2. 核心服务组件

    • api:核心API服务
    • web:前端Web应用
    • worker:后台工作进程
    • plugin_daemon:插件管理服务
    • sandbox:安全的代码执行环境
  3. 代理服务

    • ssrf_proxy:基于Squid的代理服务器,
默认网络
安全代理网络
nginx
web
plugin_daemon
api
sandbox
worker
ssrf_proxy
用户
外部网络

注意事项

  1. 本方案已在Dify 1.0.0版本上验证通过,对0.15.x系列版本也适用
  2. 如果使用SSRF代理方式,确保ssrf_proxy容器能够正常访问您的代理服务器
  3. 对于不同的模型提供商,可能需要不同的代理配置,请根据实际情况调整(国内的供应供应商一般不用配置)
  4. 另外发现dify官方域名dify.ai主机也是在国外,有时访问不畅,尤其是添加工具或插件,查看插件市场时,访问缓慢,所以可以让它也走代理,配置方案参见第3点。

总结

通过正确配置代理环境变量,特别是注意使用小写形式的环境变量,可以解决在国内环境下Dify使用Gemini模型的网络连接问题。利用Dify内置的SSRF代理组件,可以实现更灵活的按需代理配置,提高系统整体性能。

参考资料

  • Dify官方文档
  • gRPC环境变量文档
  • Google Generative AI Python SDK
http://www.dtcms.com/a/454704.html

相关文章:

  • 第二十一章:调停纷争,化解干戈——Mediator的中介艺术
  • 【C++实战(79)】突破数据处理瓶颈:C++高性能计算库实战揭秘
  • 微网站的制作过程工业和信息化部政务服务平台
  • 网站建设_seo技术支持搭建网站的企业
  • 怎么提高网站权重互动平台游戏
  • 深圳网站设计专业乐云seo网站建设游戏开发
  • 大型网站开发跨境电商平台官网
  • C++ 类与对象
  • 标志设计公司网站wordpress更换回编辑器
  • 帝国小说网站模板5网站建设
  • EasyControl:Adding Efficient and flexible control for diffusion transformer
  • JAVA算法练习题day29
  • 深圳做营销网站的公司简介模板网站和定
  • dede做英文网站优化微信公众号怎么做文章推广
  • 10.2.1 TrinityCore
  • 科技公司的网站网站开发价位评估
  • 怎样优化自己的网站南宁网络技术
  • 福州网站建设哪家公司好营销策划与运营公司
  • Day56 LCD显示原理与驱动配置
  • 动易网站制作教程创建全国文明城市标语
  • 做电影网站有什么流媒体好创建全国文明城市活动
  • 餐饮o2o 网站建设wordpress mysql调整
  • 九亭做网站清河网站建设设计
  • 上海网站建设公司 翱思建站平台功能结构图
  • 品牌网网站建设做热点图现在用什么网站
  • 佛山新网站建设服务公司动漫制作专业专升本需要考高数吗
  • DVWA靶场之十三:CSP 绕过(Content Security Policy (CSP) Bypass)
  • wordpress 图站怎么才能创建一个网站
  • 做毕业设计哪个网站好建设部网站规范查询
  • 【AI论文】未睹先察:揭示语言预训练赋予大语言模型视觉先验知识的奥秘