当前位置: 首页 > news >正文

LangChain其它五类组件详解(1)—— 文档加载器(Document loaders)

LangChain其它五类组件详解(1)—— 文档加载器(Document loaders)

  • 前言
  • 本篇摘要
  • 15. LangChain其它五类组件详解
    • 15.1 文档加载器(Document loaders)
      • 15.1.1 文档加载概述
      • 15.1.2 加载Markdown
        • 1. 基本用法
        • 2. 保留元素
    • 参考文献

前言

本系列文章主要介绍WEB界面工具Gradio。Gradio是Hugging Face发布的简易WebUI开发框架,它基于FastAPI和svelte,可以使用机器学习模型、python函数或API开发多功能界面,并可部署人工智能模型,是当前热门的非常易于展示机器学习大语言模型LLM及扩散模型DM的WebUI框架。
本系列文章分为五部分:Gradio介绍、HuggingFace资源与工具库、Gradio基础功能实战、Gradio与大模型融合实战和Gradio高级功能实战。第一部分Gradio介绍,包括三章内容:第一章先介绍Gradio的概念,包括详细技术架构、历史、应用场景、与其他框架Gradio/NiceGui/StreamLit/Dash/PyWebIO的区别,然后详细介绍了Gradio的安装与运行,安装包括Linux/Win/Mac三类系统安装,运行包括普通方式和热重载方式;第二章介绍Gradio的4种部署方式,包括本地部署launch()、huggingface托管、FastAPI挂载和Gradio-Lite浏览器集成;第三章介绍Gradio的三种Client,包括python客户端、javascript客户端和curl客户端,方便读者对Gradio整体把握。第二部分介绍著名网站Hugging Face的各类资源和工具库,因为Gradio演示中经常用到Hugging Face的models及某些场景需要部署在spaces,包括两章内容:第四章详解三类资源models/datasets/spaces的使用,第五章实战六类工具库transformers/diffusers/datasets/PEFT/accelerate/optimum实战。第三部分是Gradio基础功能实战,进入本系列文章的核心,包括四章内容:第六章讲解Gradio库的模块架构和环境变量,第七章讲解Gradio高级抽象界面类Interface,第八章讲解Gradio底层区块类Blocks,第九章讲解补充特性Additional Features。第四部分是Gradio与大模型融合实战,包括二章内容:第十章讲解融合大模型的多模态聊天机器人组件Chatbot,第十一章讲述将LLM封装为工具的Gradio Tools。第五部分讲述LangChain,包括四章内容:第十二章讲述LangChain优势分析、学习资料及架构,第十三章讲述LangChain组件Chat models,第十四章讲述组件Tools/Toolkits,第十五章讲述其它五类主要组件:Text splitters/Document loaders/Embedding models/Vector stores/Retrievers。第六部分是使用Agent构建Gradio,包括两章内容:第十六章讲解使用langchain.agents和LangGraph构建Gradio,第十七章讲述使用transformers.agents构建Gradio。第七部分讲述Gradio其它高级功能,包括三章内容:第十八章讲述Discord Bot/Slack Bot/Website Widget部署,第十九章讲述数据科学与绘图Data Science And Plots,第二十章讲述流式传输Streaming。
本系列文章讲解细致,涵盖Gradio及相关框架的大部分组件和功能,代码均可运行并附有大量运行截图,方便读者理解并应用到开发中,Gradio一定会成为每个技术人员实现各种奇思妙想的最称手工具。

本系列文章目录如下:

  1. 《Gradio全解1——Gradio简介》
  2. 《Gradio全解1——Gradio的安装与运行》
  3. 《Gradio全解2——Gradio的3+1种部署方式实践》
  4. 《Gradio全解2——浏览器集成Gradio-Lite》
  5. 《Gradio全解3——Gradio Client:python客户端》
  6. 《Gradio全解3——Gradio Client:javascript客户端》
  7. 《Gradio全解3——Gradio Client:curl客户端》
  8. 《Gradio全解4——剖析Hugging Face:详解三类资源models/datasets/spaces》
  9. 《Gradio全解5——剖析Hugging Face:实战六类工具库transformers/diffusers/datasets/PEFT/accelerate/optimum》
  10. 《Gradio全解6——Gradio库的模块架构和环境变量》
  11. 《Gradio全解7——Interface:高级抽象界面类(上)》
  12. 《Gradio全解7——Interface:高级抽象界面类(下)》
  13. 《Gradio全解8——Blocks:底层区块类(上)》
  14. 《Gradio全解8——Blocks:底层区块类(下)》

相关文章:

  • FRP结合Nginx实现HTTPS服务穿透
  • JVM 知识点梳理
  • 【前四届会议均已完成独立出版及EI检索 | 河南大学、河南省科学院主办,多高校单位承协办】第五届信号图像处理与通信国际学术会议(ICSIPC 2025)
  • Vue 中的日期格式化实践:从原生 Date 到可视化展示!!!
  • 如何在 HTML 中创建一个有序列表和无序列表,它们的语义有何不同?
  • SpringBoot最佳实践之 - 使用AOP记录操作日志
  • 第五章 起航19 管理者的专业素养
  • 下载与快速上手 NVM:Node.js 版本管理工具
  • 机器学习——分类、回归、聚类、LASSO回归、Ridge回归(自用)
  • 深入理解 Spring Boot 应用的生命周期:从启动到关闭的全流程解析
  • 【开源项目】数字孪生沈阳CIM/BIM可视化项目——开源工程及源码
  • 1202. 【高精度练习】义务植树
  • java 数据库连接基于向驱动管理器注册第三方驱动的机制介绍,包含三种注册类型和华为高斯(GaussDB)数据库的完整连接例子
  • 算法模型从入门到起飞系列——背包问题(探索最大价值的掘金之旅)
  • Python实验:读写文本文件并添加行号
  • Centos操作系统安装及优化
  • 北京南文观点:品牌如何抢占AI 认知的 “黄金节点“
  • 【今日EDA行业分析】2025年3月21日
  • Unity后处理(Post-processing)
  • 挑战用AI替代我的工作——从抢券困境到技术突破
  • 山东鄄城发生一起交通事故,造成4人死亡、2人受伤
  • 从600名外到跻身大满贯,孙发京:走过的路成就了现在的我
  • 上海国际电影节特设“今日亚洲”单元
  • 澎湃思想周报|欧洲胜利日之思;教育监控与学生隐私权争议
  • “影像上海”中的自媒体影像特展:无论何时,影像都需要空间
  • 中山大学人类学系原系主任冯家骏逝世,享年95岁