AI自动生成数据
文章目录
- 概要
- 案例
- 生成简单的文本数据
概要
合成数据是人工生成的数据而不是从现实世界事件中收集的数据。它用于模拟真实数据,而不会泄露隐私或遇到现实世界的限制
安装依赖:pip install langchain_experimental
合成数据的优势:
- 1.隐私和安全:没有真实的个人数据面临泄露风险
- 2.数据增强:扩展机器学习的数据集
- 3.灵活性:创建特定或罕见的场景
- 4.成本效益:通常比现实世界数据收集更便宜
- 5.监管合规:有助于应对严格的数据保护法律。
- 6.模型鲁棒性:可以带来更好的泛化AI模型
- 7.快速原型设计:无需真实数据即可快速测试
- 8.控制实验:模拟特定条件。
- 9.数据访问:当真实数据不可用时的替代方案
案例
生成简单的文本数据
使用create_data_generation_chain方法来生成数据,提供一些关键字就能生成简单的数据
import os
from langchain_community.chat_models import ChatZhipuAI
from langchain_experimental.synthetic_data import create_data_generation_chain
# 设置智普 AI 的 API 密钥
os.environ["ZHIPUAI_API_KEY"] = "5eb20f--dKxlr"
# 初始化智普 AI 模型
llm = ChatZhipuAI()
# 创建AI自动生成文本的链
chain = create_data_generation_chain(llm)
rest = chain.invoke(
{
"fields": {"颜色": ['蓝色', '黄色']},
"preferences": {"style": "让它像诗歌一样。"}
}
)
print(rest)
结果:
E:\learn_work_spaces\PythonProject1\.venv\Scripts\python.exe E:\learn_work_spaces\PythonProject1\AI自动生成数据\demo1.py
{'fields': {'颜色': ['蓝色', '黄色']}, 'preferences': {'style': '让它像诗歌一样。'}, 'text': '在遥远的天际,蓝色与黄色交织,如诗篇中描绘的梦幻画卷,绘出了晨曦与黄昏的绚丽交响曲。'}
进程已结束,退出代码为 0