当前位置: 首页 > news >正文

C#.NET EFCore.BulkExtensions 扩展详解

简介

EFCore.BulkExtensions 是一个开源库,用于扩展 Entity Framework Core 的功能,提供高效的批量操作(Bulk Operations)支持。原生 EF Core 在处理大量数据时性能较差(例如逐条插入 / 更新),而该库通过优化 SQL 执行,显著提升了批量操作的效率。

为什么需要 BulkExtensions?

EF Core 原生操作瓶颈

操作类型10,000 记录耗时瓶颈原因
SaveChanges5-10 秒逐条SQL + 变更跟踪
AddRange3-5 秒仍生成多条INSERT
Update8-15 秒逐条UPDATE语句

BulkExtensions 性能优势

操作类型10,000 记录耗时性能提升
BulkInsert0.5-1 秒10x
BulkUpdate1-2 秒8x
BulkDelete0.3-0.8 秒15x

核心功能

批量插入 (BulkInsert)
using (var context = new ApplicationDbContext())
{var products = new List<Product>{new Product { Name = "Product 1", Price = 9.99m },new Product { Name = "Product 2", Price = 19.99m },// 1000+ 条记录...};// 批量插入await context.BulkInsertAsync(products);
}// 基础用法
context.BulkInsert(entities);// 高级配置
context.BulkInsert(entities, options => {options.BatchSize = 2000;          // 每批数量options.InsertIfNotExists = true;   // 仅插入不存在记录options.SetOutputIdentity = true;   // 获取数据库生成IDoptions.PropertiesToExclude = new List<string> { "CreatedDate" }; // 排除属性
});
批量更新 (BulkUpdate)
using (var context = new ApplicationDbContext())
{var products = await context.Products.Where(p => p.Price < 10).ToListAsync();// 修改价格foreach (var product in products){product.Price *= 1.1m; // 提价10%}// 批量更新await context.BulkUpdateAsync(products);
}context.BulkUpdate(entities, options => {options.BatchSize = 1000;options.PropertiesToInclude = new List<string> { "Name", "Price" }; // 仅更新指定列options.UpdateByProperties = new List<string> { "ProductCode" };    // 自定义更新条件
});
批量删除 (BulkDelete)
using (var context = new ApplicationDbContext())
{// 按条件批量删除(无需先查询)await context.BulkDeleteAsync<Product>(p => p.IsDiscontinued);
}// 通过实体删除
context.BulkDelete(entities);// 通过条件删除
context.Products.Where(p => p.IsObsolete).BatchDelete();// 等效SQL: DELETE FROM Products WHERE IsObsolete = 1
批量合并 (UPSERT/BulkInsertOrUpdate)
using (var context = new ApplicationDbContext())
{var products = new List<Product>{// 新记录(ID=0)将被插入new Product { Name = "New Product", Price = 29.99m },// 已有记录(ID>0)将被更新new Product { Id = 1, Name = "Updated Product", Price = 14.99m }};// 批量合并await context.BulkMergeAsync(products);
}context.BulkInsertOrUpdate(entities, options => {options.MergeOnProperty = "UniqueCode"; // 根据此字段判断插入/更新
});
批量读取 (BulkRead)
var existingData = context.Products.Where(p => p.CategoryId == 1).BatchRead(include: p => p.Supplier); // 包含关联实体

关键技术实现

SQL 批量生成
/* BulkInsert 生成的SQL */
INSERT INTO [Products] ([Name], [Price])
VALUES 
('Product1', 10.99),
('Product2', 20.50),
... -- 2000行/批
临时表策略 (SQL Server)
CREATE TABLE #TempProducts (...) -- 创建临时表
BULK INSERT INTO #TempProducts   -- 批量插入临时表
MERGE INTO Products USING #TempProducts -- 合并操作
变更跟踪绕过
  • 直接操作数据库,跳过 EF 变更跟踪

  • 上下文不更新实体状态

性能优化

批处理配置
var optimalOptions = new BulkConfig {BatchSize = 4000,              // SQL Server 推荐值UseTempDB = true,              // SQL Server 专用SetOutputIdentity = true,      // 需要返回ID时启用CalculateStats = true,         // 获取操作统计WithHoldlock = true,           // 高并发安全PropertiesToExclude = new List<string> { "CreatedDate", "Version"   // 排除非更新字段}
};
关闭变更跟踪
context.ChangeTracker.AutoDetectChangesEnabled = false;
不同数据库优化策略
数据库推荐 BatchSize特殊配置
SQL Server2000-5000UseTempDB=true
PostgreSQL3000-7000PgBulkImport=true
MySQL1000-3000MySqlBulkCopy=true
SQLite500-1000事务分割(每批单独事务)
百万级数据导入
const int totalRecords = 1_000_000;
const int batchSize = 5000;for (int i = 0; i < totalRecords; i += batchSize)
{var batch = data.Skip(i).Take(batchSize).ToList();context.BulkInsert(batch, options => {options.BatchSize = batchSize;options.SetOutputIdentity = false;});context.DetachAllEntities(); // 防止内存膨胀
}
错误处理
try {context.BulkInsert(entities);
} 
catch (DbUpdateException ex) {// 处理唯一键冲突等错误
}

高级用法

配置批量操作选项
var options = new BulkConfig
{SetOutputIdentity = true,          // 返回自增IDBatchSize = 1000,                  // 每批处理记录数UseTempDB = true,                  // 使用临时表(提高性能)PropertiesToInclude = "Name,Price" // 仅更新指定属性
};await context.BulkUpdateAsync(products, options);
处理导航属性
var options = new BulkConfig
{CascadeOperations = true,          // 启用级联操作IncludeGraph = true                // 包含关联对象
};// 批量插入产品及其关联的评论
await context.BulkInsertAsync(productsWithReviews, options);
自定义映射
var mapping = new Dictionary<string, string>
{{ "ProductName", "Name" },         // CSV中的ProductName映射到实体的Name{ "UnitPrice", "Price" }
};await context.BulkReadAsync<Product>(csvFilePath, mapping);
事务处理
using (var transaction = await context.Database.BeginTransactionAsync())
{try{await context.BulkInsertAsync(products1);await context.BulkUpdateAsync(products2);await transaction.CommitAsync();}catch (Exception){await transaction.RollbackAsync();throw;}
}

与EF Core原生操作对比

功能EF Core 原生BulkExtensions优势说明
插入10k记录5-10秒0.3-0.8秒减少网络往返
更新10k记录8-15秒1-2秒批量UPDATE语句
删除10k记录7-12秒0.2-0.5秒单条DELETE WHERE
内存消耗高 (变更跟踪)极低绕过变更跟踪
事务控制自动或显式事务默认每批独立事务避免大事务锁表
关联数据操作完善有限支持推荐用于根实体操作

最佳实践

批处理大小调优
// 动态计算批大小
int optimalBatchSize = Math.Max(1000, totalRecords / 20);
定期清理上下文
// 防止内存泄漏
context.ChangeTracker.Clear();
context.DetachAllEntities();
异步操作支持
await context.BulkInsertAsync(entities);
await context.BulkUpdateAsync(entities);
http://www.dtcms.com/a/289048.html

相关文章:

  • 【机器学习工具】Weights Biases
  • C++string类用法
  • gradle微服务依赖模版
  • OpenTelemetry学习笔记(九):Elastic 对 OTLP 的原生支持
  • 【成品设计】基于STM32的宠物检测系统
  • 状态管理与团队协作 - SRE 的核心关切
  • Flink2.0学习笔记:Table API SQL
  • Ubuntu 24.04 设置静态 IP 的方法
  • XILINX JESD204B/C IP的AXI配置
  • leetCode——1492. n的第k个因子
  • ps2025下载与安装教程(附安装包) 2025最新版photoshop安装教程
  • 进阶向:基于Python的局域网文件传输工具
  • 初识软件测试
  • Redis 详解:从入门到进阶
  • Hiredis 构建 Redis 命令实战指南
  • 基于pi/4-QPSK扩频解扩和gardner环定时同步的通信系统matlab性能仿真
  • 绝对定位 vs 浮动:CSS布局核心差异解析
  • Spring 源码阅读(二) 核心概念解析 ApplicationContext、类型转化
  • 企业安全防护:堡垒机技术解析
  • 数据结构与算法汇总
  • spring-cloud使用
  • 再谈文件-ext2文件系统
  • NISP-PTE基础实操——XSS
  • PPT科研画图插件
  • 力扣-55.跳跃游戏
  • 【C语言】内存函数介绍(上)
  • axios二次封装-单个、特定的实例的拦截器、所有实例的拦截器。
  • 【机器学习深度学习】量化与选择小模型的区别:如何理解两者的优势与局限?
  • 嵌入式硬件篇---核心板制作
  • nginx定期清理日志