当前位置：首页 > news >正文

【实战教程】React Native项目集成Google ML Kit实现离线水表OCR识别

news 2025/10/30 23:20:21

前言

在这里插入图片描述

在移动应用开发中，OCR（光学字符识别）技术广泛应用于各类场景。本文将详细介绍如何在React Native项目中集成Google ML Kit，实现离线水表数字识别功能。全程使用TypeScript，并针对React Native 0.74版本进行适配，解决版本兼容性问题。

技术栈

React Native: v0.74
TypeScript/TSX
Google ML Kit
React Native Image Picker
Native Base UI组件库

1. 安装必要依赖

首先，需要安装相关依赖包：

# 安装ML Kit文本识别包
yarn add @react-native-ml-kit/text-recognition# 安装文件处理包（用于图像处理）
yarn add react-native-fs

2. Android项目配置

2.1 修改build.gradle

打开android/app/build.gradle，添加以下配置：

android {defaultConfig {// 其他配置...// ML Kit配置missingDimensionStrategy 'react-native-camera', 'general'}packagingOptions {pickFirst '**/*.so'}
}dependencies {// 其他依赖...// 添加离线文本识别模型implementation 'com.google.mlkit:text-recognition:16.0.0'
}

2.2 配置AndroidManifest.xml

确保在AndroidManifest.xml中添加相机权限：

<manifest ... ><uses-permission android:name="android.permission.CAMERA" /><uses-feature android:name="android.hardware.camera" android:required="false" /><uses-feature android:name="android.hardware.camera.autofocus" android:required="false" /><!-- 其他配置... -->
</manifest>

3. 核心代码实现

3.1 导入相关模块

// OcrDemo.tsx
import React, { useState, useEffect } from 'react';
import {VStack, Button, Image, Text, Box, Spinner, HStack, Icon, useToast
} from 'native-base';
import MaterialCommunityIcons from 'react-native-vector-icons/MaterialCommunityIcons';
import { launchCamera, launchImageLibrary } from 'react-native-image-picker';
import { Platform, PermissionsAndroid } from 'react-native';
// 关键导入：ML Kit文本识别
import TextRecognition from '@react-native-ml-kit/text-recognition';

3.2 相机权限请求函数

// 请求相机权限
const requestCameraPermission = async () => {if (Platform.OS === 'android') {try {const granted = await PermissionsAndroid.request(PermissionsAndroid.PERMISSIONS.CAMERA,{title: "需要相机权限",message: "应用需要使用您的相机以拍摄水表照片",buttonNeutral: "稍后询问",buttonNegative: "取消",buttonPositive: "确定"});return granted === PermissionsAndroid.RESULTS.GRANTED;} catch (err) {console.warn(err);return false;}}return true;
};

3.3 OCR识别核心函数

// 使用ML Kit进行OCR识别
const performOcrRecognition = async (imagePath: string) => {try {console.log('开始OCR识别，图像路径:', imagePath);// 处理图像路径，确保使用file:// URI格式let correctPath = imagePath;if (Platform.OS === 'android' && !imagePath.startsWith('file://')) {correctPath = `file://${imagePath}`;}console.log('使用的图像路径:', correctPath);// 调用TextRecognition，使用离线模式const result = await TextRecognition.recognize(correctPath);console.log('OCR结果:', result);// 处理OCR结果，提取数字let meterReading = extractMeterReading(result);return meterReading;} catch (error) {console.error('OCR处理错误:', error);throw error;}
};

3.4 提取水表读数函数

// 提取水表读数
const extractMeterReading = (ocrResult: any) => {// 从OCR结果中提取所有数字序列let allDigitSequences: string[] = [];// 检查结果是否有效if (!ocrResult || !ocrResult.blocks || !Array.isArray(ocrResult.blocks)) {console.log('OCR结果无效或没有文本块');return '';}// 遍历识别到的所有文本块ocrResult.blocks.forEach((block: any) => {if (block.lines && Array.isArray(block.lines)) {// 遍历每个块中的每一行block.lines.forEach((line: any) => {if (line && line.text) {// 获取这一行的完整文本const lineText = line.text;// 使用正则表达式提取连续的数字序列（可能包含小数点）const digitRegex = /\d+(\.\d+)?/g;const matches = lineText.match(digitRegex);if (matches) {allDigitSequences = [...allDigitSequences, ...matches];}}});}});console.log('提取的数字序列:', allDigitSequences);// 如果找到了数字序列，尝试确定哪一个是水表读数if (allDigitSequences.length > 0) {// 筛选策略：选择符合水表读数特征的数字// 水表读数通常是5-8位数字，可能带小数点const potentialReadings = allDigitSequences.filter(seq => {// 检查是否符合水表读数的格式（例如：5-8位数字，可能有1位小数）return /^\d{5,8}(\.\d{1})?$/.test(seq);});// 如果有符合条件的读数，返回第一个if (potentialReadings.length > 0) {return potentialReadings[0];}// 如果没有符合特定条件的，就返回最长的数字序列return allDigitSequences.sort((a, b) => b.length - a.length)[0];}// 如果没有找到任何数字序列，返回空字符串return '';
};

3.5 处理识别结果

当识别出多个可能结果时，让用户选择正确读数：

// 添加状态存储多个可能的读数
const [potentialReadings, setPotentialReadings] = useState<string[]>([]);
const [selectedReadingIndex, setSelectedReadingIndex] = useState<number>(-1);// 处理识别结果
const handleRecognizeResult = async (result: any) => {// 提取所有可能的水表读数const allDigits = extractAllDigitSequences(result);// 根据特征筛选可能的水表读数（5-8位数字等）const candidates = filterPotentialReadings(allDigits);if (candidates.length === 0) {// 没有找到符合条件的读数toast.show({title: "未识别到读数",description: "请尝试重新拍摄清晰的水表照片",status: "warning"});return;} else if (candidates.length === 1) {// 只有一个结果，直接使用setRecognizedText(candidates[0]);} else {// 多个可能结果，展示给用户选择setPotentialReadings(candidates);}
};

3.6 用户选择UI组件

// 用户选择UI
{potentialReadings.length > 0 && (<VStack space={3} width="90%" mt={4}><Text fontSize="md" fontWeight="medium">检测到多个可能的读数，请选择正确的：</Text>{potentialReadings.map((reading, index) => (<Buttonkey={index}variant={selectedReadingIndex === index ? "solid" : "outline"}colorScheme="orange"onPress={() => {setSelectedReadingIndex(index);setRecognizedText(reading);}}>{reading}</Button>))}</VStack>
)}

4. 关键问题与解决方案

4.1 ML Kit模块无法识别问题

问题：导入后TextRecognition报undefined错误

解决方案：

// 正确的导入方式
import TextRecognition from '@react-native-ml-kit/text-recognition';
// 错误的导入方式
// import { TextRecognition } from '@react-native-ml-kit/text-recognition';

4.2 图片路径格式问题

问题：Android中图片路径需要以"file://"开头

解决方案：

// 处理图像路径，确保使用file:// URI格式
let correctPath = imagePath;
if (Platform.OS === 'android' && !imagePath.startsWith('file://')) {correctPath = `file://${imagePath}`;
}

4.3 多结果处理

问题：水表上存在多个数字区域导致识别混乱

解决方案：

// 筛选策略：选择符合水表读数特征的数字
const potentialReadings = allDigitSequences.filter(seq => {// 水表读数通常是5-8位数字，可能有1位小数return /^\d{5,8}(\.\d{1})?$/.test(seq);
});

5. 完整集成效果

通过以上步骤，我们成功实现了：

Google ML Kit的离线OCR识别功能集成
相机拍照和相册选择功能
水表读数的智能提取与筛选
多结果的用户选择机制

此解决方案完全支持离线使用，无需网络连接即可工作。

在这里插入图片描述

总结

本文详细介绍了在React Native项目中集成Google ML Kit实现水表OCR识别的完整流程，包括环境配置、核心代码实现和关键问题解决方案。希望对大家有所帮助！

如有任何问题或建议，欢迎在评论区留言交流！

查看全文

http://www.dtcms.com/a/172516.html

unity TMP字体使用出现乱码方框

【QT】QT中的软键盘设计

Java开发者面试实录：微服务架构与Spring Cloud的应用

Java面试场景分析：从音视频到安全与风控的技术探讨

查看并升级Docker里面Jenkins的Java17到21版本

suna工具调用可视化界面实现原理分析（二）

数据资本化：解锁数字资产价值的证券化与质押融资之路

uniapp 云开发全集云开发的概念

了解巴纳姆效应

Redis从入门到实战——实战篇（下）

RViz（机器人可视化工具）的配置文件（moveitcpp）

spring中spring-boot-configuration-processor的使用

AI图片修复工具，一键操作，图片更清晰！

gcc/g++用法摘记

14.网络钓鱼实战

2025 年最新树莓派 Pico 连接 OLED 显示字模汉字详细教程

飞致云开源社区月度动态报告（2025年4月）

轻松养生：让健康融入生活

react路由使用方法

【Python】GIS及点云处理十讲

【PostgreSQL数据分析实战：从数据清洗到可视化全流程】5.3 相关性分析（PEARSON/SPEARMAN相关系数）

Day11 训练

Python项目源码57：数据格式转换工具1.0（csv+json+excel+sqlite3）

比较两种判断相同二叉树的方法：递归与遍历序列对比

《哪吒面经》4万字102道Java多线程经典面试题

VTK 交互类介绍

【AI入门】Cherry入门1：Cherry Studio的安装及配置

精益数据分析（39/126）：SaaS与移动应用商业模式的关键要点剖析

5月5日日记

【计算机视觉】3d人体重建：PIFu/PIFuHD：高精度三维人体数字化技术指南

前言

技术栈

1. 安装必要依赖

2. Android项目配置

2.1 修改build.gradle

2.2 配置AndroidManifest.xml

3. 核心代码实现

3.1 导入相关模块

3.2 相机权限请求函数

3.3 OCR识别核心函数

3.4 提取水表读数函数

3.5 处理识别结果

3.6 用户选择UI组件

4. 关键问题与解决方案

4.1 ML Kit模块无法识别问题

4.2 图片路径格式问题

4.3 多结果处理

5. 完整集成效果

总结

相关文章：