Auto.js 9版本 OCR 文字识别

本文介绍如何使用Auto.js Pro的OCR插件进行图文识别,包括创建OCR对象、指定识别模型、捕获屏幕图像及文字识别流程。通过实例演示了从屏幕截取特定区域图像并快速识别其中的文字。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

// 创建OCR对象,需要先在Auto.js Pro的插件商店中下载官方OCR插件。
let ocr = $ocr.create({
    models: 'slim', // 指定精度相对低但速度更快的模型,若不指定则为default模型,精度高一点但速度慢一点
});
requestScreenCapture(); 
let capture =captureScreen();
    capture=images.clip(capture,0,0,300,300)
//let capture = images.read("/storage/emulated/0/脚本/Aj图片/1659883660257.jpg");
// 检测截图文字并计算检测时间,首次检测的耗时比较长
// 检测时间取决于图片大小、内容、文字数量
// 可通过调整$ocr.create()的线程、CPU模式等参数调整检测效率
let start = Date.now();
let result = ocr.detect(capture);
let end = Date.now();
console.log(result[0].text);
sleep(1000)
capture.recycle()
toastLog("毫秒"+(end - start));
ocr.release();
### 使用 Auto.js 与百度 OCR 进行集成 为了实现 Auto.js 和百度 OCR 的集成,可以按照如下方法操作。此过程涉及获取百度 OCR API 接口密钥、安装必要的依赖项以及编写脚本来调用 OCR 功能。 #### 获取百度 OCR API 密钥 前往百度 AI 开放平台注册账号并创建应用以获得访问令牌。该令牌用于后续请求中的身份验证[^1]。 #### 安装所需环境 确保已安装最新版本Auto.js Pro 或者适合开发需求的其他版本。对于需要使用网络功能的情况,请确认设备能够正常上网以便于发送 HTTP 请求给百度服务器。 #### 编写 JavaScript 脚本 下面是一个简单的例子来展示如何利用 Auto.js 发送图片至百度 OCR 并解析返回的结果: ```javascript // 加载http模块 var http = require('http'); function getAccessToken(apiKey, secretKey){ var url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + apiKey +'&client_secret='+secretKey; return new Promise((resolve,reject)=>{ http.get(url,(res)=>{ let data = ''; res.on('data',(chunk)=>{data+=chunk}); res.on('end',()=>{ try{ resolve(JSON.parse(data).access_token); }catch(e){reject(e)} }); }).on("error",(err)=>{console.log(err)}); }) } async function ocrImage(imagePath, accessToken){ const base64Img = files.readBytes(imagePath).toString('base64'); await postOcrRequest(base64Img,accessToken) .then(response => console.log(`OCR Result:${JSON.stringify(response)}`)) .catch(error=>console.error(error)); } function postOcrRequest(base64String, token){ var options={ hostname:'aip.baidubce.com', path:'/rest/2.0/ocr/v1/general_basic?access_token='+token, method:'POST', headers:{ 'Content-Type':'application/x-www-form-urlencoded' } }; return new Promise((resolve,reject)=>{ var req=http.request(options,function(res){ let body=''; res.setEncoding('utf8'); res.on('data', chunk =>body += chunk ); res.on('end', ()=>{ try { resolve(JSON.parse(body)); } catch (e) { reject(e);} }); }); req.write('image='+encodeURIComponent(base64String)); req.end(); req.on('error', err => reject(err)); }); } ``` 上述代码实现了从本地读取一张图片文件转换成 Base64 字符串格式并通过 POST 方法提交到百度通用文字识别接口;最后打印出 JSON 形式的响应数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值