re.error: bad character range 庄-宏 at position 1238

在运行自定义的Deep Text Recognition模型时遇到字典错误,提示're.error:badcharacterrange庄-宏atposition1238'。问题源于Python正则表达式中分隔符集的排序。解决方案是将特殊字符'-'移至字典的第一个字符之后,确保分隔符集合按ASCII值升序排列。按照这个修改后,问题得到解决。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

跑一个自己魔改的deep-text-recognition-benchmark时,字典报错

re.error: bad character range 庄-宏 at position 1238

网上看了看,有这么一个解释“python 分割中文句子的时候报错:re分割字符串时,所用的分隔符集合必须按其ASCII值的大小从小到大排列”,把‘-’放到字典的第一个字符后问题解决。

Reference

【python】re.error: bad character range

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值