python九行代码搞定百度翻译

本文介绍如何使用Python爬虫技术爬取百度翻译的API,避免每月200万字的翻译限制。通过分析百度翻译网页,选择手机版的basetrans接口进行数据收集,详细解释了请求头设置和表单数据构造,最终实现翻译功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

笔者最近在做一个前端的翻译功能,用到了百度翻译的api,不过每月都有200万字的翻译限制。所以就开始用python爬虫来尝试爬取一下百度的翻译。    

先进入百度的翻译页面,网址 http://fanyi.baidu.com/translate。然后进入开发者模式(F12),切换成手机模式。因为PC端的web在post提交数据的时候会有2个我们不好获取的参数(其中一个是token),但是手机版的没有这2个参数,所以我们选择手机版进行所需要的数据收集。

随便输入一些东西,然后查询。可以发现开发者工具的network中,extendtrans和basetrans这两个文件都是翻译的,然后楼主测试了一下发现extendtrans是扩展翻译,主要是单词和词语的扩展翻译(如果是一个句子的活,则可能没有返回想要的内容)。而basetrans是基础翻译,句子也是可以翻译的。所以楼主这里就选择了basetrans。然后查看basetrans的headeres。

        request URL:请求的地址

  request method:请求的方式,一般常见的也就Post和Get

  user-agent:用户代理,你会发现pc和手机请求的时候这个里面的值是不一样的。而且如果你不设置的话,里面会有一个python的默认值。这个值可能会影响网站给你返回的数据。

  form data:就是我们提交的表单数据了。而参数的zh表示中文,en表示英文。(下面是百度翻译提供的语种)

语言简写名称
auto自动检测
zh中文
en英语
yue粤语
wyw文言文
jp日语
kor韩语
fra法语
spa西班牙语
th泰语
ara阿拉伯语
ru俄语
pt葡萄牙语
de德语
it意大利语
el希腊语
nl荷兰语
pl波兰语
bul保加利亚语
est爱沙尼亚语
dan丹麦语
fin芬兰语
cs捷克语
rom罗马尼亚语
slo斯洛文尼亚语
swe瑞典语
hu匈牙利语
cht繁体中文
vie越南语

 

 

然后进入basetrans的preview里查看百度翻译返回的json数据,可以发现我们需要的翻译在trans->0->dst里面,所以就有了以下的python代码。嗯,一共九行代码,搞定了百度翻译。

import requests
import json
search = input("请输入你要翻译的内容:")
url = "https://fanyi.baidu.com/basetrans"
headers={"User-Agent":"Mozilla/5.0 (iPhone; CPU iPhone OS 10_3 like Mac OS X) AppleWebKit/602.1.50 (KHTML, like Gecko) CriOS/56.0.2924.75 Mobile/14E5239e Safari/602.1"}
posData={"query":search,"from":"zh","to":"en"}
response = requests.post(url=url,data=posData,headers=headers)
json_data=json.loads(response.content.decode())
print("输入:{0} 翻译:{1}".format(search,json_data["trans"][0]["dst"]))

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值