PYTHON 爬虫 必应词典翻译爬取
程序员文章站
2022-03-02 20:55:38
...
PYTHON 爬虫 必应词典翻译爬取
同时实现英译汉及汉译英
通过浏览器右击——>检查——>查找url…等内容
上代码
方法一(通过用户输入需要操作进行翻译)
import json
import requests
url="https://cn.bing.com/tlookupv3?isVertical=1&&IG=2DE380192315479AA9B845D31A4CAEC6&IID=translator.5028.2"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'
}
lan=int(input("汉译英 输入1;英译汉 输入2:"))
word=input("请输入要翻译的内容:")
if(lan==1):
formdata={
'from':'zh-Hans',
'to':'en',
'text':word
}
elif(lan==2):
formdata={
'from': 'en',
'to': 'zh-Hans',
'text': word
}
try:
r = requests.post(url,data=formdata,headers=headers)
r.raise_for_status()
r.encoding =r.apparent_encoding
data=json.loads(r.text)
result=data[0]['translations'][0]['normalizedTarget']
print(result)
except Exception as e:
print("Error", e)
方法二 自动判断英译汉还是汉译英
import json
import requests
url="https://cn.bing.com/ttranslatev3?isVertical=1&&IG=ED0206E205E2433A9D478DB419F3CC7F&IID=translator.5028.2"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'
}
word=input("请输入要翻译的内容").strip() #去除首尾的空格
#判断翻译为中文还是英文
#法一 判断首字母是否为英文
if 'A'<=word[0]<='Z' or 'a'<=word[0]<='z':
to='zh-Hans'
else:
to='en'
#法二 判断首字母是否为中文
#if '\u400'<=word[0]<='\u9fa5':
# to='en'
#else:
# to='zh-Hans'
formdata={
'fromLang': 'auto-detect',
'to':to,
'text': word
}
try:
r = requests.post(url,data=formdata,headers=headers)
r.raise_for_status()
r.encoding =r.apparent_encoding
data=json.loads(r.text)
result=data[0]['translations'][0]['text']
print(result)
except Exception as e:
print("Error", e)
注意事项:
在查看网页的url时,在network中应搜索的是翻译的结果,这样在headers中获取到相应的url才为正确滴
上一篇: PubMed(丁香)英汉词典爬取
下一篇: 爬虫 2