欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

PYTHON 爬虫 必应词典翻译爬取

程序员文章站 2022-03-02 20:55:38
...

PYTHON 爬虫 必应词典翻译爬取
同时实现英译汉及汉译英
通过浏览器右击——>检查——>查找url…等内容
上代码
方法一(通过用户输入需要操作进行翻译)

import json
import requests
url="https://cn.bing.com/tlookupv3?isVertical=1&&IG=2DE380192315479AA9B845D31A4CAEC6&IID=translator.5028.2"
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'
    }
lan=int(input("汉译英 输入1;英译汉 输入2:"))
word=input("请输入要翻译的内容:")
if(lan==1):
        formdata={
            'from':'zh-Hans',
            'to':'en',
            'text':word
                    }
elif(lan==2):
      formdata={
        'from': 'en',
        'to': 'zh-Hans',
        'text': word
                }
try:
    r = requests.post(url,data=formdata,headers=headers)
    r.raise_for_status()
    r.encoding =r.apparent_encoding
    data=json.loads(r.text)
    result=data[0]['translations'][0]['normalizedTarget']
    print(result)
except Exception as e:
    print("Error", e)

方法二 自动判断英译汉还是汉译英

import json
import requests
url="https://cn.bing.com/ttranslatev3?isVertical=1&&IG=ED0206E205E2433A9D478DB419F3CC7F&IID=translator.5028.2"
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'
    }
word=input("请输入要翻译的内容").strip() #去除首尾的空格
#判断翻译为中文还是英文
#法一 判断首字母是否为英文
if 'A'<=word[0]<='Z' or 'a'<=word[0]<='z':
    to='zh-Hans'
else:
    to='en'
#法二 判断首字母是否为中文
#if '\u400'<=word[0]<='\u9fa5':
#    to='en'
#else:
#    to='zh-Hans'
formdata={
        'fromLang': 'auto-detect',
        'to':to,
        'text': word
                }
try:
    r = requests.post(url,data=formdata,headers=headers)
    r.raise_for_status()
    r.encoding =r.apparent_encoding
    data=json.loads(r.text)
    result=data[0]['translations'][0]['text']
    print(result)
except Exception as e:
    print("Error", e)

注意事项:
在查看网页的url时,在network中应搜索的是翻译的结果,这样在headers中获取到相应的url才为正确滴

相关标签: python