Python爬虫爬取有道实现翻译功能

程序员文章站 2024-01-05 18:32:40

准备首先安装爬虫urllib库pip install urllib获取有道翻译的链接url需要发送的参数在form data里示例import urllib.requestimport urllib....

准备

首先安装爬虫urllib库

pip install urllib

获取有道翻译的链接url

Python爬虫爬取有道实现翻译功能

需要发送的参数在form data里

Python爬虫爬取有道实现翻译功能

示例

import urllib.request
import urllib.parse

url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love python'
data['from'] = 'auto'
data['to'] = 'auto'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16057996372935'
data['sign'] = '0965172abb459f8c7a791df4184bf51c'
data['lts'] = '1605799637293'
data['bv'] = 'f7d97c24a497388db1420108e6c3537b'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'fy_by_realtlme'
data = urllib.parse.urlencode(data).encode('utf-8')
response = urllib.request.urlopen(url,data)
html = response.read().decode('utf-8')
print(html)

运行会出现50的错误，这里需要将url链接的_o删除掉

Python爬虫爬取有道实现翻译功能

删除后运行成功

Python爬虫爬取有道实现翻译功能

但是这个结果看起来还是太复杂，需要在进行优化

导入json，然后转换成字典进行过滤

import urllib.request
import urllib.parse
import json

url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love python'
data['from'] = 'auto'
data['to'] = 'auto'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16057996372935'
data['sign'] = '0965172abb459f8c7a791df4184bf51c'
data['lts'] = '1605799637293'
data['bv'] = 'f7d97c24a497388db1420108e6c3537b'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'fy_by_realtlme'
data = urllib.parse.urlencode(data).encode('utf-8')
response = urllib.request.urlopen(url,data)
html = response.read().decode('utf-8')

req = json.loads(html)
result = req['translateresult'][0][0]['tgt']
print(result)

Python爬虫爬取有道实现翻译功能
但是这个程序只能翻译一个单词，用完就废了。于是我在进行优化

import urllib.request
import urllib.parse
import json

def translate():
  centens = input('输入要翻译的语句:')
  url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
  head = {}#增加请求头，防反爬虫
  head['user-agent'] = 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/86.0.4240.198 safari/537.36'
  data = {}#带上from data的数据进行请求
  data['i'] = centens
  data['from'] = 'auto'
  data['to'] = 'auto'
  data['smartresult'] = 'dict'
  data['client'] = 'fanyideskweb'
  data['salt'] = '16057996372935'
  data['sign'] = '0965172abb459f8c7a791df4184bf51c'
  data['lts'] = '1605799637293'
  data['bv'] = 'f7d97c24a497388db1420108e6c3537b'
  data['doctype'] = 'json'
  data['version'] = '2.1'
  data['keyfrom'] = 'fanyi.web'
  data['action'] = 'fy_by_realtlme'
  data = urllib.parse.urlencode(data).encode('utf-8')
  req = urllib.request.request(url,data,head)
  response = urllib.request.urlopen(req)
  html = response.read().decode('utf-8')
  req = json.loads(html)
  result = req['translateresult'][0][0]['tgt']
  # print(f'中英互译的结果：{result}')
  return result
t = translate()
print(f'中英互译的结果：{t}')

优化完成，效果还行。

Python爬虫爬取有道实现翻译功能

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

相关标签： Python 爬虫翻译功能

上一篇： AJ最受欢迎的球鞋品牌,AJ11凭什么战胜AJ1成为头牌？

下一篇：大数据联姻“互联网+”驱动绿色变革

Python爬虫爬取有道实现翻译功能

Python3爬虫爬取英雄联盟高清桌面壁纸功能示例【基于Scrapy框架】

Python爬虫爬取有道实现翻译功能

通俗易懂的分析如何用Python实现一只小爬虫，爬取拉勾网的职位信息

Python爬虫实现爬取京东手机页面的图片(实例代码)

python爬虫学习---爬取微软必应翻译（中英互译）

Python爬虫爬验证码实现功能详解

Python爬虫爬取美剧网站的实现代码

Python实现爬取马云的微博功能示例

Python实现的爬取百度贴吧图片功能完整示例

Python实现爬取知乎神回复简单爬虫代码分享