掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

一个爬豆瓣电影信息的轮子

引言

做了一个用于获取指定电影名称的豆瓣电影详情的 Python 包。它可以自动搜索到指定的电影,并下载其电影详情,嗯,还有高清海报哦! 项目地址:。

影片信息获取模块

说明

  • 1。 该模块根据给定的影片名称,返回来自豆瓣的影片详情; 
  • 2。 返回结果均为字典格式;
  • 3。 豆瓣详情获取时,会自动下载影片对应的高清剧照,并存储在返回的字典中(存储在 海报数据 字段); 
  • 4。 豆瓣电影详情获取时,单 IP 访问频率不能太高,访问间隔尽量控制在 2 秒以上,否则 IP 可能会被屏蔽。

安装、卸载

  1. python3 setup.py install/uninstall

快速测试

  1. >>> import movie_info

  2. >>> name = "阿凡达"

  3. >>> d = movie_info.DoubanMovieInfo(name)

  4. >>> print(d)

  5. >>> d.movie_info

使用

获取豆瓣电影详情

1。 说明:

  1. 传入的参数除了有电影名称外,还可以额外传递年份信息,以便获取更加准确的匹配结果;

  2. 豆瓣电影详情在获取时会自动下载电影相关的海报,并存储到结果字典的 海报数据 字段。

2。 获取电影功夫瑜伽的详情:

  1. import os

  2. from movie_info import DoubanMovieInfo

  3. info = DoubanMovieInfo('功夫瑜伽', 2017).movie_info

  4. for k, v in info.items():

  5.    print(k, v)

保存海报数据

  1. poster_name = os.path.join('posters', '{}_{}'.format(name, info['海报链接'].split('/')[-1]))

  2. with open(poster_name, 'wb') as f:

  3.    f.write(info['海报数据'])

  4. print('海报保存路径:{}'.format(poster_name))

3。 输出:

  1. {

  2.    "制片国家/地区": "中国大陆, 印度",

  3.    "片长": "108分钟",

  4.    "海报链接": "https://img3.doubanio.com/view/photo/raw/public/p2412371389.jpg",

  5.    "海报数据": "xxxxxxxxxx",

  6.    "IMDB编码": "tt4217392",

  7.    "电影名称": "功夫瑜伽",

  8.    "类型": "喜剧, 动作, 冒险",

  9.    "语言": "汉语普通话, 英语, 印地语, 阿拉伯语",

  10.    "主演": "成龙, 李治廷, 张艺兴, 索努*苏德, 母其弥雅, 迪莎*帕塔尼, 艾米拉*达斯特, 尚语贤, 姜雯, 张国立, 伊利亚娜*狄克鲁兹",

  11.    "编剧": "唐季礼",

  12.    "上映日期": "2017-01-28(中国大陆)",

  13.    "导演": "唐季礼",

  14.    "又名": "Kung Fu Yoga",

  15.    "来源": "豆瓣电影",

  16.    "剧情介绍": "考古学教授Jack(成龙 饰)多年没有踏出学校,校长和学生都对他添油加醋的历史半信半疑。一次授课后,一个印度女孩找到Jack,用一张千年地图吸引了Jack的目光。于是Jack和挚友的儿子李琼斯(李治廷 饰)、助教小光(张艺兴 饰)组成"寻宝小分队",为"神秘宝石"展开冒险,在迪拜和土豪飙车,在冰岛潜入神秘冰穴,在印度大战土狼,和印度贵族斗舞,动作喜剧再升级,打笑全世界。",

  17.    "电影链接": "https://movie.douban.com/subject/26182910/"

  18. }


编程派.jpg

原文来自:编程派

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 购物小票识别

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

  • 涉农贷款地址识别

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

  • 人脸四要素

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

  • 个人/企业涉诉查询

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

  • IP反查域名

    IP反查域名是通过IP查询相关联的域名信息的功能,它提供IP地址历史上绑定过的域名信息。

    IP反查域名是通过IP查询相关联的域名信息的功能,它提供IP地址历史上绑定过的域名信息。

0512-88869195
数 据 驱 动 未 来
Data Drives The Future