Skip to content
View caiyunbin's full-sized avatar
  • shanghai university
  • shanghai

Block or report caiyunbin

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse

Popular repositories Loading

  1. pandas-data-analyse pandas-data-analyse Public

    使用pandas进行数据分析的各式各样的操作,这是关于pandas学习的2000行代码,用以日后查询,其中的内容包括常用的excel功能,同时里面还加入了Python画图的库

    Python 25 10

  2. weixin weixin Public

    通过微信公众平台这一个api接口进入,爬取微信公众号文章,本人设置的sleeptime为4-6的随机数最高可以运行5个小时,爬取文章数量为3500篇,大约是三个月的数量

    Python 6

  3. dongfang dongfang Public

    本文爬取东方财富网十大股东的数据,代码也可以迁移到该网站的所有版块,另外最后也可以开启多进程,经过测试该网站没有反扒的措施,比较容易爬取

    Python 3 2

  4. zidonbaobiao zidonbaobiao Public

    本项目是用以对每一个月的汽车之家的各个类型的汽车在该论坛的论坛帖子数量总数、精品帖子总数、帖子获取的时间,帖子的发布者,帖子的原始URL,帖子的独一无二的id进行抓取,而后使用pandas进行清洗,产生上一个月和本月的数据报表,用以对汽车广告战略投放情况进行分析

    Python 3

  5. tf-idf-qichezhijia tf-idf-qichezhijia Public

    这个库主要包含三大板块:第一:爬取汽车之家论坛帖子,并且破解字体反爬,获得文本内容;第二:可以对excel文件按照月份进行文件分隔;第三按月对语料进行tf-idf算法的运算,备选文件中也有产生词云的功能

    3

  6. weiboyuliaochuli weiboyuliaochuli Public

    本库首先使用selenium对微博起亚的官方微博进行爬虫,形成CSV格式的文件,而后对其中的内容进行车型筛选,获取相应的数据文件

    Python 2