Skip to content

gh9527/Spider

 
 

Why MyData.Homes 社区

  • 个人数据蕴含巨大的价值, 未来的世界核心就是数据, 这是一个万亿级的市场. 众多的公司利用用户数据获得巨额利益, 如对用户的数据收集分析后进行定制的广告推送,收取高额广告费. 但作为生产数据的最终用户,却没能分享属于自己的数据收益.

  • 个人数据分散在各种各样的公司之间, 经常形成数据孤岛, 多维数据无法融合. 很多优秀的创业公司,被极大限制. 有算法、有创新,但缺乏合法且高效的途径访问数据.

  • MyData.Homes 社区旨在提供最全的工具帮助用户安全快捷的从数据寡头拿回自己的数据, 自由选择提供给数据需求方, 挖掘自己数据的金矿, 分享自己数据的价值.

MyDataHomes.Spider工具是什么

要想实现个人数据资产化, 如何拿回自己的数据是第一步, 一些数据寡头已经开始提供工具能让用户自由导出数据, 如谷歌公司,已经提供方式让用户下载自己的数据.

这是一个好的开始, 但还不够, 还有很多公司没有提供官方工具或者只能下载很有限的数据.

而目前市面上的数据获取工具要么数据源不全, 要么不开源不透明. 无法保证工具本身不会偷偷窃取用户的数据, 甚至用户的用户名和密码.

MyDataHomes.Spider旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。

如何使用本工具

依赖安装

  1. 安装python3和Chrome浏览器

  2. 安装与Chrome浏览器相同版本的驱动

  3. 安装依赖库 ./install_deps.sh (windows下只需pip install -r requirements.txt)

工具运行

  1. 进入 tools目录

  2. 运行 python3 main.py

  3. 在打开的窗口点击数据源按钮

  4. 弹出的浏览器输入用户密码后会自动开始爬取数据,爬取完成浏览器会自动关闭. 在对应的目录下可以查看下载下来的数据(xxx.json)

如何贡献代码

CONTRIBUTING

数据源

目前已支持数据源:

  • 淘宝
  • 京东
  • 支付宝
  • 三大运营商
  • 公积金
  • 学信网
  • 邮箱
  • 携程

后续但不限于:

  • 社保
  • 保单
  • 健康报告
  • 微信
  • 浏览器历史 ...

开发者交流

开发者论坛:http://mydata.homes

Membership

TrustMirror

TEEX.io

协议

GPL-3.0

About

You are the King of your Data, this repository provides tools help you!

Resources

License

Code of conduct

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 99.9%
  • Shell 0.1%