自动化批量数据处理工具
| 文本操作类 | |
|---|---|
| 行去重 | 去除重复行 |
| url头部http/https协议去除 | 去除每行头部的http或https协议头 |
| url头部http协议增加 | 根据端口向无协议头的行添加http或https协议 |
| 行尾符号去除 | 行尾去除指定字符串 |
| 行尾符号增加 | 行尾增加指定字符串 |
| 行首符号增加 | 行首增加指定字符串 |
| 行首符号去除 | 行首去除指定字符串 |
| 去掉一层子域名 | 每行自动判断是否去除一层子域名 |
| 行尾添加默认端口号 | 每行域名或ip结尾自动判断是否添加默认端口(80、443) |
| 每个字符前插入指定字符串 | 每个字符前添加指定字符串 |
| 每个字符后插入指定字符串 | 每个字符后添加指定字符串 |
| 每行指定位置插入指定字符串 | 每行指定位置添加指定字符串(0为行首) |
| 去除所有端口号 | 去除每行存在的端口号 |
| 提取所有端口号 | 提取每行的端口号并排序,结果以逗号分隔 |
| 进行ASCII编码转换 | 进行ASCII编码 |
| 逗号转为换行 | 替换所有逗号为换行 |
| 剔除换行 | 去掉所有换行字符 |
| 剔除空格 | 去掉所有空格字符 |
| 文本筛选类 | |
| 去除指定字符串所在行 | 去除掉存在指定字符串的行 |
| 提取指定字符串所在行 | 提取出存在指定字符串的行 |
| 去除多个指定字符串所在行 | 以所选文件为列表去除字符串所在行 |
| 提取多个指定字符串所在行 | 以所选文件为列表提取字符串所在行 |
| 去除无效行 | 剔除无效行(空行、只有空格行) |
| 信息提取类 | |
| 提取完整有效资产(有协议有端口) | 提取每行匹配到的完整资产 |
| 提取资产的域名部分(无协议无端口) | 提取每行匹配到的资产域名或ip |
| 提取每行前n个字符 | 提取每行前n个字符 |
| 提取两文件相同行 | 提取选中的两个文件的相同行 |
| 提取根域名 | 提取每行资产的根域名(由于未做输入判断,输出可能不准) |
| 结果处理类 | |
| fscan提取有效结果 | 目前仅提取+所在行 |
| hackbrowser转换Cookie为可导入格式 | 将hb导出的cookie转换为可直接导入CookieEditor的格式 |
| 棱洞去除干扰行 | 目前仅去除403、404、无指纹行 |
- 直接源码运行(启动速度较快)
pip install -r requirements.txt
python3 main.py
- 运行exe(启动速度较慢)
