Journal

R爬虫提取LetPub上的期刊信息利用shiny构建期刊信息查询系统

===== 2019.3.12日更新 =====
用了几天Excel版，筛选和排序太过繁琐，查询起来也让人头疼，因此做了个shinyapp解决以上问题，此次将ui.r和server.r上传在23_journal_info文件夹中。

对于github上的网络版，配置好环境，在R中通过shiny::runGitHub("Journal","lcpmgh",subdir="23_journal_info")打开。本来想部署在shinyapps.io上，但是有中文乱码的bug，这里做了一个大幅度阉割的英文版24_journal_info_en，就看看就行，连学科分类和期刊分区的筛选都没办法实现，等有机会把数据译成全英文的，再部署完整版。

本地使用时，建议将r加入环境变量，建立bat文件，代码类似Rscript -e "library(shiny);runApp('D:/23_journal_info',launch.browser=T)"（注意server.r中默认读取github上的数据），这样只需运行bat文件，省的每次都打开R，体验上更类似于一款独立的软件。

===== 以下为原readme内容 =====
起因是想找一下优质期刊的论文看，然而查询中科院jcr分区太麻烦了，有个网站LetPub还能用，但是在我看来也不好用，看了下这个网站超级简陋，没有任何的反爬虫机制，还不如豆瓣电影，所以就写了个代码跑一下、

几个说明：

此次上传的内容包括，R爬虫脚本demo014_JournalInfo.r，以及抓取到的数据文件Journal.csv，Journa_info.xlsx，两个文件内容相同，都是LetPub全站的10235个期刊的23项信息。
文件Journal.csv是代码直接输出的结果，Journa_info.xlsx是为了方便使用，在Excel中对csv文件进行转换，然后简单美化后的结果（R直接写入Excel要调用Java，效率太低了）。
由于网站排版不是很规范，而且样本量太大，具体信息可能有误，参考时请慎重，若对某一项有疑问，可根据对应的Url核实，Url会连接到LetPub上该期刊的详情页面。
特别说明，网络爬虫很容易触犯法律，因此 本项目仅供学习交流，切勿作商业用途，由此造成的一切后果请自行承担！

另外，之前电脑刚好重装系统，于是所有的东西都需要重新配置，在此也说明下此次R爬虫的准备工作：

r和rstudio，目前r v3.5.2，rstudio v1.1.463，r3.5版不能用3.4的旧包，所有都要重装，此版本rstudio不时会有bug，重启下就行了
jdk v11.0.2，windows10专业版1809，之前1703不能装最新的jdk，这次1809又不能用之前的jdk8，另外1809的桌面新建功能卡顿，貌似目前还没有解决办法
phantomjs和chromedriver，去网上下载，加入环境变量中使用，由于此次爬虫过于简单，用phantomjs就行，并且因为不显示内容，速度比chrome要快不少
selenium server，v2.50.1，一个java的脚本，高版本的不支持phantomjs了，这个还能用
此次所用r包，都位于CRAN上，直接装

此次运行只记录了第二个函数的时间，耗时两个多小时……

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
23_journal_info		23_journal_info
Journal.csv		Journal.csv
Journal_info.xlsx		Journal_info.xlsx
README.md		README.md
demo014_JournalInfo.R		demo014_JournalInfo.R
timeconsuming.png		timeconsuming.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Journal

几个说明：

About

Uh oh!

Releases

Packages

Languages

fleame/Journal

Folders and files

Latest commit

History

Repository files navigation

Journal

几个说明：

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages